Простое руководство по использованию onsr для программного получения данных из Управления национальной статистики Великобритании.

На прошлой неделе я вел курс R, и меня спросили о том, как получить данные в R от Управления национальной статистики (ONS). Веб-поиск не дал простых и понятных примеров для тех, кто начинал с R, поэтому я пообещал демонстрацию, чтобы люди могли начать.

У Управления национальной статистики есть бета-API (который все еще находится в разработке), который позволяет вам получать доступ к данным через язык программирования. Можно сначала отфильтровать наборы данных, хотя в этом кратком руководстве основное внимание будет уделено тому, как исследовать доступные в настоящее время наборы данных и как получить полный набор данных в R.

Это отличный источник данных, который невероятно полезен для компаний, работающих в Великобритании. В соответствии с условиями Открытой правительственной лицензии и Рамочной программы лицензирования правительства Великобритании материалы ONS могут свободно использоваться как в коммерческих, так и в частных целях.

Я потратил немного времени на изучение доступных оболочек и нашел onsr от Kostas Vasilopoulos на CRAN. Я включил ссылку на документацию пакета в конце этого пошагового руководства.

Если вы пользователь Python, есть аналогичный способ решения этой проблемы — использование PyONS.

Демонстрация получения данных из Управления национальной статистики в R с использованием их бета-API.

Все, что ниже, можно вставить прямо в сценарий R, чтобы вы могли запустить его и отредактировать для себя!

Сначала установите onsr и загрузите его:

library(onsr)

Чтобы получить всю информацию о доступных наборах данных:

datasets <- ons_datasets()

После того, как вы выбрали набор данных, вам понадобится его идентификатор.

Думал посмотреть на самочувствие. Чтобы получить еще больше информации о конкретном наборе данных и начать изучать его, используйте это, чтобы открыть веб-страницу качества и методологии:

ons_browse_qmi(id = “wellbeing-local-authority”)

Теперь то, что вы пришли сюда! Чтобы загрузить данные:

fullWellbeingDataset <- ons_get(id = “wellbeing-local-authority”)

Когда вы используете ons_get(), по умолчанию используется самый последний набор данных. Вы должны сохранить детали href, номер версии и редакцию, чтобы позже отслеживать изменения в коде:

wellbeingLatestHref <- ons_latest_href(id = “wellbeing-local-authority”)
wellbeingLatestVersion <- ons_latest_version(id = “wellbeing-local-authority”)
wellbeingLatestEdition <- ons_latest_edition(id = “wellbeing-local-authority”)

Тогда все, что вам нужно сделать, это проанализировать его!

Вот очень быстрый взгляд на счастье в моем ближайшем городе, Эксетере.
Я не мог удержаться от демонстрации нового (более быстрого) базового канала R, хотя мне все еще нужен dplyr для фильтрации.

library(dplyr)
regionalSummary <- 
 fullWellbeingDataset |>
 filter(!is.na(V4_3)) |>
 filter(Geography == “Exeter”) |>
 filter(MeasureOfWellbeing == “Happiness”) |>
 filter(`wellbeing-estimate`==”average-mean”)
#Sorted by year:
regionalSummary <- regionalSummary[order(regionalSummary$Time),]

Краткое содержание

Если вы уже знаете, какой набор данных вам нужен, вот 3 важные строки кода, которые вам нужны:

library(onsr)
ons_datasets() 
#Or ons_ids() — to get the id for the set you want
ons_get(id = “wellbeing-local-authority”) 
#To get the data set!

Рекомендации

Управление национальной статистики — Личное благополучие в Великобритании, ежеквартально: с апреля 2011 г. по сентябрь 2021 г. (2022, 04.07). Личное благополучие в Великобритании, ежеквартально: с апреля 2011 г. по сентябрь 2021 г.. Получено из ONS: https://www.ons.gov.uk/peoplepopulationandcommunity/wellbeing/bulletins/personalwellbeingintheukquarterly/april2011toseptember2021.

Управление национальной статистики — Лицензии. (2022, 04 26). ONS — Лицензии. Получено из ONS: https://www.ons.gov.uk/methodology/geography/licences

Качество жизни, ОНС. (2018, 09 26). Личное самочувствие в QMI Великобритании. Получено из ONS: https://www.ons.gov.uk/peoplepopulationandcommunity/wellbeing/methodologies/personalwellbeingintheukqmi

Василопулос, К. (2022, 01 21). onsr: клиент для документации API ONS. Получено из проекта CRAN R: https://cran.r-project.org/web/packages/onsr/onsr.pdf