Простое руководство по использованию onsr для программного получения данных из Управления национальной статистики Великобритании.
На прошлой неделе я вел курс R, и меня спросили о том, как получить данные в R от Управления национальной статистики (ONS). Веб-поиск не дал простых и понятных примеров для тех, кто начинал с R, поэтому я пообещал демонстрацию, чтобы люди могли начать.
У Управления национальной статистики есть бета-API (который все еще находится в разработке), который позволяет вам получать доступ к данным через язык программирования. Можно сначала отфильтровать наборы данных, хотя в этом кратком руководстве основное внимание будет уделено тому, как исследовать доступные в настоящее время наборы данных и как получить полный набор данных в R.
Это отличный источник данных, который невероятно полезен для компаний, работающих в Великобритании. В соответствии с условиями Открытой правительственной лицензии и Рамочной программы лицензирования правительства Великобритании материалы ONS могут свободно использоваться как в коммерческих, так и в частных целях.
Я потратил немного времени на изучение доступных оболочек и нашел onsr от Kostas Vasilopoulos на CRAN. Я включил ссылку на документацию пакета в конце этого пошагового руководства.
Если вы пользователь Python, есть аналогичный способ решения этой проблемы — использование PyONS.
Демонстрация получения данных из Управления национальной статистики в R с использованием их бета-API.
Все, что ниже, можно вставить прямо в сценарий R, чтобы вы могли запустить его и отредактировать для себя!
Сначала установите onsr и загрузите его:
library(onsr)
Чтобы получить всю информацию о доступных наборах данных:
datasets <- ons_datasets()
После того, как вы выбрали набор данных, вам понадобится его идентификатор.
Думал посмотреть на самочувствие. Чтобы получить еще больше информации о конкретном наборе данных и начать изучать его, используйте это, чтобы открыть веб-страницу качества и методологии:
ons_browse_qmi(id = “wellbeing-local-authority”)
Теперь то, что вы пришли сюда! Чтобы загрузить данные:
fullWellbeingDataset <- ons_get(id = “wellbeing-local-authority”)
Когда вы используете ons_get(), по умолчанию используется самый последний набор данных. Вы должны сохранить детали href, номер версии и редакцию, чтобы позже отслеживать изменения в коде:
wellbeingLatestHref <- ons_latest_href(id = “wellbeing-local-authority”) wellbeingLatestVersion <- ons_latest_version(id = “wellbeing-local-authority”) wellbeingLatestEdition <- ons_latest_edition(id = “wellbeing-local-authority”)
Тогда все, что вам нужно сделать, это проанализировать его!
Вот очень быстрый взгляд на счастье в моем ближайшем городе, Эксетере.
Я не мог удержаться от демонстрации нового (более быстрого) базового канала R, хотя мне все еще нужен dplyr для фильтрации.
library(dplyr) regionalSummary <- fullWellbeingDataset |> filter(!is.na(V4_3)) |> filter(Geography == “Exeter”) |> filter(MeasureOfWellbeing == “Happiness”) |> filter(`wellbeing-estimate`==”average-mean”) #Sorted by year: regionalSummary <- regionalSummary[order(regionalSummary$Time),]
Краткое содержание
Если вы уже знаете, какой набор данных вам нужен, вот 3 важные строки кода, которые вам нужны:
library(onsr) ons_datasets() #Or ons_ids() — to get the id for the set you want ons_get(id = “wellbeing-local-authority”) #To get the data set!
Рекомендации
Управление национальной статистики — Личное благополучие в Великобритании, ежеквартально: с апреля 2011 г. по сентябрь 2021 г. (2022, 04.07). Личное благополучие в Великобритании, ежеквартально: с апреля 2011 г. по сентябрь 2021 г.. Получено из ONS: https://www.ons.gov.uk/peoplepopulationandcommunity/wellbeing/bulletins/personalwellbeingintheukquarterly/april2011toseptember2021.
Управление национальной статистики — Лицензии. (2022, 04 26). ONS — Лицензии. Получено из ONS: https://www.ons.gov.uk/methodology/geography/licences
Качество жизни, ОНС. (2018, 09 26). Личное самочувствие в QMI Великобритании. Получено из ONS: https://www.ons.gov.uk/peoplepopulationandcommunity/wellbeing/methodologies/personalwellbeingintheukqmi
Василопулос, К. (2022, 01 21). onsr: клиент для документации API ONS. Получено из проекта CRAN R: https://cran.r-project.org/web/packages/onsr/onsr.pdf