В этой статье мы в основном проведем анализ метеорологических данных. Одним из типов данных, которые легче найти в сети, являются метеорологические данные. Многие сайты предоставляют исторические данные по многим метеорологическим параметрам, таким как давление, температура, влажность, ветер, видимость и т. д. В этой статье мы будем работать с одним из таких наборов данных.

В наборе данных есть почасовая температура, зарегистрированная за последние 10 лет, начиная с 01.04.2006 по 09.09.2016. Он соответствует Финляндии, стране в Северной Европе.

Наша главная цель — выполнить анализ данных в этом наборе метеорологических данных и преобразовать нашу необработанную информацию в знания. Мы будем выполнять такие задачи, как очистка данных, выполнять анализ и проверку данной гипотезы, а затем сообщать о заключении.

Нулевой гипотезой является Ho : "Указывает ли кажущаяся температура и влажность, сравниваемые ежемесячно за 10 лет, данные увеличиваются из-за глобального потепления"

Ho означает, что нам нужно найти, увеличилась ли средняя кажущаяся температура за месяц, скажем, апрель, начиная с 2006 по 2016 год, и средняя влажность за тот же период или нет.

Давайте начнем,

  1. Импортируйте все необходимые библиотеки, например Pandas, Seaborn, Matplotlib, Numpy, в нашу записную книжку Jupyter.

2. Прочитайте файл CSV, используя встроенную функцию Pandas read_csv().

Теперь давайте посмотрим на наш набор данных —

Информация о наборе данных, проверка типа данных всех столбцов —

Тип данных столбцов набора данных

3. Теперь нам нужно нормализовать наш набор данных. Преобразование столбца «Форматированная дата» в «Дата-время».

Давайте теперь просмотрим наш набор данных -

4. Повторная выборка нашего набора данных —

Набор данных с повторной выборкой

Здесь M означает: Начало месяца Мы усредняем кажущуюся температуру и влажность, используя mean( ) функция.

5. Давайте теперь построим график для наших данных, используя функцию Matplotlibplt(). На графике будет отображаться изменение кажущейся температуры и влажности во времени.

График

График

Наблюдение —

Из приведенного выше графика легко увидеть, что влажность в эти годы оставалась почти постоянной. Кроме того, средняя кажущаяся температура почти одинакова.

6. Теперь, чтобы получить данные за конкретный месяц, скажем, апрель, затем -

7. Теперь построим график изменения кажущейся температуры и влажности в апреле каждого года:

График

Наблюдение:

Из графика видно, что кажущаяся температура увеличилась в 2009 г., снизилась в 2010 г., незначительно увеличилась в 2011 г. и значительно снизилась в 2015 г., тогда как в средней влажности нет заметных изменений.

Вывод -

Увеличение кажущейся температуры и влажности за 10 лет указывает на увеличение из-за глобального потепления.

Ссылка на набор данных — https://github.com/sandeepkumar06/Performing-Analysis-Of-Meteorological-Data