В этой статье мы в основном проведем анализ метеорологических данных. Одним из типов данных, которые легче найти в сети, являются метеорологические данные. Многие сайты предоставляют исторические данные по многим метеорологическим параметрам, таким как давление, температура, влажность, ветер, видимость и т. д. В этой статье мы будем работать с одним из таких наборов данных.
В наборе данных есть почасовая температура, зарегистрированная за последние 10 лет, начиная с 01.04.2006 по 09.09.2016. Он соответствует Финляндии, стране в Северной Европе.
Наша главная цель — выполнить анализ данных в этом наборе метеорологических данных и преобразовать нашу необработанную информацию в знания. Мы будем выполнять такие задачи, как очистка данных, выполнять анализ и проверку данной гипотезы, а затем сообщать о заключении.
Нулевой гипотезой является Ho : "Указывает ли кажущаяся температура и влажность, сравниваемые ежемесячно за 10 лет, данные увеличиваются из-за глобального потепления"
Ho означает, что нам нужно найти, увеличилась ли средняя кажущаяся температура за месяц, скажем, апрель, начиная с 2006 по 2016 год, и средняя влажность за тот же период или нет.
Давайте начнем,
- Импортируйте все необходимые библиотеки, например Pandas, Seaborn, Matplotlib, Numpy, в нашу записную книжку Jupyter.
2. Прочитайте файл CSV, используя встроенную функцию Pandas read_csv().
Теперь давайте посмотрим на наш набор данных —
Информация о наборе данных, проверка типа данных всех столбцов —
Тип данных столбцов набора данных
3. Теперь нам нужно нормализовать наш набор данных. Преобразование столбца «Форматированная дата» в «Дата-время».
Давайте теперь просмотрим наш набор данных -
4. Повторная выборка нашего набора данных —
Набор данных с повторной выборкой
Здесь “M” означает: Начало месяца Мы усредняем кажущуюся температуру и влажность, используя mean( ) функция.
5. Давайте теперь построим график для наших данных, используя функцию Matplotlibplt(). На графике будет отображаться изменение кажущейся температуры и влажности во времени.
График
График
Наблюдение —
Из приведенного выше графика легко увидеть, что влажность в эти годы оставалась почти постоянной. Кроме того, средняя кажущаяся температура почти одинакова.
6. Теперь, чтобы получить данные за конкретный месяц, скажем, апрель, затем -
7. Теперь построим график изменения кажущейся температуры и влажности в апреле каждого года:
График
Наблюдение:
Из графика видно, что кажущаяся температура увеличилась в 2009 г., снизилась в 2010 г., незначительно увеличилась в 2011 г. и значительно снизилась в 2015 г., тогда как в средней влажности нет заметных изменений.
Вывод -
Увеличение кажущейся температуры и влажности за 10 лет указывает на увеличение из-за глобального потепления.
Ссылка на набор данных — https://github.com/sandeepkumar06/Performing-Analysis-Of-Meteorological-Data