Один из типов данных, который легче найти в сети, - это данные о погоде. Многие сайты предоставляют исторические данные по многим метеорологическим параметрам, таким как давление, температура, влажность, скорость ветра, видимость и т. Д.

Загрузите данные по указанной ссылке.

Источник данных Kaggle: https://www.kaggle.com/muthuj7/weather-dataset

В наборе данных есть почасовые записи температуры за последние 10 лет, начиная с 2006–04–01 00: 00: 00.000 +0200 до 2016–09–09 23: 00: 00.000 +0200. Это соответствует Финляндии, стране в Северной Европе.

Нулевая гипотеза H0: «Имеет ли ежемесячное сравнение видимой температуры и влажности данных за 10 лет, указывающее на повышение из-за глобального потепления»

H0 означает, что нам нужно определить, повысились ли средняя кажущаяся температура за месяц, например, апрель с 2006 по 2016 год, и средняя влажность за тот же период. Этот ежемесячный анализ необходимо проводить за все 12 месяцев за 10-летний период. Таким образом, вы в основном передискретизируете свои данные с ежечасного на ежемесячный, а затем сравниваете тот же месяц за 10-летний период. Поддержите свой анализ соответствующими визуализациями с помощью библиотеки m atplotli b и / или seaborn.

Моя цель на этой стажировке (анализа данных) - преобразовать необработанные данные в информацию, а затем преобразовать ее в знания. Мы будем проводить D очистку, нормализацию данных, визуализацию данных, выполнять анализ для проверки (данной) гипотезы и предоставления подробных сведений.

так что давайте начнем

1. Импорт необходимых библиотек:

2. Чтобы загрузить загруженные данные с помощью библиотеки Python:

3.Проверка типов наборов данных:

4. Описание данных для понимания нашего набора данных:

5. Очистка данных:

6. передискретизация отформатированных данных за месячный период времени:

7. Построение данных:

построение набора данных за все месяцы.

Изменение видимой температуры и влажности со временем.

8. Ежемесячный анализ за все 12 месяцев за 10 лет.

9. Гистограмма:

10.Просмотр:

11. Заключение:

Таким образом, из этого анализа мы делаем вывод, что за 10 лет происходит либо резкое повышение температуры, либо резкое ее падение. Следовательно, мы можем сделать вывод, что глобальное потепление вызвало серьезные различия и ненадежность Что касается предсказуемости температуры, также принимая во внимание влажность, мы можем сказать, что она практически не изменилась на протяжении последних лет.

Я благодарен наставникам на https://internship.suvenconsultants.com за прекрасные формулировки проблем и предоставление многим из нас опыта стажировки в области программирования. Спасибо www.suvenconsultants.com