В моих предыдущих статьях я обсуждал постановку задачи и распределение данных, стратегию моделирования и производительность модели для идентификации сельскохозяйственных культур в индийской географии.

Во время оценки модели мы также заметили, что, даже если два района находятся рядом, модель недостаточно надежна для определения культур в некоторых сценариях. Дальнейшие эксперименты привели нас к включению агроклиматических условий в качестве решающего фактора для обучения модели.

В этой статье я представляю подход к моделированию, основанный на разумном выборе учебных регионов на основе агроклиматических зон, которые могут изучить целый штат Бихар (Бихар — аграрный штат в Восточной Индии, состоящий из 38 округов).

Что такое агроклиматическая зона?

Агроклиматические условия в основном относятся к типам почв, осадкам, температуре и водообеспеченности, которые влияют на растительность, а географические регионы, относящиеся к аналогичным агроклиматическим условиям, называются агроклиматическими зонами.

Агроклиматические зоны в Бихаре

На основании характеристик почвы, количества осадков, температуры и рельефа местности в Бихаре выделены четыре основные агроклиматические зоны.Дополнительную информацию можно найти здесь и здесь.
1. Зона-1:Северо-западная аллювиальная равнина
2. Зона-2:Северо-восточная аллювиальная равнина
3. Зона-3 ( а):Юго-восточная аллювиальная равнина
4. Зона-3 (б):Юго-западная аллювиальная равнина

Набор данных

Мы рассматриваем в общей сложности 25 районов Бихара на 2019, 2020 и 2021 годы. Мы рассматриваем только две культуры: пшеницу и кукурузу в качестве основных культур для этого эксперимента. В некоторых случаях мы не могли получить данные из-за недоступности помеченного растра/облачной погоды/недостаточного количества данных для создания последовательности.

Даты посева и сбора урожая: на основе имеющейся в компании информации, среднее время посева и сбора урожая наблюдается для пшеницы и горчицы в регионе Бихар, а общая крайняя дата посева – 31 декабря, а дата сбора урожая – 31 декабря. 31 мая для всех случаев выбрано.

Исследовательский анализ данных

Мы проанализировали сигнатуры основных культур (пшеница и кукуруза) Бихара в 2019, 2020 и 2021 годах, и несколько графиков NDVI за эти годы показаны ниже.

Некоторые основные наблюдения:
1. Одни и те же культуры могут иметь разный характер в разных регионах.
2. В одном и том же регионе урожай может иметь разный характер в разные годы.
3. Сдвиг цикла урожая может происходить независимо от года или региона. Например, в случае района Вайшали пик приходится на 1-ю неделю февраля в 2019 году, 4-ю неделю февраля в 2020 году и 2-ю неделю марта в 2021 году.

Из-за приведенных выше наблюдений становится очень сложно заставить модель изучать образцы культур, которые могут хорошо работать в разные годы и регионы.

Выбор учебных округов

Мы постарались выбрать учебные районы Бихара таким образом, чтобы при минимальном количестве районов из каждой агроклиматической зоны мы могли охватить все варианты для полного штата Бихар. Учитывая это, в качестве учебных округов для этого эксперимента были выбраны Пурба Чампаран, Вайшали, Кхагария, Пурния, Бходжпур, Рохтас и Бхагалпур.

Эффективность модели

Модель в большинстве случаев может правильно классифицировать две рассматриваемые культуры. Показатели по районам и годам показаны ниже. Н/П представляет случаи, когда мы не получили достаточно данных или помеченных данных для обработки (последовательность см. эта ссылка). Модель показала гораздо лучшую производительность для случаев OOT и OOA, а также для случаев OOS.
Несколько замечаний по оценке модели:
1. Среднее значение F1_Score: 0,832
2. Среднее значение F1_Score_OOT_OOA: 0,764
3. Среднее значение F1_Score_OOS: 0,932

Заключение

Мы обучили модель, которая может идентифицировать основные культуры в штате Бихар со средним баллом F1 0,832. Эта модель не только хорошо работает для OOS, но мы также можем наблюдать достаточно хорошую производительность в случае OOT и OOA, которые трудно взломать. Чтобы справиться с проблемами недоступности данных, мы также работаем над созданием Ранних прогнозов, которые могут не только определять культуры с меньшим количеством дат, но и предоставлять информацию о посевных площадях после минимального периода времени от посевного сезона для лучшего планирования и прогнозирования. другие аспекты бизнеса.

Мы рады поделиться нашим прогрессом. Надеюсь, вам понравилось читать это обновление :).