Прогнозирование стрессов

Физические [эмпирические] модели

Многие процессы были смоделированы биологически, химически и физически для определения различных показателей стресса растений. Фотосинтез моделируется химически с помощью модели фотосинтеза C4, устьичная проводимость оценивается с помощью модели Болла-Берри (4), и этот список можно продолжить. В модели Болла-Берри g - устьичная проводимость для диффузии CO2, An - чистая скорость ассимиляции CO2 в листьях, Ds и cs - дефицит давления пара и концентрация CO2 на поверхности листа, соответственно, Γ - точка компенсации CO2, g0 - значение g в точке компенсации света, а a1 и D0 - эмпирические коэффициенты.

g = g0 + a1An(cs- Г)/(1 + Ds/D0) (4)

Проблема с этими моделями присутствует заранее: нет способа определить все эмпирические значения, необходимые для этих моделей, без нарушения работы. Кроме того, он не масштабируется и не обязательно может быть распространен на большие площади.

Моделирование с учителем

Большой объем данных, собранных либо со спутниковых снимков, либо с БПЛА, вдохновляет на исследования, посвященные соединению методов ведения сельского хозяйства и машинного обучения. Измерения в полевых условиях, записи болезней, результаты химических и геологических испытаний обычно используются в качестве ярлыков, и были предприняты многочисленные попытки смоделировать некоторую ценность, представляющую интерес.

Работы по моделированию и прогнозированию стресса растений многочисленны и исследуют возможность засух, засоления почвы, содержания питательных веществ, содержания тяжелых металлов и других стрессов. Обычно в качестве входных данных используются гиперспектральные изображения, иногда используются разные показатели спектральной отражательной способности или несколько наложенных друг на друга полос, и самым редким является обычное изображение RGB. Различные модели также были развернуты как для классических алгоритмов машинного обучения, так и для алгоритмов глубокого обучения для получения заметных результатов с учетом нетривиальности задачи.

Широко используемая процедура описана в статье Связь между полевым измерением влажности почвы на эффективной глубине корневой зоны сахарного тростника и показателями, извлеченными из спектрального отражения оптических / тепловых полос мультиспектральных спутниковых изображений.

Фактическое содержание влаги в почве было определено для пяти точек на восемь полей с использованием гравиметрического метода, в результате чего было получено сорок точек наземных данных. Что касается исходных данных, несколько спектральных индексов, в том числе нормализованный индекс разницы растительности (NDVI) и температурный индекс растительности и засушливости (TVDI), были построены на основе спутниковых изображений Landsat 8. В качестве модели использовался PLSR. Проведенные исследования показали, что TVDI является наиболее точным для оценки влажности почвы с коэффициентом детерминации 0,63.

Пример визуализированной подобранной модели представлен на рисунке 2.

Заслуживает внимания документ Нейросетевой подход к обнаружению водно-стрессовых культур с использованием многоспектральных спутниковых изображений WorldView-2, который является одним из первых применявших многослойный персептрон для классификации почвы в условиях сильного водного стресса, превосходя предыдущие подходы, такие как логистическая регрессия. В отличие от предыдущих методов, обобщение по разным почвам и культурам.

Исследователи в статье Сравнение искусственной нейронной сети и частичных наименьших квадратов для онлайн-измерения органического углерода почвы, pH и содержания глины в видимой и ближней инфракрасной области спектра провели обширную работу по сравнению обычно используемой модели PLSR с ИНС для моделирования органических почв. содержание углерода, глинистость и pH почвы за единицу. В качестве входных данных исследователи использовали спектральные изображения в диапазоне от 371 до 2150 нм. Проблема с pH заключается в том, что эта характеристика зависит от соединений, присутствующих в почве, но не определяется напрямую. Гивен сказал, что исследования показали, что ИНС лучше работает при оценке содержания органического углерода, глины и уровней pH.

Проблема оценки водного стресса сведена к классификации в статье Моделирование водного стресса на винограднике Шираза с использованием гиперспектральной визуализации и машинного обучения. Исследователи измерили значения потенциала стволовых вод в полевых условиях и классифицировали области со значениями ниже -0,7 МПа как не подверженные нагрузкам, а области со значениями выше - как напряжения. Модель Random Forest (RF) и Extreme Gradient Boosting (XGBoost) были обучены на гиперспектральных изображениях. RF дал немного лучшую точность теста (81,7% против 80,0%). Еще одно интересное замечание касается важности длин волн, что показано на рисунке 3. Существует несколько длин волн, на которых ценный сигнал считается значимым обеими моделями.

Моделирование без учителя

Несмотря на то, что изображений и данных датчиков бесчисленное множество, маркированные данные являются ограничивающим фактором для разработки контролируемых моделей. К сожалению, нет простого способа применить неконтролируемые алгоритмы к таким приложениям.

Один неконтролируемый подход используется к задаче предварительной обработки при выборе наиболее информативных диапазонов волн. Широкий анализ главных компонент (PCA) выделяет похожие полосы, которые несут мало или совсем не содержат новой информации. В статье Раннее визуальное обнаружение полосовой ржавчины пшеницы с использованием гиперспектральной визуализации в видимом / ближнем инфракрасном диапазоне исследователи использовали PCA и алгоритм последовательных проекций (SPA), чтобы уменьшить гиперспектральный сигнал до 8 ключевых длин волн в первом случае и до 12 во втором. . Было проведено три эксперимента по обучению нейронной сети с прямой связью на каждом подмножестве выбранных длин волн и 256-волнового спектра. Как пришли к выводу исследователи, обучение модели по полному спектру не показало лучших результатов при раннем обнаружении ржавчины растений.

Другой метод, применяемый для обнаружения стресса растений, описан в статье Оценка стресса от засухи на пастбищах с помощью неконтролируемого обучения на основе аэроснимков гиперспектральных изображений VNIR. Авторы использовали симплексную максимизацию объема, вариант алгоритма матричной факторизации, чтобы идентифицировать почвы со здоровым и напряженным водным профилем с использованием различных показателей воды и растительности, включая NDVI, индекс фотохимического отражения (PRI), модифицированный индекс абсорбции и отражения хлорофилла (MCARI), и многие другие. На рисунке 4 представлен пример их результатов вместе с соответствующими регулярными изображениями RGB, снятыми БПЛА.

Методы кластеризации используются для того, чтобы отличить обычный полог от растений, обнаруживающих некоторые аномалии. В Неконтролируемой классификации насыщенных областей с использованием временного ряда изображений, полученных с помощью дистанционного зондирования, исследователи использовали алгоритм автоматической классификации временных рядов (ACTS) для кластеризации изображений NDWI таким образом, чтобы в пределах каждого типа почвенного покрова в два или три кластера, достаточно хорошо идентифицирующих области. заболачивания, засухи и земель без аномалий. Конечно, некоторая предварительная обработка задействовала NDVI, чтобы различить семь типов почвенного покрова, прежде чем кластеризовать каждый из них.

Доступные данные и продукты

Как упоминалось ранее, многочисленные исследования в области обнаружения и прогнозирования стрессов растений проводились в небольших масштабах, то есть полей площадью несколько квадратных километров или меньше. К сожалению, почти ни один из таких наборов данных не становится общедоступным.

Некоторые данные со станций мониторинга могут быть получены из Национальной сети по влажности почвы или Департамента ГЕО Технического университета Вены в отношении температуры поверхности и измерения влажности почвы. Это отличные ресурсы для картирования экстремальных стрессовых факторов воды и температуры, которыми щедро делятся с исследователями и общественностью.

Тем не менее, несколько других источников, предоставленных НАСА, не представляют собой точных данных о наземных мерах, заслуживающих проверки. Например, программа ECOSTRESS Programme предоставляет данные о суммарном испарении, полученные из собранных гиперспектральных данных. Проблема даже не в том, что это производные меры, а скорее в ограниченном разрешении и периоде пересмотра.

ISRIC - Всемирный информационный портал о почвах выпустил платформу SoilGrids250m, объединяющую многочисленные источники, касающиеся классификации почв, содержания азота и органического углерода в почве.

Нет недостатка в легко доступных мультиспектральных данных. Однако получить изображения с высоким разрешением сложнее. Лучшие изображения в свободном доступе предоставлены миссией Sentinel-2 с разрешением 10 м на пиксель. Тем не менее, даже это далеко не идеально при определении статистики для отдельной области. Как видно на рисунке 5, даже при наилучшем разрешении изображений Sentinel-2 по отдельности поля грубо пикселизируются.

Выводы

Обнаружение стресса растений вызывает растущий интерес в точном земледелии. Есть множество факторов стресса, которым могут подвергаться сельскохозяйственные культуры. Точные лабораторные тесты дают ценную информацию о состоянии растений и почв и устойчивости к суровым условиям, хотя таких данных мало, и их трудно собрать для раннего обнаружения.

Большое количество исследований было посвящено изучению методов обнаружения стресса с использованием методов дистанционного зондирования, включая флуоресцентные, гиперспектральные, мультиспектральные и тепловизионные изображения. Конкретные спектральные индексы были разработаны для помощи в извлечении необходимого сигнала для оценки стоимости проблемы; эти индексы содержат данные для нескольких длин волн отражения.

Методы машинного обучения используются для исследования возможности обнаружения точного сопоставления данных спектральных изображений с результатами лабораторных экспериментов с почвами и растениями. Наиболее распространенным методом является линейная регрессия, но глубокие нейронные сети также начинают догонять. Более поздние модели, по крайней мере, совместимы и часто лучше работают.

Несмотря на все достигнутые успехи, исследователи во всем мире все еще пытаются исследовать, чтобы сократить время между обнаружением аномалий и действиями по их устранению.

Общедоступные данные по-прежнему ограничены, их сложно собирать и обрабатывать, только недавно начали появляться платформы для упрощения этого процесса и агрегирования необходимой информации.

Писатель и редактор - Валентина Фихурская