В эпоху технологической революции мы наблюдаем внедрение аналитики данных и информатики в целом во многих отраслях по всему миру. Одной из отраслей, которая меня особенно интересует по нескольким причинам, является сельскохозяйственная промышленность. С одной стороны, это кормит мир, однако, при этом наносит вред планете из-за плохой практики, так что это своего рода интересный обоюдоострый меч, предоставляющий нам ситуацию «между молотом и наковальней», где нашим единственным выходом может быть… использование науки о данных. Другие причины, по которым это меня интересует, связаны с моим образованием в области управления сельскохозяйственным и пищевым бизнесом, а также с детством моего отца.

Мой отец вырос на ферме в сельской местности на западе Миннесоты. В основном им управляли его отец и он сам, пока мой отец не уехал из дома после окончания колледжа. Из-за огромного количества времени, которое он тратил на посадку, сбор урожая, заботу о животных и все, что между ними, я имею удовольствие слышать многочисленные рассказы из его детства. Тяжелая работа и раннее утро / поздний вечер являются общей темой этих историй, а также историй о тяжелых годах. Услышав об этой борьбе в отрасли и о проблемах в сельском хозяйстве во время изучения науки о данных, я заинтересовался возможностями использования науки о данных в сельском хозяйстве для повышения эффективности производства при одновременном сокращении отходов.

Одна научная статья, с которой я столкнулся, исследовала текущее и возможное использование науки о данных в сельскохозяйственной отрасли, сосредоточив внимание на (а) управлении растениеводством, включая приложения для прогнозирования урожайности, обнаружения болезней, обнаружения качества урожая сорняков и распознавания видов; (b) управление животноводством, включая приложения по благополучию животных и животноводству; управление водными ресурсами; и d) рациональное использование почв. Однако, поскольку большинство рассказов моих отцов посвящены работе в поле, я собираюсь сосредоточиться на объяснении того, как наука о данных использовалась в управлении культурами.

Управление культурами

Наука о данных может использоваться и использовалась во многих приложениях в секторе управления растениеводством, включая прогнозирование урожайности, обнаружение болезней/сорняков, качество урожая и распознавание видов. Для каждого из них использовались разные модели и алгоритмы, и чтобы показать, какие из них использовались в каждом секторе, я предоставил список для каждого из них ниже.

Прогноз доходности

Искусственная / ансамблевая нейронная сеть, максимизация ожидания, машины опорных векторов,

Обнаружение болезней/сорняков

Машины опорных векторов, искусственные нейронные сети, нейронная сеть с встречным распространением

Качество урожая

Машины опорных векторов, ансамблевое обучение, случайный лес

Распознавание видов

Сверточные нейронные сети, глубокое обучение

Итак, что же представляют собой все эти алгоритмы и модели?

Нейронная сеть: сеть «узлов», которые позволяют компьютеру обучаться.

Максимизация ожидания: алгоритм итеративного метода, используемый для поиска максимальной возможности или оценок параметров в модели.

Машины опорных векторов: метод контролируемого машинного обучения, который пытается сформировать гиперплоскость в n-м измерении, которая классифицирует все точки данных.

Случайный лес: метод ансамбля, который использует несколько деревьев решений, а затем использует средние результаты из разных деревьев для формирования прогноза.

Ансамблевое обучение: это модель, в которой используется несколько алгоритмов для получения лучшего результата, чем было бы возможно при использовании одного алгоритма.

Глубокое обучение: этот метод пытается имитировать человеческий мозг, группируя информацию и используя ее для прогнозирования. По сути, нейронная сеть с тремя или более слоями. Обычно используется в приложениях искусственного интеллекта.

Как эти алгоритмы помогли сельскому хозяйству?

Что касается прогнозирования урожайности, в одном исследовании рассматривалось прогнозирование урожайности пшеничных полей с использованием искусственной нейронной сети, и это было сделано с точностью 81,65%. В другом исследовании это было сделано для всех культур в целом с использованием искусственных и ансамблевых нейронных сетей с частотой ошибок 1,3%. Успешные модели прогнозирования урожайности важны, поскольку они могут помочь фермерам лучше понять, какие факторы будут наиболее важными во время посевных и сельскохозяйственных периодов сезона.

При обнаружении болезней и сорняков использовалась другая искусственная нейронная сеть для выявления пшеницы, пораженной азотом и желтой ржавчиной, в дополнение к здоровым навесам озимой пшеницы. Эта модель позволяла точно предсказывать стресс от азота, поражение желтой ржавчиной и здоровые кроны с точностью 99,63%, 99,83% и 97,27% соответственно. Расторопша пятнистая, также известная как расторопша пятнистая, является распространенным вредным сорняком, препятствующим росту сельскохозяйственных культур. Модель, использующая искусственную нейронную сеть, использовала спектральные полосы красного и зеленого цветов, а также текстуру для идентификации расторопши с точностью 98,87%.

Еще одна впечатляющая задача, с которой машинное обучение довольно хорошо справилось, — это определение классификации и географического происхождения образца риса с использованием методов ансамблевого обучения и случайного леса с точностью 93,83%.

Это интересная статья для просмотра, потому что она дает кому-то вроде меня много идей о том, для чего машинное обучение и наука о данных в целом могут быть использованы в сельскохозяйственной отрасли. Понятно, что наука о данных захватила некоторые отрасли, такие как производство автомобилей и платформы/реклама в социальных сетях, однако ей еще предстоит по-настоящему проникнуть в сельское хозяйство. Я понимаю, что технология сделала большой скачок вперед, особенно если сравнивать комбайн (или комбайн), скажем, 50-летней давности, с совершенно новым сегодня. Тем не менее, наука о данных, похоже, не полностью вошла в дверь. Это важно, потому что, хотя прогресс в технологиях может облегчить нашу жизнь, прогресс в науке о данных в отрасли может расширить наши знания, что может привести к еще большим достижениям, чем мы могли подумать раньше.

Эта тема очень интересовала меня не только из-за моего прошлого (образование и рассказы моего папы), но и из-за моего будущего. После окончания программы Data Science во Flatiron я думаю, что было бы особенно полезно получить работу в сельскохозяйственной или пищевой промышленности из-за их невероятной важности. Я также думаю, что есть много возможностей, чтобы изменить ситуацию. Например, когда вы думаете о расстоянии, которое приходится преодолевать большей части пищи, которую вы едите, это действительно заставляет вас задуматься, нет ли лучшего способа выращивать и перемещать то, что мы видим на нашей тарелке каждую ночь.