Беседа с победителями конкурса Radiant Earth Computer Vision for Crop Detection from Satellite Imagery.

В мае мы объявили победителей конкурса данных Компьютерное зрение Radiant Earth для обнаружения урожая со спутниковых изображений, которое проходило в феврале и марте 2020 года. диапазон образования, институтов и географических регионов. Пока были выбраны пять победителей, в этом разделе вопросов и ответов мы сели с Каримом Амером, занявшим первое место в общем победе в конкурсе данных, и Феми Сотонва, занявшей первое место гражданином Африки. Наша цель - узнать больше о людях, набравших наибольшее количество очков.

Первое место в общем зачете, Карим Амер

«[В Африке] много молодых и талантливых умов, и знания доступны каждому, кто увлечен и готов упорно трудиться. Однако нам необходимо определить наши основные приоритеты на основе имеющихся ресурсов ».

Познакомьтесь с Каримом Амером, первым победителем конкурса данных по обнаружению урожая. Г-н Амер - исследователь компьютерного зрения в Нильском университете в Египте, который применял глубокое обучение для решения различных проблем за последние четыре года. Он также одновременно работает над своей магистерской диссертацией, в которой основное внимание уделяется автономным навигационным системам на основе зрения для сред, в которых отсутствует GPS.

Г-н Амер ранее работал научным сотрудником в группе универсальных и визуальных вычислений в Нильском университете, где он опубликовал несколько статей об анализе спутниковых изображений в период с 2016 по 2018 год. В 2019 году он стал стажером-исследователем в Технологическом центре Siemens Healthineers во Фландрии, Нью-Джерси, США, где он работал над разработкой передовых моделей сегментации, которые можно использовать в различных клинических приложениях.

Помимо академических интересов, Карим увлекается японским аниме и считает его уникальным источником инноваций.

В этом разделе вопросов и ответов г-н Амер рассказывает нам о своем пути к тому, чтобы стать специалистом по обработке данных и, в конечном итоге, победить в испытании данных по обнаружению сельскохозяйственных культур Radiant Earth.

Поздравляем с победой в конкурсе данных по обнаружению урожая в радиантной Земле! Расскажите о себе?

Мне 27 лет, у меня двое братьев и сестер, и я живу в Каире, Египет. В школе я преуспел в математике, и я хотел понять, как ее можно эффективно использовать в реальной жизни. Вот почему я решил изучать компьютерную инженерию в колледже, где я узнал о машинном обучении и о том, как мы можем создавать интеллектуальные машины, которые могут улучшить нашу жизнь.

Мой студенческий проект был посвящен автоматизации процесса машинного обучения, который может сэкономить специалистам по данным и инженерам значительное количество времени, когда они выполняют свою работу. С появлением технологий глубокого обучения я решил продолжить учебу в этой инновационной области. Я хотел применить полученные знания о реальных жизненных проблемах и начал участвовать в онлайн-соревнованиях по машинному обучению. В настоящее время я являюсь Экспертом Kaggle.

Что вы думаете о Data Challenge и как вы к нему подошли?

Конкурс был сложным и имел место для творческих идей, что мне было интересно. Предоставленный набор данных представлял собой временные ряды многоспектральных спутниковых изображений с высоким разрешением сельскохозяйственной территории в Западной Кении. Изображения были получены в 13 разных дней в течение пяти месяцев. Целью было классифицировать посевной урожай в некоторых хозяйствах этого региона.

После изучения данных стало ясно, что пространственно-временная нейронная сеть была лучшим решением. Но я также понял, что при отсутствии доступной предварительно обученной модели на аналогичных данных, препятствием будет определение того, как обучать модель на небольшом наборе данных (~ 3K обучающих выборок). Мой подход заключался в том, чтобы начать с более простой модели и постепенно увеличивать ее сложность, добавляя дополнительные данные, чтобы избежать переобучения.

Моей последней моделью была многослойная сверточная нейронная сеть (CNN) с определенным уровнем объединения. Увидев, что некоторые фермы занимают только пару пикселей, а другие - десятки пикселей, я разработал модель с учетом площади входных ферм, за которой следует многослойная закрытая рекуррентная сеть (GRU).

Мой ключевой вывод из этой проблемы заключается в том, что нейронные сети фантастичны и обладают множеством степеней свободы, которые можно использовать для любых структурированных данных, таких как изображения, текст, временные ряды и графики. Просто требуется некоторое терпение и последовательность, чтобы извлечь из этого максимальную пользу, поскольку процесс настройки обычно занимает некоторое время, прежде чем будет достигнута наилучшая конфигурация.

Как вы узнали о конкурсе Radiant Earth Data Challenge?

Я был очень рад принять участие в конференции ICLR 2020, которая должна была проходить в Африке, на моем родном континенте. Итак, я искал проблему с данными на конференции и обнаружил семинар и конкурс Компьютерное зрение Radiant Earth для сельского хозяйства на веб-сайте CV4GC.

Были ли вы знакомы с типами культур, использованных в испытании?

Поскольку кукуруза - одна из самых распространенных культур, собираемых в Египте, я знаком с ее сельским хозяйством. Несмотря на то, что мы не знали, что такое маниока, это был корнеплод, похожий на сладкий картофель, еще одно широко распространенное в Египте растение. Было интересно узнать, что из маниоки делают вафли, а из сладкого картофеля делают сладости.

Что вы чувствуете, обойдя 440 ведущих специалистов по данным?

Во-первых, я был в восторге, когда узнал, что занял первое место в соревновании. Мое усердие, упорный труд и интенсивные исследования были вознаграждены тем, что я был признан лучшим в этом конкурсе. Тем не менее, я был потрясен и потрясен тем, что мое исследование было признано экспертами и коллегами. Я глубоко признателен за работы, представленные некоторыми из лучших умов Африки и мира. Наконец, я считаю, что полученная мной награда - это стимул, который побудит меня продолжить исследования.

Каковы, по вашему мнению, возможности для исследований ОД в Африке? Как вы думаете, какую роль методы машинного обучения могут сыграть в решении проблем развития в Африке?

Я считаю, что мы можем проводить передовые исследования машинного обучения в Африке, потому что у нас много молодых и талантливых умов, а знания доступны каждому, кто увлечен и готов много работать. Однако нам необходимо определить наши основные приоритеты на основе имеющихся ресурсов. Работа над инновационными исследовательскими задачами, такими как обучение по принципу «малое количество кадров», обучение с самоконтролем и оптимизация быстрой конвергенции, может иметь положительное влияние, которое мы можем использовать в Африке.

Кроме того, важно связать исследования с нашими текущими проблемами, чтобы помочь африканцам жить лучше, начиная с их основных потребностей, таких как еда, здоровье и образование. Например, мы можем использовать системы ML для обнаружения болезней растений и точного земледелия для повышения продуктивности производства продуктов питания.

Обладательница первого места среди граждан Африки Феми Сотонва

«Это был мой первый опыт работы с данными дистанционного зондирования, который заставил меня оценить эту область и ее возможности».

Познакомьтесь с Феми Сотонва, ученым-самоучкой из Нигерии. Бухгалтер по образованию, г-н Сотонва в свободное время участвует в соревнованиях по проверке данных. Увлеченный информатикой и технологиями, даже во время изучения бухгалтерского учета, он сам занимался разработкой программного обеспечения, пока не обнаружил практическое применение науки о данных для решения реальных проблем. На данный момент г-н Сотонва принял участие в пяти соревнованиях. По его словам, «наука о данных дает возможность получить практический опыт решения различных социальных проблем, а также данных без необходимости эксклюзивного доступа».

Откуда вы и какое у вас образование?

Я родом из Нигерии. Я выпускник Университета Бэбкока, Нигерия, со степенью бакалавра бухгалтерского учета.

Что вы думаете о Data Challenge и как вы к нему подошли?

Задача была интересной. Это был мой первый опыт работы с данными дистанционного зондирования, который заставил меня оценить эту область и ее возможности. Я подошел к задаче, взглянув на проблему с двух точек зрения, каждая с похожим процессом моделирования. Реализация решения из двух подходов с последующим их объединением повысила производительность. Также помогло решение внутренней проблемы классового дисбаланса за счет использования веса класса.

Хотя конкурс был открытым во всем мире, все три победителя прибыли с африканского континента, что свидетельствует о том, что технологические центры играют важную роль в инновационном бизнесе на континенте, и нет никаких признаков того, что это замедлится. Какие возможности и проблемы стоят перед специалистами по обработке данных в Африке?

Существуют различные возможности, которые требуют дальнейшего изучения. Некоторые из интересных - это обработка естественного языка и компьютерное зрение. Современные реализации в этих областях обычно включают глубокое обучение (DL) с использованием архитектур нейронных сетей. DL является относительно дорогостоящим в реализации, в зависимости от масштаба проблемы. Проблемы - по крайней мере, откуда я родом - варьируются, среди прочего, от надежной резервной электроэнергии, относительно доступных данных в Интернете и наличия специалистов. Технические центры помогают справиться с некоторыми из этих проблем, но для многих они остаются препятствием.