Учитывая, что большой стог сена может содержать более 7000 кубических футов сена, уместность клише игла в стоге сена становится очевидной. А теперь представьте, что вы нашли эту пресловутую иглу во время поиска на 139,7 миллиона квадратных миль океана, покрывающего нашу планету. Это была задача, стоящая перед командой IMPACT, работающей над решением для автоматического обнаружения морского мусора с использованием машинного обучения.

По оценкам, ежегодно в океан попадает около восьми миллионов тонн пластиковых отходов из-за отсутствия надлежащего обращения с отходами. Сток с суши и речные потоки приводят к накоплению мусора в прибрежных районах, в то время как океанские течения являются основными движущими силами переноса мусора в открытый океан (Jambeck et al. 2015). Загрязнение океана пластиком оказывает разрушительное воздействие на морское биоразнообразие. Морской мусор - это совокупный термин, описывающий этот созданный человеком мусор, который случайно или намеренно был сброшен в океаны. Однако, попав в море, мусор обычно смешивается с природными материалами или растительностью, такими как водоросли, водоросли и коряги.

Применение надежного внутреннего выбора функций искусственного интеллекта (ИИ) и абстракции, обеспечивающей глубокое обучение, для данных наблюдения Земли может революционизировать обнаружение морского мусора и облегчить текущие усилия по очистке мирового океана. Эта стратегическая комбинация может в значительной степени информировать усилия по целевому мониторингу и очистке, а также способствовать научным исследованиям динамики переноса морского мусора.

Современные подходы к обнаружению морского мусора в основном основываются на спутниковых снимках с более низким разрешением (которые очень грубые) или данных с воздуха (получение которых дорого). Однако высокое пространственно-временное разрешение и широкий охват изображений с малых спутников делают его уникальным преимуществом для динамики мониторинга морского мусора, когда на цели влияют многие переменные переменные, такие как течения, погода и деятельность человека. Кроме того, пространственное разрешение снимков с малых спутников выше по сравнению со снимками с большинства спутников открытого доступа. Эта разница в пространственном разрешении может дать дальнейшие улучшения в отношении детализации или масштаба реально обнаруживаемого пластика океана.

Команда IMPACT сначала провела обширный обзор литературы по обнаружению морского мусора и пластика, чтобы сопоставить подтвержденные случаи морского мусора. Эти места и соответствующие временные метки подтвержденных наблюдений за морским мусором служили синоптическим ориентиром для поиска перекрывающихся изображений. Наблюдения, которые они получили, были в основном из наблюдений вокруг островов залива в Гондурасе, дополненных наблюдениями из Аккры, Гана и Митилини, Греция »(Kikaki et al. 2020,» Biermann et al. 2020, Topouzelis et al. 2019 ).

Затем они провели поиск в архиве снимков 3-метровой планеты в поисках соответствующих дат из литературы и вручную проверили наличие морского мусора для создания помеченного набора данных. Комбинация умеренно высокого пространственного разрешения, высокого временного разрешения, наличия канала в ближнем инфракрасном диапазоне (где пластик сильно отражается в электромагнитном спектре) и глобального покрытия береговых линий сделали эти изображения полезными для целей настоящего исследования.

После определения набора данных изображений следующим шагом было проведение инвентаризации реально обнаруживаемых объектов в соответствии со спецификациями изображений. С помощью Planetscope команда ожидала, что модель будет способна обнаруживать агрегированные обломки мусора, а также некоторые мегапластики, включая призрачные (то есть потерянные или брошенные) рыболовные сети среднего и большого размера. В конечном итоге набор данных с пользовательской меткой состоял из 1370 полигонов, содержащих морской мусор. Помеченная часть каждой сцены Planetscope была разделена на меньшие квадратные (256 x 256) плитки, которые использовались для обучения модели обнаружения объектов.

Чтобы обеспечить автоматическое обнаружение морского мусора на изображениях, команде потребовалась модель компьютерного зрения, способная изучать характерные особенности морского мусора на изображениях, снятых над морской средой. Для этого они разработали модель обнаружения объектов глубокого обучения. Для этой модели требуются изображения и пространственные аннотации для морского мусора в виде ограничивающих рамок. Модель изучает изображения и аннотации во время обучения, изучает, что является, а что нет, морской мусор, и предлагает кандидатов на основе изученной схемы. После завершения обучения (т. Е. Когда ошибка модели максимально приближена к нулю), модель можно применить к любым изображениям с такими же характеристиками, чтобы сделать вывод или прогнозировать наличие морского мусора. Предсказанные кандидаты, которые представляют собой ограничивающие прямоугольники, как и обучающие аннотации, могут затем использоваться для определения местоположения, количественной оценки и извлечения приблизительных измерений морского мусора масштабируемым образом во времени и пространстве.

Производительность модели оценивалась путем вычисления пересечения по объединению (IoU), точности, отзыва и f1-баллов предсказанных ограничивающих прямоугольников относительно наземных ограничивающих прямоугольников на удерживаемом наборе тестовых данных. Окончательный результат f1 0,85 был получен при балле IoU 0,5. Эта оценка указывает на то, что модель достаточно хорошо показала себя при обнаружении плавающего морского мусора.

Член команды IMPACT Анкур Шах объясняет более широкую применимость этого усилия по машинному обучению:

Основное значение этого метода состоит в том, что он может быть воспроизведен для определения любых объектов наук о Земле, если имеется достаточно данных с метками для обучения модели. Снимки с планетоскопа имеют пространственное разрешение примерно 3 метра, что делает его идеальным для обнаружения относительно небольших объектов, таких как морской мусор, здания, дороги, самолеты и т. Д. Тот же рабочий процесс можно повторить для проблем с обнаружением объектов.

Это решение машинного обучения уникальным образом сочетает в себе несколько инструментов с открытым исходным кодом для создания общего рабочего процесса. Для аннотации изображений в решении используется программа ImageLabeler, разработанная и опубликованная NASA IMPACT. Для кодирования аннотаций мозаичного изображения и ограничивающего прямоугольника в решении использовалась программа Label Maker, разработанная и опубликованная Development Seed. Сериализация, моделирование и оценка данных были реализованы с помощью TensorFlow, который был разработан и опубликован Google.

Помимо технических достижений, эти усилия имеют значение для будущего планеты, как описывает член команды Лилли:

Я провел большую часть своей жизни в океане и вокруг него, занимаясь серфингом и спасая океан в южной Калифорнии. Как важный компонент моей жизни и окружающей среды, наши океаны - это то, что лично меня глубоко волнует. Я очень давно надеялся провести исследование, объединяющее дистанционное зондирование океана и компьютерное зрение, поэтому я благодарен за то, что сейчас выполняю эту страсть. Когда-нибудь я надеюсь, что полученные нами результаты помогут продвинуть решения к более чистой окружающей среде.

Более подробную информацию о IMPACT можно найти в NASA Earthdata и на сайте проекта IMPACT.