Корабли и самолеты перевозят большую часть предметов по всему миру. Ежегодно по всему миру перевозится более 11 миллиардов тонн грузов. К ним относятся транспортные средства, химические газы и жидкости, твердые материалы в контейнерах и т. д. Когда эти виды транспорта перевозят так много материалов, становится крайне важно контролировать и отслеживать их перемещение по всему миру.

Анализ спутниковых изображений предлагает отличное решение таких проблем. Этот анализ изображений не только помогает отслеживать данный объект, но также помогает контролировать окружение цели. С обнаружением судов и в сочетании с данными о маршрутах и ​​статусе других судов (данными из других источников) можно создать множество функций безопасности. Пиратские корабли могут быть обнаружены задолго до того, как они сблизятся с потенциально уязвимыми кораблями, могут быть обнаружены корабли, отклоняющиеся от заданной траектории. Кроме того, поисково-спасательные операции могут быть дополнительно улучшены с точки зрения времени реагирования и точности определения местоположения. Благодаря обнаружению самолетов системы предотвращения столкновений могут стать более эффективными. Кроме того, он предоставляет правильную статистику, связанную с рейсами.

Огромное количество приложений можно создать с помощью Искусственного интеллекта и машинного обучения, применяемого к спутниковым снимкам. Эти приложения требуют больших объемов данных, и с недавним доступом спутниковых изображений от многих технологических гигантов и государственных организаций, это стало новой областью в аэрокосмической области.

Rhammell на Kaggle предоставил очищенный набор данных спутниковых снимков, отдельно для каждой из категорий, то есть для самолетов и кораблей. Эти наборы данных содержат изображения объекта, расположенного в центре. Кроме того, предусмотрено несколько сцен для проверки работы модели на больших спутниковых снимках.

Обнаружение кораблей:

Набор данных:
Последняя версия набора данных Ships состоит из 3600 изображений размером 80 x 80 в формате RGB. Изображения были получены из продуктов полнокадровой визуальной сцены PlanetScope, которые были ортотрансформированы до размера 3-метрового пикселя. Вместе с изображениями указываются соответствующие метки (1:Корабль; 0:Нет корабля) и географическое положение центральной точки изображения в виде пары широта-долгота.

В названии изображений используется следующий формат:
{метка} _ {идентификатор сцены} _ {долгота} _ {широта}.png

Набор данных состоит из 900 изображений, помеченных как 1 (т.е. корабли), и 2700 изображений, помеченных как 0 (т.е. без корабля). Данные также доступны в формате .json.

На следующих изображениях показаны некоторые примеры изображений без категории корабля. К ним относятся изображения, которые не содержат никакого корабля или содержат только часть корабля (т. е. недостаточные для того, чтобы их можно было отнести к категории кораблей).

Подготовка данных.
Поскольку набор данных сравнительно меньше по размеру, мы используем методы увеличения изображения для дальнейшего добавления вариантов изображений. Здесь мы используем методы поэлементного центрирования и поэлементной нормализации. Также добавлены случайные горизонтальные и вертикальные флипы и случайное вращение.

Модель машинного обучения.
Используемая здесь модель представляет собой 8-уровневую свёрточную нейронную сеть с тремя двумерными свёрточными слоями, двумя двухмерными слоями с максимальным пулом, двумя полносвязными слоями и выпадающим слоем. . Оптимизатор ADAM используется для оптимизации весов, а категориальная кросс-энтропия используется в качестве функции потерь. Модель обучается с размером пакета 128 для 50 эпох. Данные каждой эпохи случайным образом перемешиваются и разбиваются на соотношение 80–20 для обучения и проверки. Окончательная точность проверки составляет около 95%.

Вывод:
Обученная модель используется для определения местоположения кораблей на спутниковых снимках. Эти сцены могут быть разного размера. Сцены сканируются с использованием метода скользящего окна с использованием частоты шагов 10 пикселей и размера окна 80 пикселей. При обнаружении корабля в окне рисуется ограничивающая рамка красного цвета размером 80 X 80.

Можно видеть, что модель машинного обучения не является на 100% точной, она содержит некоторые ложные срабатывания (т. е. некоторые наземные строения классифицируются как корабли), а также некоторые ложноотрицательные результаты (т. е. некоторые корабли не классифицируются как корабли, только один в данном случае).

Всегда есть компромисс между ложноположительными и ложноотрицательными. Их можно изменить путем дальнейшей точной настройки нашей модели или параметров обнаружения. Например, дальнейшее изменение скорости шага окна обнаружения может изменить ошибки. Это зависит от того, каково конечное применение алгоритма, мы можем оптимизировать либо чувствительность, либо специфичность.

Обнаружение самолетов:

Набор данных:
Последняя версия набора данных Planes состоит из 32 000 изображений размером 20 x 20 в формате RGB. Набор данных помечен как 1: плоскость, 0: без плоскости. Он состоит из 8000 изображений, помеченных как 1 (т.е. плоскость), и 24000 изображений как 0 (т.е. без плоскости).
Кроме того, набор данных доступен в формате .json.

Подготовка данных:
Задачи подготовки данных такие же, как мы использовали для обнаружения кораблей. Мы используем случайные горизонтальные и вертикальные перевороты, случайное вращение, наряду с центрированием по функциям и нормализацией.

Модель машинного обучения.
Поскольку задача та же, что и задача обнаружения корабля, мы используем ту же архитектуру нейронной сети, что и ранее. У нас есть 8-слойная глубокая сверточная нейронная сеть с тремя 2D-конволюционными слоями, двумя 2D-слоями Max-Pooling, двумя полносвязными слоями и выпадающим слоем. Оптимизатор «ADAM» используется для оптимизации весов, а категориальная кросс-энтропия используется в качестве функции потерь.
Модель обучается с размером пакета 128 для 50 эпох. Данные каждой эпохи случайным образом перемешиваются и разбиваются на соотношения 80–20 для обучения и проверки. Окончательная точность проверки составляет около 85% — 90%.

Вывод:
Обученная модель используется для поиска самолетов на спутниковых снимках. Сцены сканируются с помощью метода скользящего окна с использованием шага 2 пикселя и размера окна 20 пикселей. Если в окне обнаружена плоскость, красной рамкой рисуется ограничивающая рамка размером 20 X 20.

Первоначально опубликовано на https://aventior.com 26 октября 2019 г.