Обнаружение автомобилей на больших территориях с помощью YOLT и открытых аэрофотоснимков Занзибара

В сочетании с набором данных SpaceNet и серией задач, направленной на демократизацию данных спутниковых снимков и поощрение разработки целевых алгоритмов, одна из целей команды CosmiQ - поддержать картографическое сообщество с открытым исходным кодом. С этой целью CosmiQ принимает участие в конференции FOSS4G в Дар-эс-Саламе, Танзания. FOSS4G - это крупнейшее ежегодное глобальное собрание разработчиков и пользователей геопространственного программного обеспечения с открытым исходным кодом.

В этом блоге мы исследуем, насколько хорошо один из инструментов с открытым исходным кодом, разработанный CosmiQ (YOLT), работает в областях, представляющих интерес для FOSS4G. В частности, мы анализируем данные OpenAerialMap с разрешением 7,5 см, собранные в рамках Zanzibar Mapping Initiative над островом Занзибар недалеко от побережья Дар-эс-Салама.

Модельное обучение

В качестве проверки надежности нашего алгоритма мы применяем модель YOLT, обученную на наборе данных, сильно отличающемся от данных OpenAerialMap над Занзибаром: 15-сантиметровые аэрофотоснимки COWC, собранные над городами в Канаде (Торонто), Новой Зеландии (Селвин) и Германия (Потсдам). Напомним, что YOLT - это алгоритм обнаружения объектов, предназначенный для быстрой локализации объектов на больших площадях на изображениях произвольного размера. См. Наш предыдущий пост для подробностей о дальнейшем обучении.

Вывод

Набор тестовых данных OpenAerialMap собирается с другим датчиком, с другим разрешением (7,5 см против 15 см для COWC) и в совершенно другом географическом регионе, чем наш обучающий набор. Мы выбираем порог обнаружения, предназначенный для минимизации ложных срабатываний (автомобили, которые остаются незамеченными), и в результате на изображениях появляется несколько ложных срабатываний. К сожалению, на Занзибаре у нас нет наземных меток для автомобилей, поэтому мы не можем рассчитать точные показатели производительности.

Производительность и выводы

Логический вывод выполняется быстро со скоростью 9 квадратных километров в минуту на одном графическом процессоре. При такой скорости вывода запуск YOLT на инстансе Amazon EC2 P3 для всех ~ 1000 квадратных миль Занзибара занимает менее получаса. В качестве альтернативы возможна работа на облегченной машине с центральным процессором (хотя и намного медленнее), которая по-прежнему работает со скоростью ~ 1 квадратный километр в час на процессор.

Мы с нетерпением ждем дальнейшей работы по количественной оценке производительности, но пока изображения ниже кажутся обнадеживающими: очень мало пропущенных автомобилей (ложноотрицательных результатов) и относительно мало ложных срабатываний. По мере того, как мы продолжаем наши усилия по алгоритмическому картированию, в будущих публикациях будет также изучено применение алгоритмов обнаружения зданий и дорожных сетей, обученных на спутниковых данных SpaceNet, для наборов данных аэрофотоснимков.