«Каталогизация наборов данных SpaceNet помогает расширить глобальную карту наборов геопространственных обучающих данных Radiant MLHub, что очень важно для выявления недостаточно представленных географических областей»

Сегодня Radiant Earth Foundation объявил о регистрации совместимой с пространственно-временным каталогом активов (STAC) версии высококачественных наборов данных с геопространственными метками для дорог и зданий на Radiant MLHub. Radiant MLHub - первая в мире открытая облачная библиотека, посвященная обучающим данным наблюдения Земли для алгоритмов машинного обучения. Обновленный каталог наборов данных также доступен через реестр данных SpaceNet.

SpaceNet, основанная в 2016 году для ускорения геопространственного машинного обучения с открытым исходным кодом, является некоммерческой организацией, которая выполняет задачи по обработке данных и выпускает обучающие наборы данных, базовые алгоритмы, выигрышные алгоритмы и подробные оценки под лицензией с открытым исходным кодом. На сегодняшний день они организовали шесть задач по обработке данных, каждая из которых посвящена отдельной проблеме, которая применяет машинное обучение к спутниковым изображениям для решения сложных задач картографии. SpaceNet 7 Challenge планируется запустить в начале этой осени.

  • Задача 1 была сосредоточена на извлечении особенностей зданий на спутниковых снимках высокого разрешения WorldView-3 в Рио-де-Жанейро. Этот набор данных содержит более 382 000 следов зданий.
  • Задача 2 была направлена ​​на обнаружение следов зданий на спутниковых снимках с высоким разрешением WorldView-3 в четырех городах: Лас-Вегасе, Париже, Шанхае и Хартуме. Во всех четырех городах насчитывается более 1,6 миллиона следов зданий.
  • Challenge 3 был посвящен обнаружению дорог и их типа на спутниковых снимках высокого разрешения WorldView-3 в Лас-Вегасе, Париже, Шанхае и Хартуме. В этих четырех городах проложено более 8000 км дорог восьми типов.
  • Задача 4 была сосредоточена на извлечении следов зданий на площади 665 км2 в Атланте, штат Джорджия, в США, с помощью спутниковых снимков с высоким разрешением WorldView-2. Набор данных содержит более 120 000 следов зданий.
  • Задача 5 была посвящена извлечению дорожной сети и оценке времени в пути по спутниковым снимкам высокого разрешения в Москве, Мумбаи, Сан-Хуане и Загадочном городе. Всего в этих городах имеется более 8 100 км дорожных знаков.
  • Задача 6 была направлена ​​на обнаружение следов зданий на площади 120 км2 с использованием мультисенсорных радаров с синтезированной апертурой (SAR) и электрооптических изображений (EO) высокого разрешения. Набор данных содержит ~ 48 000 строений в Роттердаме, Нидерланды.

Данные по обучению для каждой задачи с обновленными каталогами STAC зарегистрированы в Radiant MLHub, а также в реестре открытых данных SpaceNet, что обеспечивает легкий доступ для специалистов по данным, работающих над проблемами городского планирования и сельского развития. Каталогизация наборов данных SpaceNet помогает расширить глобальную карту наборов геопространственных обучающих данных Radiant MLHub, которая необходима для определения недостаточно представленных географических областей; он также помогает автоматизировать процесс обнаружения данных геопространственного обучения, что является фундаментальной проблемой управления данными. Наконец, он увеличивает возможности для оценки точности моделей геопространственного машинного обучения.

«Мы очень рады, что у нас есть обучающие наборы данных SpaceNet по всем шести задачам, зарегистрированным на Radiant MLHub», - сказал главный специалист по данным Radiant Earth Foundation Хамед Алемохаммад. «Radiant MLHub - это ресурс сообщества для всех, кто работает с наблюдениями Земли, чтобы находить данные, готовые к машинному обучению, публиковать свои наборы обучающих данных для большей наглядности или сравнивать алгоритмы с существующими данными. Партнерство с ведущими организациями, такими как SpaceNet, помогает нам расширять библиотеку Radiant MLHub ».

«Обновление каталогов данных SpaceNet со стандартом STAC - важный шаг к тому, чтобы сделать текущие и будущие наборы данных легкодоступными для практиков», - сказал Райан Льюис, генеральный директор SpaceNet LLC. «Мы благодарны всей команде Radiant Earth за их помощь, которая сделала это возможным, а также за то, что наши данные стали доступны на Radiant MLHub».

Вы можете найти совместимые с STAC наборы данных SpaceNet на сайтах registry.mlhub.earth и registry.opendata.aws/spacenet.