Марк Хуберти и Клэр Кортелл, Lyft картографирование

Исследование Lyft Mapping показывает, что ключевые атрибуты дорог OpenStreetMap свежие и качественные в 30 городах Северной Америки по сравнению с наземной истиной.

Lyft перемещает людей - из дома на работу, с работы на отдых, от игры к отдыху, по городам и за их пределами. Карты играют решающую роль, помогая Lyft выяснить, где водители и райдеры, как лучше всего их связать, и оценить, сколько времени потребуется, чтобы добраться до места назначения.

Lyft Mapping построен на основе OpenStreetMap. Эта глобальная база данных карт используется миллионами людей по всему миру для борьбы с изменением климата, отслеживания использования сельскохозяйственных земель, восстановления после стихийных бедствий, реагирования на беженцев, академических исследований и многого другого. После 16 лет роста OSM теперь широко используется многими компаниями для поддержки таких приложений, как логистические платформы, социальные сети и игры. OSM в настоящее время является крупнейшим краудсорсинговым хранилищем человеческих геопространственных знаний. Но подходит ли эта карта для поддержки поездки на автомобиле? Это лучший вариант? Может ли Lyft поддержать сообщество OSM и внести свой вклад в улучшение карты? Хотя у нас была сильная интуиция, что OSM предлагает полную дорожную сеть, мы не знали, насколько хорошо карта соответствует реальному миру, поэтому мы провели исследование.

tl;dr

Спустя три месяца, тысячи миль и много квалифицированной работы нашей команды по обработке данных, мы рады сообщить о положительных результатах:

  1. OpenStreetMap имеет очень качественную дорожную сеть в 30 крупных городах Северной Америки.
  2. Сообществу OpenStreetMap можно отдать должное за поддержание надежно свежих стандартов карты в этих областях.
  3. Этот план опроса потенциально полезен для любого исследования качества карты на предмет достоверности.

В этом посте мы рассмотрим, как мы это сделали (см. Документ), а также результаты и выводы для Lyft и картографического сообщества.

Дизайн опроса: насколько точна карта?

Измерение всей карты - существует ли дорога, правильно ли снабжена аннотациями, актуальна - просто сложно. Lyft работает более чем на 300 рынках в США и Канаде, от плотных старых городских районов, таких как Нью-Йорк, до крупных пригородных мегаполисов, таких как Феникс или Лос-Анджелес. Чтобы получить достоверную информацию, необходимую для оценки качества карты, мы можем послать геодезиста на каждый перекресток и записать, правильно ли что-то. Бюро переписи населения США делает именно это - фактически, каждые 10 лет оно нанимает столько людей, что в одиночку меняет уровень безработицы. Но этот подход может быть невероятно медленным и дорогим. Нам нужен был план исследования, в котором наше стремление к региональной специфике уравновешивалось стоимостью и материально-технической осуществимостью.

Отбор проб + дистанционное зондирование = выполнимое исследование

Мы знали, что нам нужен подход, основанный на выборке, чтобы сделать это послушным. Но чисто случайная выборка не сработает; отправка людей на случайно выбранные перекрестки по городу займет невероятно много времени. Вместо этого мы обратились к общественному здравоохранению и дистанционному зондированию в поисках решения. Исследователи в области здравоохранения часто сталкиваются с аналогичной проблемой: как отправить ограниченное количество исследователей на дом для оценки распространенности заболевания или результатов для здоровья. Они решают это с помощью кластерной выборки:

  1. Примеры пространственных единиц, например городского квартала.
  2. Выборка домохозяйств из этого блока

Этот двухэтапный процесс упрощает жизнь геодезистам. Участник опроса может отправиться в один городской квартал и одновременно посетить несколько домохозяйств, максимально используя информацию, которую они получают за одну поездку. Такой план обследования не так статистически эффективен, как чистая случайная выборка, но недостаток чистоты компенсируется логистической простотой и экономической эффективностью.

Мы скопировали эту методологию и добавили хитрость: дистанционное зондирование. Вместо того, чтобы отправлять геодезистов лично, мы начали сотрудничать с Mapillary (теперь частью Facebook) для сбора высококачественных изображений из наших пространственных образцов. Затем группа кураторов картографических данных Lyft использовала эти изображения, чтобы выяснить, соответствует ли OSM реальному миру.

Имея в руках карту, рассмотренную куратором, стандартные статистические методы дали нам ответ - насколько хорошо было качество OSM на основе выборки и насколько оно варьировалось в зависимости от региона? Пакет опрос для языка статистического программирования R предоставил все инструменты для оценки общенационального и регионального качества на основе нашей схемы выборки. Подробные оценки следуют в конце этого поста и в нашей публичной газете.

Этот процесс отбора проб, быстрого сбора изображений и курирования позволил нам изучить всю Северную Америку за три месяца, завершенных в марте 2020 года.

Выводы: высокая точность карты для 30 городов *

Мы обнаружили, что основные характеристики дорог OpenStreetMap более 95% времени верны по сравнению с тем, что существует в реальном мире. Данные, важные для безопасной навигации, такие как ограничения левого поворота, верны более чем в 85% случаев. В масштабах страны эти оценки точны с точностью до 5% неопределенности выборки. Региональная неопределенность больше варьируется в зависимости от динамики на региональном уровне, что видно на рисунках в конце этого поста.

Как сказано в «Картографировании», совершенство недостижимо; карта устаревает в момент публикации, потому что реальный мир постоянно меняется. Но по состоянию на март 2020 года данные карты OSM показали лишь незначительные отличия от реального мира.

* См. полный список городов на графиках ниже

Выводы

Эти результаты обнадеживают, потому что они показывают, что Lyft работает на карте, которая точно отражает реальность. Это дает нам больше уверенности в том, что мы обычно не прогнозируем маршрут Lyft с недопустимым поворотом или неправильным движением по улице. В то же время он сужает области возможностей.

  • OpenStreetMap находится на обслуживании, а этап Садоводство - курирование карты для многих объектов и регионов. Это означает, что возникающие проблемы обычно связаны с недавними изменениями в реальном мире, а не с пробелами в экстенте карты. Расхождения с Groundtruth часто связаны с недавними изменениями, а не с давно не нанесенными на карту функциями. В этом исследовании показано, что 30 городов находятся в режиме обслуживания для отмеченных функций.
  • Остаются области для инвестиций, включая указатели на въездах и указатели полос движения в определенных городах. Это полезная информация, которая поможет картографам, в том числе команде Lyft Mapping Curation, направить свои усилия на улучшение карты для всех, кто использует OpenStreetMap. Подобные исследования помогают нам сузить фокус и создать более надежные программы для поиска ошибок.
  • Полевые опросы на основе выборки являются быстрыми и менее дорогостоящими, чем наземная перепись. Подход выборки + дистанционное зондирование может быть полезным для дальнейших исследований различных тегов, географических регионов или вариантов использования. Мы надеемся, что другие будут поощрены использовать эти методы.
  • Сенсорные сети, сочетающие изображения (например, Mapillary) и телеметрию (например, Lyft), могут улучшить OpenStreetMap безопасным и анонимным образом, обнаруживая ошибки и изменения. Например, см. Как Lyft создает сверхточные карты из карт с открытым исходным кодом и данных в реальном времени. Как хорошо знают картографы, датчики - это ценный инструмент, который каждый может использовать для улучшения карт, и их растущее повсеместное распространение делает улучшения очень доступными.
  • Чтобы карта всегда была в актуальном состоянии, нужно найти иголки в стоге сена. Свидетельства, выходящие за рамки этого исследования (например, заглавное изображение), показывают, что сообщество отслеживает строительство, последствия стихийных бедствий и новые изменения (например, новые велосипедные дорожки!) И картирует их по мере их появления.

Следующий пункт назначения

Эти выводы ценны сами по себе - они говорят нам, что Lyft работает на отличной карте. Как продемонстрировал OpenStreetMap, мы никогда не должны недооценивать потенциал коллективного сотрудничества. С каждым редактированием, добавлением, модификацией и обсуждением сообщество редакторов и организаций создавало полную карту североамериканских городов в OpenStreetMap. Поскольку Lyft Mapping продолжает исследования о том, как продолжить совместный вклад в OpenStreetMap, мы будем смотреть дальше, за пределы этих городов - следите за обновлениями!

Если вы хотите участвовать в доработке наших сложных картографических систем, присоединяйтесь к нам!

Полный отчет: 30 городов Северной Америки

Изображения ниже полностью задокументированы в документе: bit.ly/lyftosmqualitystudy

Основы: класс дороги, полосы движения, направленность

Законность: ограничения хода

Ограничения на поворот имеют значение для совместного использования по двум простым причинам: мы не хотим, чтобы водители совершали незаконные повороты, и мы не хотим, чтобы пассажиры могли путешествовать по небезопасным маршрутам. В отличие от дорог, мы не видим их на спутниковых снимках и не можем найти в данных о муниципальных дорогах, публикуемых большинством городов. Снимки с уровня земли, сделанные Мапиллари, оказались критически важными для понимания полноты OSM.

Знать, куда идти: знаки автострады

Ездите безопасно!