Марк Хуберти и Клэр Кортелл, Lyft картографирование
Исследование Lyft Mapping показывает, что ключевые атрибуты дорог OpenStreetMap свежие и качественные в 30 городах Северной Америки по сравнению с наземной истиной.
Lyft перемещает людей - из дома на работу, с работы на отдых, от игры к отдыху, по городам и за их пределами. Карты играют решающую роль, помогая Lyft выяснить, где водители и райдеры, как лучше всего их связать, и оценить, сколько времени потребуется, чтобы добраться до места назначения.
Lyft Mapping построен на основе OpenStreetMap. Эта глобальная база данных карт используется миллионами людей по всему миру для борьбы с изменением климата, отслеживания использования сельскохозяйственных земель, восстановления после стихийных бедствий, реагирования на беженцев, академических исследований и многого другого. После 16 лет роста OSM теперь широко используется многими компаниями для поддержки таких приложений, как логистические платформы, социальные сети и игры. OSM в настоящее время является крупнейшим краудсорсинговым хранилищем человеческих геопространственных знаний. Но подходит ли эта карта для поддержки поездки на автомобиле? Это лучший вариант? Может ли Lyft поддержать сообщество OSM и внести свой вклад в улучшение карты? Хотя у нас была сильная интуиция, что OSM предлагает полную дорожную сеть, мы не знали, насколько хорошо карта соответствует реальному миру, поэтому мы провели исследование.
tl;dr
Спустя три месяца, тысячи миль и много квалифицированной работы нашей команды по обработке данных, мы рады сообщить о положительных результатах:
- OpenStreetMap имеет очень качественную дорожную сеть в 30 крупных городах Северной Америки.
- Сообществу OpenStreetMap можно отдать должное за поддержание надежно свежих стандартов карты в этих областях.
- Этот план опроса потенциально полезен для любого исследования качества карты на предмет достоверности.
В этом посте мы рассмотрим, как мы это сделали (см. Документ), а также результаты и выводы для Lyft и картографического сообщества.
Дизайн опроса: насколько точна карта?
Измерение всей карты - существует ли дорога, правильно ли снабжена аннотациями, актуальна - просто сложно. Lyft работает более чем на 300 рынках в США и Канаде, от плотных старых городских районов, таких как Нью-Йорк, до крупных пригородных мегаполисов, таких как Феникс или Лос-Анджелес. Чтобы получить достоверную информацию, необходимую для оценки качества карты, мы можем послать геодезиста на каждый перекресток и записать, правильно ли что-то. Бюро переписи населения США делает именно это - фактически, каждые 10 лет оно нанимает столько людей, что в одиночку меняет уровень безработицы. Но этот подход может быть невероятно медленным и дорогим. Нам нужен был план исследования, в котором наше стремление к региональной специфике уравновешивалось стоимостью и материально-технической осуществимостью.
Отбор проб + дистанционное зондирование = выполнимое исследование
Мы знали, что нам нужен подход, основанный на выборке, чтобы сделать это послушным. Но чисто случайная выборка не сработает; отправка людей на случайно выбранные перекрестки по городу займет невероятно много времени. Вместо этого мы обратились к общественному здравоохранению и дистанционному зондированию в поисках решения. Исследователи в области здравоохранения часто сталкиваются с аналогичной проблемой: как отправить ограниченное количество исследователей на дом для оценки распространенности заболевания или результатов для здоровья. Они решают это с помощью кластерной выборки:
- Примеры пространственных единиц, например городского квартала.
- Выборка домохозяйств из этого блока
Этот двухэтапный процесс упрощает жизнь геодезистам. Участник опроса может отправиться в один городской квартал и одновременно посетить несколько домохозяйств, максимально используя информацию, которую они получают за одну поездку. Такой план обследования не так статистически эффективен, как чистая случайная выборка, но недостаток чистоты компенсируется логистической простотой и экономической эффективностью.
Мы скопировали эту методологию и добавили хитрость: дистанционное зондирование. Вместо того, чтобы отправлять геодезистов лично, мы начали сотрудничать с Mapillary (теперь частью Facebook) для сбора высококачественных изображений из наших пространственных образцов. Затем группа кураторов картографических данных Lyft использовала эти изображения, чтобы выяснить, соответствует ли OSM реальному миру.
Имея в руках карту, рассмотренную куратором, стандартные статистические методы дали нам ответ - насколько хорошо было качество OSM на основе выборки и насколько оно варьировалось в зависимости от региона? Пакет опрос для языка статистического программирования R предоставил все инструменты для оценки общенационального и регионального качества на основе нашей схемы выборки. Подробные оценки следуют в конце этого поста и в нашей публичной газете.
Этот процесс отбора проб, быстрого сбора изображений и курирования позволил нам изучить всю Северную Америку за три месяца, завершенных в марте 2020 года.
Выводы: высокая точность карты для 30 городов *
Мы обнаружили, что основные характеристики дорог OpenStreetMap более 95% времени верны по сравнению с тем, что существует в реальном мире. Данные, важные для безопасной навигации, такие как ограничения левого поворота, верны более чем в 85% случаев. В масштабах страны эти оценки точны с точностью до 5% неопределенности выборки. Региональная неопределенность больше варьируется в зависимости от динамики на региональном уровне, что видно на рисунках в конце этого поста.
Как сказано в «Картографировании», совершенство недостижимо; карта устаревает в момент публикации, потому что реальный мир постоянно меняется. Но по состоянию на март 2020 года данные карты OSM показали лишь незначительные отличия от реального мира.
* См. полный список городов на графиках ниже
Выводы
Эти результаты обнадеживают, потому что они показывают, что Lyft работает на карте, которая точно отражает реальность. Это дает нам больше уверенности в том, что мы обычно не прогнозируем маршрут Lyft с недопустимым поворотом или неправильным движением по улице. В то же время он сужает области возможностей.
- OpenStreetMap находится на обслуживании, а этап Садоводство - курирование карты для многих объектов и регионов. Это означает, что возникающие проблемы обычно связаны с недавними изменениями в реальном мире, а не с пробелами в экстенте карты. Расхождения с Groundtruth часто связаны с недавними изменениями, а не с давно не нанесенными на карту функциями. В этом исследовании показано, что 30 городов находятся в режиме обслуживания для отмеченных функций.
- Остаются области для инвестиций, включая указатели на въездах и указатели полос движения в определенных городах. Это полезная информация, которая поможет картографам, в том числе команде Lyft Mapping Curation, направить свои усилия на улучшение карты для всех, кто использует OpenStreetMap. Подобные исследования помогают нам сузить фокус и создать более надежные программы для поиска ошибок.
- Полевые опросы на основе выборки являются быстрыми и менее дорогостоящими, чем наземная перепись. Подход выборки + дистанционное зондирование может быть полезным для дальнейших исследований различных тегов, географических регионов или вариантов использования. Мы надеемся, что другие будут поощрены использовать эти методы.
- Сенсорные сети, сочетающие изображения (например, Mapillary) и телеметрию (например, Lyft), могут улучшить OpenStreetMap безопасным и анонимным образом, обнаруживая ошибки и изменения. Например, см. Как Lyft создает сверхточные карты из карт с открытым исходным кодом и данных в реальном времени. Как хорошо знают картографы, датчики - это ценный инструмент, который каждый может использовать для улучшения карт, и их растущее повсеместное распространение делает улучшения очень доступными.
- Чтобы карта всегда была в актуальном состоянии, нужно найти иголки в стоге сена. Свидетельства, выходящие за рамки этого исследования (например, заглавное изображение), показывают, что сообщество отслеживает строительство, последствия стихийных бедствий и новые изменения (например, новые велосипедные дорожки!) И картирует их по мере их появления.
Следующий пункт назначения
Эти выводы ценны сами по себе - они говорят нам, что Lyft работает на отличной карте. Как продемонстрировал OpenStreetMap, мы никогда не должны недооценивать потенциал коллективного сотрудничества. С каждым редактированием, добавлением, модификацией и обсуждением сообщество редакторов и организаций создавало полную карту североамериканских городов в OpenStreetMap. Поскольку Lyft Mapping продолжает исследования о том, как продолжить совместный вклад в OpenStreetMap, мы будем смотреть дальше, за пределы этих городов - следите за обновлениями!
Если вы хотите участвовать в доработке наших сложных картографических систем, присоединяйтесь к нам!
Полный отчет: 30 городов Северной Америки
Изображения ниже полностью задокументированы в документе: bit.ly/lyftosmqualitystudy
Основы: класс дороги, полосы движения, направленность
Законность: ограничения хода
Ограничения на поворот имеют значение для совместного использования по двум простым причинам: мы не хотим, чтобы водители совершали незаконные повороты, и мы не хотим, чтобы пассажиры могли путешествовать по небезопасным маршрутам. В отличие от дорог, мы не видим их на спутниковых снимках и не можем найти в данных о муниципальных дорогах, публикуемых большинством городов. Снимки с уровня земли, сделанные Мапиллари, оказались критически важными для понимания полноты OSM.
Знать, куда идти: знаки автострады
Ездите безопасно!