От сбора данных до EDA, маркировки и построения сложных моделей машинного обучения для оценки безопасности дорожного движения (с некоторыми из лучших в мире специалистов по данным, инженеров по данным и экспертов по машинному обучению).

«Невероятные изменения происходят в вашей жизни, когда вы решаете взять под свой контроль то, над чем у вас есть власть, вместо того, чтобы жаждать контроля над тем, чего у вас нет.» - Стив Мараболи

И я так и сделал. Я взял под свой контроль то, что могу. Я решил работать над двухмесячным проектом AI с более чем 40 сотрудниками со всего мира.

Мне, будучи студентом бакалавриата, всегда было непросто управлять учебными заведениями с некоторыми внеклассными мероприятиями. Я всегда старался максимально использовать свободное время. Эта изоляция не была исключением. От обучения и изучения машинного обучения до выбора младшего инженера машинного обучения в проекте Компьютерное зрение в Omdena до повышения до инженера по машинному обучению к концу двух месяцев было очень примечательно.

Спасая жизни вместе

Последние два месяца не могли быть более продуктивными, чем совместная работа над проектом по безопасности дорожного движения под девизом #savinglivestogether и работа с одними из лучших инженеров машинного обучения со всего мира. Я рад, что завершил проект AI для безопасности дорожного движения Омдены в сотрудничестве с iRAP. Проект стартовал в середине ноября 2020 года с участием 50 сменщиков по всему миру. 50 #AI сменщиков из 24 стран (33% женщин) объединились, чтобы начать Вызов безопасности дорожного движения с iRAP.

Формулировка проблемы заключалась в предотвращении дорожных аварий и спасении жизней. Сама по себе задача очень увлекла меня, поэтому мне не терпелось приступить к делу.

Наша задача заключалась в том, чтобы составить карту риска аварии на каждой дороге на земле для каждого типа участников дорожного движения; определять дизайн инфраструктуры, скорость и объемные функции, которые влияют на этот риск, и регулярно собирать данные для обеспечения прозрачности, подотчетности, действий и отслеживания производительности.

В рамках проекта основное внимание уделялось анализу данных и их возможностей, извлечению характеристик дороги из существующих данных, составлению карт рисков исторических аварий, аварий, совершенных для каждого участника дорожного движения, составлению карты показателей безопасности и рассмотрению звездного рейтинга. согласно стандартам iRAP. Моя работа заключалась в создании моделей обнаружения объектов с помощью YOLO v3, open CV, Resnet и COCO.

От сбора данных до маркировки

Мне приходилось иметь дело с точностью каждого из них и с тем, как мы можем оптимизировать его, чтобы он соответствовал нашим данным. Я также работал с панорамными изображениями из набора данных tomtom.

TomTom Historical Traffic Stats - это продукт для самообслуживания, который анализирует исторические данные о местоположении и предоставляет информацию о скорости движения, времени в пути и размере выборки в дорожной сети. Он в основном содержал все реальные изображения дороги и движения. Сюда добавлено одно из изображений. Мы выбрали этот набор данных, потому что он содержал LiDAR (обнаружение света и определение дальности), а также панорамные изображения, которые помогли нам проанализировать особенности дороги и освоиться с различными аспектами дороги. которые iRAP принимает во внимание.

Набор данных TomTom не был помечен, и наша команда пометила его в соответствии со стандартами iRAP примерно с 3964 изображениями (10,9 ГБ). Он включал панорамные изображения для ESP (Spain Road Images) и MEX (Mexico Road Images).

Первой и самой большой проблемой с данными TomTom для меня была работа с большими данными и их обработка с помощью Amazon S3, чего я раньше не делал. Я получал хорошую поддержку сообщества, когда сталкивался с любой подобной проблемой. Лучше всего было то, что некоторые из других сотрудников были активны в любое время дня, с которыми я мог связаться.

Я вместе с командой вручную аннотировал изображения, и мы использовали инструмент маркировки (labelImg). Мы завершили аннотирование почти 2К изображений, снятых TomTom. Также у меня была возможность поработать над конвейером проекта с помощью Spell ML.

Spell ML - это платформа для создания проектов машинного обучения и управления ими. Обычно он используется для конвейерной обработки проектов машинного обучения. Наша команда использовала это программное обеспечение для конвейерной обработки работы каждого отдельного человека или небольшой группы, чтобы сделать ее окончательной частью.

Сообщество, помощь и призывы к спринту

У нас также было несколько спринтов кода и данных, в которых все сотрудники, работавшие над одной и той же частью, проводили интерактивную сессию, в которой разрешались сомнения, помогали друг другу и действительно создавали сообщество.

Я особенно хотел бы упомянуть аннотационный спринт, когда все участники, участвующие в этой задаче, участвовали в обсуждении маркировки - программного обеспечения, используемого для аннотирования изображений. Мы разделили изображения между собой и продолжили комментировать их. Этот спринт длился почти 8–10 часов, и каждый мог присоединиться и уйти в соответствии со своим часовым поясом. У нас также было несколько других встреч, на которых все делились своим статусом работы, своими сомнениями и трудностями, с которыми сталкивались в любой момент времени, и помогали друг другу, используя свои самые полные знания.

Как правильно сказала Хелен Келлер,

«В одиночку мы можем сделать так мало; вместе мы можем так много сделать. »

У меня был большой опыт обучения и работы со всеми замечательными разработчиками перемен, которые приложили все свои усилия, чтобы добиться этого. Помимо технических навыков, я значительно улучшил свои коммуникативные навыки. Мне довелось познакомиться со многими новыми и выдающимися учеными по данным по всему миру, и я искренне считаю, что создание друзей, работающих вместе, - это для меня достижение.

Сообщество Омдены было лучшим, о чем я когда-либо мог мечтать.

Мне пришлось общаться со многими создателями перемен, где я узнал и исследовал разные вещи, которые были бы невозможны без поддержки сообщества. Изучение опыта и знаний друг друга - самый важный фактор, когда дело касается построения команды. Лучше всего то, что все сотрудники делились своим опытом и знаниями, очень твердо и позитивно по каждой конкретной задаче. В проекте участвовали такие разные люди из разных регионов мира, но все они были сплочены как одна команда.

В заключение я бы сказал, что мне очень понравилось быть частью этой команды, и я понял, что создание сообщества так же важно, как и изучение технических вещей, чтобы сделать командную работу успешной!

#Community #aiforgood # безопасность дорожного движения #computervision #savinglivestogether # 3starsorbetter

Присоединяйтесь к будущим проектам Omdena здесь