2018 год был амбициозным для MoonVision. Мы многого добились в распространении информации, разработке замечательных технологий и привлечении новых людей, работающих с нами над машинным зрением нового уровня.

Для тех, кто интересуется нашим путешествием, я хотел бы поделиться личными моментами и небольшим взглядом на 2019 год.

Охват

В начале прошлого года Торговая палата Австрии проделала большую работу по организации AAIC. В дополнение к обсуждению достоинств и вариантов использования кластеризации я провел семинар на тему Помимо классификации изображений: как работают обнаружение, сегментация и сегментация экземпляров. Цель состояла в том, чтобы обучить экспертов из различных областей современным методам компьютерного зрения, в частности тому, как они соотносятся с проблемой автоматизации. На этом этапе я также хотел бы поблагодарить enliteAI, который очень хорошо обобщил ландшафт поставщиков технологий!

В этом году ECCV в Мюнхене была одной из самых интересных конференций. Было полезно обсудить детали с авторами, чьи работы мы строим. Не менее важными были дискуссии с техническими скаутами из OEM-производителей и крупных компаний. К этому моменту уже было ясно, что спрос на беспилотные автомобили достиг пика, что также помогло получить приличный приток заинтересованных талантов.

На VISION 2018 в Штутгарте мы не только познакомились с новыми клиентами и партнерами, особенно в области оборудования для получения изображений. В целом, VISION действительно уникален тем, что объединяет самых важных мировых поставщиков в одном месте. Мы уже с нетерпением ждем следующего.

В общем, мы всегда чему-то учились, будь то регион DACH, Варшава и даже Силиконовая долина. Наша информационно-пропагандистская деятельность имела решающее значение для получения информации и уверенности в правильном решении проблем компьютерного зрения, например, путем решения проблем, которые обычно игнорируются в академических исследованиях или конкурирующих подходах.

Технологии

Для решения сложных инспекционных задач вам понадобятся три ингредиента:

  • Передача ноу-хау от экспертов в машинное зрение
  • Постоянно учитесь на этом входе
  • Интеграция с машинами и программным обеспечением в цехе

В какой-то момент нас попросили согласовать сквозную систему с лучшими практиками обеспечения качества. Это представляет собой интересную задачу, поскольку теперь речь идет не только о «проверке качества на основе оборудования» (которую можно измерить с помощью некоторых установленных показателей), но и «проверке качества процесса», которая включает входные данные. от нескольких экспертов. Таким образом, мы разработали строгий подход к управлению данными, который может сопоставлять показатели соответствия с развивающейся многопользовательской историей.

Наряду с этим мы достигли новых высот в плане эффективности данных. В крайнем случае это означает обнаружение нового типа объекта только с одним примером. Мы достигаем этого, разбивая проблемы обнаружения на дерево решений, тем самым объединяя лучшее из глубокого обучения и композиции программы. Для реализации таких алгоритмов мы используем передовые инструменты, такие как PyTorch. Например, мы поддерживаем ветвь torchvision, которая позволяет выполнять скомпилированные операции выравнивания ROI (полезные для составления различных задач логического вывода) с последней версией PyTorch. Я очень рад внести свой вклад в более сложные и перспективные инструменты. Для тех, кто интересуется современными инструментами, я рекомендую посмотреть очень информативные доклады конференции по выпуску PyTorch 1.0!

Конец года ознаменовался интеграцией в производственные системы. Это означает две вещи. Во-первых, модели, разработанные в облаке, должны работать на ограниченном оборудовании. Поэтому мы расширили наш стек программного обеспечения за счет автономного логического вывода и оптимизации для конкретных платформ. Для определенного оборудования это дало нам почти 20-кратный прирост производительности. Во-вторых, необходимо было увеличить количество поддерживаемых источников получения изображений. Поэтому теперь мы поддерживаем стандарт GeniCam. Этот стандарт, впервые выпущенный в 2006 году, позволяет настраивать и получать изображения со многих промышленных камер, таких как Basler, Lucid, FLIR, Matrix Vision. и так далее.

Люди

Мы очень рады, что в этом году мы заняли самые важные должности в области инженерии данных, науки о данных и разработки программного обеспечения с полным стеком. Также я считаю справедливым назвать нас самой разнообразной командой в большом радиусе, которой я искренне благодарен за сотрудничество. Это заняло много времени и экспериментов, но теперь я думаю, что объединенный набор навыков имеет смысл.

По мере роста команды и проектов рос и наш инженерный стек. Мы увеличили покрытие тестами как на дрожжах, приняли git-flow в качестве прочной основы для управления версиями и постоянно увеличивали глубину нашего конвейера сборки. Одно важное кредо MoonVision — учиться друг у друга. Поэтому мы призываем членов команды представить свои идеи. Например, наш ведущий инженер данных инициировал контейнерное развертывание и масштабирование, что делает нас более продуктивными и заслуживает того, чтобы поделиться ими внутри компании и на PyDays.at!

Более того, мы не ограничиваем себя и другими способами и время от времени ищем необычные вызовы. Поэтому мы приняли участие в паре хакатонов с хорошей степенью успеха. Это определенно то, что мы продолжим в 2019 году.

И последнее, но не менее важное: я хотел бы приветствовать Карлоса в качестве нашего нового инженера-исследователя!

Перспектива

В 2019 году мы продолжим нашу миссию по автоматизации визуального контроля.

Одним из ключевых факторов, обеспечивающих это в масштабе, является эффективность данных. По сути, есть две категории повышения эффективности данных: перенос ноу-хау из дифференцируемых программ, которые решали аналогичную задачу, и использование эффективных априорных алгоритмов обнаружения, специфичных для данной задачи (или мета-априорных, как их придумал Бенжио, см. Чаннен и др.). др. 2018» для недавнего обзора неконтролируемого обучения).

Другим ключевым фактором является улучшение интерфейса между людьми-экспертами и машинами для получения достоверной информации. Пользователи выиграют, поскольку мы выпускаем функции, которые дополнительно автоматизируют этапы обработки между необработанным видеопотоком и высокоточными данными обучения, такими как расширенная кластеризация, активное обучение и немедленная обратная связь в пользовательском интерфейсе.

Чтобы реализовать это, мы ищем подходящих людей, которые присоединятся к нам в 2019 году, что приводит меня к последнему Плюсу: если вы старший исследователь компьютерного зренияили разработчик приложения, позвоните мне!