Мы только что завершили Computer Vision Meetup 20 июля 2023 года, и если вы пропустили его или хотите вернуться, вот краткий обзор! В этом сообщении блога вы найдете записи воспроизведения, основные моменты презентаций и вопросы и ответы, а также расписание предстоящих встреч, чтобы вы могли присоединиться к нам на будущем мероприятии.

Во-первых, спасибо за голосование за вашу любимую благотворительную организацию!

Вместо халявы мы дали участникам Meetup возможность помочь направить пожертвование в размере 200 долларов на благотворительные цели. Было двустороннее равенство по наибольшему количеству полученных голосов, поэтому мы будем делать пожертвования в размере 100 долларов США каждой из этих организаций!

Drink Local Drink Tap — международная некоммерческая организация, занимающаяся решением проблем справедливости и качества воды посредством образования, адвокации и доступных, безопасных источников чистой воды.

Центр развития образования продвигает долгосрочные решения самых насущных проблем в области образования, здравоохранения и рабочей силы по всему миру.

Пропустили встречу? Без проблем. Вот воспроизведение и выдержки из разговора с мероприятия.

DreamSim: изучение новых аспектов визуального сходства с человеком с использованием синтетических данных

Текущие метрики сходства восприятия сравнивают изображения с точки зрения их цветов и текстур низкого уровня, но не могут зафиксировать сходства среднего уровня в макете изображения, позе объекта и семантическом содержании. Чтобы восполнить этот пробел, мы представляем NIGHTS, набор данных синтетических изображений, помеченный человеческими суждениями о сходстве, и DreamSim, метрику, настроенную для лучшего соответствия человеческому восприятию. Мы анализируем, как на нашу метрику влияют различные визуальные атрибуты, и показываем, что она превосходит ранее изученные метрики и последние модели большого зрения в задачах поиска и реконструкции.

Стефани Фу недавно окончила Массачусетский технологический институт со степенью бакалавра в области компьютерных наук и музыки, а также со степенью магистра компьютерных наук. Ее исследовательские интересы включают компьютерное зрение, репрезентативное обучение и связи между человеческим и машинным восприятием.

Шобхита Сундарам — аспирант Массачусетского технологического института в области компьютерных наук. Она интересуется компьютерным зрением, особенно генеративными моделями и репрезентативным обучением. Ранее она получила степень бакалавра компьютерных наук и математики в Массачусетском технологическом институте, занимаясь исследованием биологических моделей компьютерного зрения.

Нетанель Тамир учится в магистратуре Научного института Вейцмана, изучает информатику. Он интересуется компьютерным зрением, изучением репрезентаций и психофизикой.

Ссылки на ресурсы

Набор синтетических данных NIGHTS и демонстрация FiftyOne

В этой импровизированной демонстрации мы изучим NIGHTS, набор данных синтетических изображений, помеченных суждениями о сходстве с человеком, с использованием набора инструментов компьютерного зрения FiftyOne с открытым исходным кодом.

Джейкоб Маркс — инженер по машинному обучению и разработчик-евангелист в Voxel51.

Ссылки на ресурсы

MARLIN: Маскированный автоэнкодер для видео с изображением лица Обучение Обучение

В этом докладе предлагается подход с самостоятельным наблюдением для изучения универсальных представлений лица из видео, которые можно использовать в различных задачах анализа лица, таких как распознавание атрибутов лица (FAR), распознавание выражения лица (FER), обнаружение DeepFake (DFD) и губ. Синхронизация (LS). Предлагаемый нами фреймворк, названный MARLIN, представляет собой автокодировщик лицевого видео с масками, который изучает высоконадежные и универсальные встраивания лиц из широко доступных неаннотированных видео лиц, просканированных в Интернете. В качестве сложной вспомогательной задачи MARLIN реконструирует пространственно-временные детали лица из плотно замаскированных областей лица, которые в основном включают глаза, нос, рот, губы и кожу, чтобы зафиксировать локальные и глобальные аспекты, которые, в свою очередь, помогают в кодировании общих и передаваемых данных. функции. Благодаря множеству экспериментов с различными последующими задачами мы продемонстрировали, что MARLIN является отличным кодировщиком видео лиц, а также экстрактором признаков, который стабильно хорошо работает в различных последующих задачах, включая FAR (прирост 1,13% по сравнению с контролируемым тестом), FER (2,64). % прироста по сравнению с неконтролируемым эталоном), DFD (1,86% прироста по сравнению с неконтролируемым эталоном), LS (29,36% прироста для начального расстояния Фреше) и даже в режиме с низким объемом данных.

Чжиси Цай является доктором философии. студентка кафедры науки о данных и искусственного интеллекта ИТ-факультета Университета Монаша под руководством доктора Мунавара Хаята, доктора Калина Стефанова и доктора Абхинава Дхалла.

Ссылки на ресурсы

Раскрытие потенциала визуальных данных: векторные базы данных в компьютерном зрении

Откройте для себя революционную роль векторных баз данных в приложениях компьютерного зрения. Эти специализированные базы данных отлично справляются с обработкой неструктурированных визуальных данных благодаря надежной поддержке встраивания и молниеносного поиска по сходству. Присоединяйтесь к нам, пока мы изучаем передовые алгоритмы индексирования и демонстрируем реальные примеры в сфере здравоохранения, розничной торговли, финансов и т. д., используя движок FiftyOne в сочетании с векторной базой данных Milvus. Посмотрите, как векторные базы данных раскрывают весь потенциал ваших визуальных данных.

Филип Халтмайер — инженер-программист в Zilliz, работающий как над программным обеспечением, так и над развитием сообщества. Его вклад в основном связан с проектами Milvus и Towhee, помогая разрабатывать оба приложения и помогая расширять их соответствующие базы пользователей посредством взаимодействия с клиентами, интеграции и технических переговоров.

Ссылки на ресурсы

Присоединяйтесь к встрече по компьютерному зрению!

Менее чем за год количество участников Computer Vision Meetup выросло почти до 5000 участников! Цель Meetups — объединить сообщества специалистов по данным, инженеров по машинному обучению и энтузиастов открытого исходного кода, которые хотят поделиться и расширить свои знания в области компьютерного зрения и дополнительных технологий.

Присоединяйтесь к одному из 13 мест Meetup, ближайших к вашему часовому поясу.

У нас уже есть интересные спикеры, которые записались на следующие несколько месяцев! Станьте участником Ближайшей к вам встречи Computer Vision Meetup, затем зарегистрируйтесь в Zoom.

Что дальше?

Далее, 10 августа в 10:00 по тихоокеанскому времени, у нас будет отличный состав спикеров, в том числе:

  • Neural Congealing: сопоставление изображений с совместным семантическим атласом — Долев Офри-Амар из Научного института Вейцмана
  • Развитие персонализированной медицины и лучевой терапии с помощью компьютерного зрения с искусственным интеллектом — Роушанак Рахмат, доктор философии, исследователь искусственного интеллекта
  • Практический подход к глубокому обучению для компьютерного зрения с помощью Tensorflow 2 —Folefac Martins из Vinsight и инструктор по машинному обучению

Зарегистрироваться на Zoom здесь. Вы можете найти полное расписание предстоящих встреч на странице событий Voxel51.

Втягиваться!

Есть много способов принять участие в встречах Computer Vision Meetups. Обратитесь, если вы идентифицируете себя с любым из них:

  • Вы хотите выступить на предстоящей встрече
  • У вас есть физическое пространство для собраний в одном из мест Meetup, и вы хотели бы сделать его доступным для Meetup.
  • Вы хотите стать соорганизатором Meetup
  • Вы хотите стать соспонсором Meetup

Свяжитесь со мной, соорганизатором Meetup Джимми Герреро на Meetup.com, или свяжитесь со мной через LinkedIn, чтобы обсудить, как подключиться.

Сеть Computer Vision Meetup спонсируется , компанией, разработавшей набор инструментов компьютерного зрения с открытым исходным кодом. FiftyOne позволяет группам специалистов по обработке и анализу данных повысить производительность своих моделей компьютерного зрения, помогая им выбирать высококачественные наборы данных, оценивать модели, находить ошибки, визуализировать встраивания и быстрее приступать к работе. Легко начать, всего за несколько минут.

Первоначально опубликовано на https://voxel51.com 20 июля 2023 г.