Итоги встречи по компьютерному зрению

Мы только что завершили Computer Vision Meetup 20 июля 2023 года, и если вы пропустили его или хотите вернуться, вот краткий обзор! В этом сообщении блога вы найдете записи воспроизведения, основные моменты презентаций и вопросы и ответы, а также расписание предстоящих встреч, чтобы вы могли присоединиться к нам на будущем мероприятии.

Во-первых, спасибо за голосование за вашу любимую благотворительную организацию!

Вместо халявы мы дали участникам Meetup возможность помочь направить пожертвование в размере 200 долларов на благотворительные цели. Было двустороннее равенство по наибольшему количеству полученных голосов, поэтому мы будем делать пожертвования в размере 100 долларов США каждой из этих организаций!

Drink Local Drink Tap — международная некоммерческая организация, занимающаяся решением проблем справедливости и качества воды посредством образования, адвокации и доступных, безопасных источников чистой воды.

Центр развития образования продвигает долгосрочные решения самых насущных проблем в области образования, здравоохранения и рабочей силы по всему миру.

Пропустили встречу? Без проблем. Вот воспроизведение и выдержки из разговора с мероприятия.

DreamSim: изучение новых аспектов визуального сходства с человеком с использованием синтетических данных

Текущие метрики сходства восприятия сравнивают изображения с точки зрения их цветов и текстур низкого уровня, но не могут зафиксировать сходства среднего уровня в макете изображения, позе объекта и семантическом содержании. Чтобы восполнить этот пробел, мы представляем NIGHTS, набор данных синтетических изображений, помеченный человеческими суждениями о сходстве, и DreamSim, метрику, настроенную для лучшего соответствия человеческому восприятию. Мы анализируем, как на нашу метрику влияют различные визуальные атрибуты, и показываем, что она превосходит ранее изученные метрики и последние модели большого зрения в задачах поиска и реконструкции.

Стефани Фу недавно окончила Массачусетский технологический институт со степенью бакалавра в области компьютерных наук и музыки, а также со степенью магистра компьютерных наук. Ее исследовательские интересы включают компьютерное зрение, репрезентативное обучение и связи между человеческим и машинным восприятием.

Шобхита Сундарам — аспирант Массачусетского технологического института в области компьютерных наук. Она интересуется компьютерным зрением, особенно генеративными моделями и репрезентативным обучением. Ранее она получила степень бакалавра компьютерных наук и математики в Массачусетском технологическом институте, занимаясь исследованием биологических моделей компьютерного зрения.

Нетанель Тамир учится в магистратуре Научного института Вейцмана, изучает информатику. Он интересуется компьютерным зрением, изучением репрезентаций и психофизикой.

Ссылки на ресурсы

Набор синтетических данных NIGHTS и демонстрация FiftyOne

В этой импровизированной демонстрации мы изучим NIGHTS, набор данных синтетических изображений, помеченных суждениями о сходстве с человеком, с использованием набора инструментов компьютерного зрения FiftyOne с открытым исходным кодом.

Джейкоб Маркс — инженер по машинному обучению и разработчик-евангелист в Voxel51.

Ссылки на ресурсы

Исследуйте НОЧИ прямо сейчас мгновенно в вашем браузере!
Ждите подробного обзора блога, который скоро появится

MARLIN: Маскированный автоэнкодер для видео с изображением лица Обучение Обучение

В этом докладе предлагается подход с самостоятельным наблюдением для изучения универсальных представлений лица из видео, которые можно использовать в различных задачах анализа лица, таких как распознавание атрибутов лица (FAR), распознавание выражения лица (FER), обнаружение DeepFake (DFD) и губ. Синхронизация (LS). Предлагаемый нами фреймворк, названный MARLIN, представляет собой автокодировщик лицевого видео с масками, который изучает высоконадежные и универсальные встраивания лиц из широко доступных неаннотированных видео лиц, просканированных в Интернете. В качестве сложной вспомогательной задачи MARLIN реконструирует пространственно-временные детали лица из плотно замаскированных областей лица, которые в основном включают глаза, нос, рот, губы и кожу, чтобы зафиксировать локальные и глобальные аспекты, которые, в свою очередь, помогают в кодировании общих и передаваемых данных. функции. Благодаря множеству экспериментов с различными последующими задачами мы продемонстрировали, что MARLIN является отличным кодировщиком видео лиц, а также экстрактором признаков, который стабильно хорошо работает в различных последующих задачах, включая FAR (прирост 1,13% по сравнению с контролируемым тестом), FER (2,64). % прироста по сравнению с неконтролируемым эталоном), DFD (1,86% прироста по сравнению с неконтролируемым эталоном), LS (29,36% прироста для начального расстояния Фреше) и даже в режиме с низким объемом данных.

Чжиси Цай является доктором философии. студентка кафедры науки о данных и искусственного интеллекта ИТ-факультета Университета Монаша под руководством доктора Мунавара Хаята, доктора Калина Стефанова и доктора Абхинава Дхалла.

Ссылки на ресурсы

Раскрытие потенциала визуальных данных: векторные базы данных в компьютерном зрении

Откройте для себя революционную роль векторных баз данных в приложениях компьютерного зрения. Эти специализированные базы данных отлично справляются с обработкой неструктурированных визуальных данных благодаря надежной поддержке встраивания и молниеносного поиска по сходству. Присоединяйтесь к нам, пока мы изучаем передовые алгоритмы индексирования и демонстрируем реальные примеры в сфере здравоохранения, розничной торговли, финансов и т. д., используя движок FiftyOne в сочетании с векторной базой данных Milvus. Посмотрите, как векторные базы данных раскрывают весь потенциал ваших визуальных данных.

Филип Халтмайер — инженер-программист в Zilliz, работающий как над программным обеспечением, так и над развитием сообщества. Его вклад в основном связан с проектами Milvus и Towhee, помогая разрабатывать оба приложения и помогая расширять их соответствующие базы пользователей посредством взаимодействия с клиентами, интеграции и технических переговоров.

Ссылки на ресурсы

Присоединяйтесь к встрече по компьютерному зрению!

Менее чем за год количество участников Computer Vision Meetup выросло почти до 5000 участников! Цель Meetups — объединить сообщества специалистов по данным, инженеров по машинному обучению и энтузиастов открытого исходного кода, которые хотят поделиться и расширить свои знания в области компьютерного зрения и дополнительных технологий.

Присоединяйтесь к одному из 13 мест Meetup, ближайших к вашему часовому поясу.

У нас уже есть интересные спикеры, которые записались на следующие несколько месяцев! Станьте участником Ближайшей к вам встречи Computer Vision Meetup, затем зарегистрируйтесь в Zoom.

Что дальше?

Далее, 10 августа в 10:00 по тихоокеанскому времени, у нас будет отличный состав спикеров, в том числе:

Neural Congealing: сопоставление изображений с совместным семантическим атласом — Долев Офри-Амар из Научного института Вейцмана
Развитие персонализированной медицины и лучевой терапии с помощью компьютерного зрения с искусственным интеллектом — Роушанак Рахмат, доктор философии, исследователь искусственного интеллекта
Практический подход к глубокому обучению для компьютерного зрения с помощью Tensorflow 2 —Folefac Martins из Vinsight и инструктор по машинному обучению

Зарегистрироваться на Zoom здесь. Вы можете найти полное расписание предстоящих встреч на странице событий Voxel51.

Втягиваться!

Есть много способов принять участие в встречах Computer Vision Meetups. Обратитесь, если вы идентифицируете себя с любым из них:

Вы хотите выступить на предстоящей встрече
У вас есть физическое пространство для собраний в одном из мест Meetup, и вы хотели бы сделать его доступным для Meetup.
Вы хотите стать соорганизатором Meetup
Вы хотите стать соспонсором Meetup

Свяжитесь со мной, соорганизатором Meetup Джимми Герреро на Meetup.com, или свяжитесь со мной через LinkedIn, чтобы обсудить, как подключиться.

Сеть Computer Vision Meetup спонсируется , компанией, разработавшей набор инструментов компьютерного зрения с открытым исходным кодом. FiftyOne позволяет группам специалистов по обработке и анализу данных повысить производительность своих моделей компьютерного зрения, помогая им выбирать высококачественные наборы данных, оценивать модели, находить ошибки, визуализировать встраивания и быстрее приступать к работе. Легко начать, всего за несколько минут.

Первоначально опубликовано на https://voxel51.com 20 июля 2023 г.

Итоги встречи по компьютерному зрению — 20 июля 2023 г.

Во-первых, спасибо за голосование за вашу любимую благотворительную организацию!

DreamSim: изучение новых аспектов визуального сходства с человеком с использованием синтетических данных

Ссылки на ресурсы

Набор синтетических данных NIGHTS и демонстрация FiftyOne

Ссылки на ресурсы

MARLIN: Маскированный автоэнкодер для видео с изображением лица Обучение Обучение

Ссылки на ресурсы

Раскрытие потенциала визуальных данных: векторные базы данных в компьютерном зрении

Ссылки на ресурсы

Присоединяйтесь к встрече по компьютерному зрению!

Что дальше?

Втягиваться!

Вопросы по теме