ТВК №7

самые современные обновления (SOTA) за 12–18 сентября 2022 г.

Обновления SOTA с 12 по 18 сентября 2022 г.

Обучение с шумными ярлыками
Полуконтролируемая классификация изображений
Адаптация домена
Классификация изображений по нескольким кадрам

Этот пост представляет собой объединение ежедневных постов в Твиттере, отслеживающих изменения SOTA.

Для этих задач также доступен официальный выпуск кода (в большинстве случаев с предварительно обученными моделями).‌

Особое обновление на этой неделе

‌Мы выпустили пару приложений для удобного сравнения моделей для задач сходство предложений и семантический поиск. Приложения упрощают сравнение нескольких моделей в одном интерфейсе. Мы можем сравнить как модель SOTA, так и популярные модели (> 500 тысяч загрузок) на Huggingface. Мы можем либо загрузить собственный файл (до 100 предложений), либо выбрать один из предоставленных примеров файлов. Приложение сходства предложений позволяет сделать любую строку в файле основным предложением для сравнения с другими предложениями в файле. Результаты обоих приложений можно загрузить для дальнейшего анализа.‌

‌№1 в обучении с зашумленными метками в 4 наборах данных семейства CIFAR‌

‌

Статья: ProMix: Борьба с шумом этикетки за счет максимального использования чистых проб

Отправлено 22 июля 2022 г. Код обновлен 5 июля 2022 г.

Примечания. В этом документе представлена новая схема обучения шумным меткам, которая пытается максимально использовать чистые образцы для повышения производительности. Метод сопоставленного высоконадежного выбора выбирает те примеры, которые имеют высокую достоверность и совпадающий прогноз с заданными метками.

Код: Ссылка на Github

Название модели:ProMix

Лицензия: на сегодняшний день нет

Ссылка на демонстрационную страницу? Нет на сегодняшний день

‌№1 в полуконтролируемой классификации изображений по 2 наборам данных CIFAR

‌

Статья: Контрастное полуконтролируемое обучение с учетом классов

Отправлено 4 марта 2022 г. (v1), последняя редакция — 9 сентября 2022 г. (v3). Код обновлен 9 сентября 2022 г.

Примечания. В документе предлагается общий метод, который помогает улучшить качество псевдометки и повысить надежность модели в реальных условиях. Вместо того, чтобы рассматривать данные реального мира как объединенный набор, метод отдельно обрабатывает надежные данные в распределении с кластеризацией по классам для смешивания с последующими задачами и зашумленными данными вне распределения с сопоставлением изображений для лучшего обобщения.

Код: Ссылка на Github

Название модели:CCSSL(FixMatch)

Ссылки на модели. Модели, которые еще не выпущены

Лицензия: некоммерческое использование.

Ссылка на демонстрационную страницу? Нет на сегодняшний день

‌№1 в адаптации домена на ImageCLEF-DA и топ-10 в 3 других наборах данных‌

‌

Документ: повторное использование классификатора для конкретной задачи в качестве дискриминатора: адаптация состязательного домена без дискриминатора

Отправлено 8 апреля 2022 г. Последний раз код обновлялся 14 сентября 2022 г.

Примечания. В этом документе предлагается состязательная парадигма в форме состязательной обучающей сети без дискриминатора (DALN), в которой классификатор категорий повторно используется в качестве дискриминатора, что обеспечивает явное выравнивание предметной области и различение категорий посредством единая цель, позволяющая модели использовать прогнозируемую дискриминационную информацию для достаточного выравнивания признаков.

Код: Ссылка на Github

Название модели:MCC+NWD

Оценка (↑): 90,7 (Предыдущая: 90,4)

Δ: 0,3 (Показатель: точность)

Ссылки на модели. Модель еще не выпущена

Лицензия: нет в списке

Ссылка на демонстрационную страницу? Нет на сегодняшний день‌

‌№1 в классификации изображений с несколькими кадрами в наборе метаданных‌

‌

Статья: Расширение границ простых конвейеров для обучения за несколько шагов: внешние данные и точная настройка имеют значение

Отправлено 15 апреля 2022 г. Последний раз код обновлялся 8 июня 2022 г.

Примечания. В этом документе предлагается конвейер для более реалистичных и практичных настроек классификации изображений с несколькими кадрами. В нем рассматривается обучение за несколько шагов с точки зрения архитектуры нейронной сети, а также трехэтапный конвейер обновлений сети при различных источниках данных.

Код: Ссылка на Github

Название модели:P›M›F

Оценка (↑):84,75 (предыдущая:78,07)

Δ: 6,68 (показатель: точность)

Ссылки на модели. Модель еще не выпущена

Лицензия: нет в списке

Ссылка на демонстрационную страницу? Нет на сегодняшний день‌

‌№1 в классификации изображений с несколькими кадрами на CIFAR-FS 5-way (5-shot)

‌

Документ: Преобразование самооптимальной транспортной функции

Отправлено 6 апреля 2022 г. Последний раз код обновлялся 28 августа 2022 г.

Примечания. В этом документе предпринята попытка улучшить набор функций экземпляра данных, чтобы упростить последующее сопоставление или группировку связанных задач. Преобразованный набор кодирует богатое представление отношений высокого порядка между объектами экземпляра. Расстояния между преобразованными объектами отражают их прямое исходное сходство и их соглашение с третьей стороной относительно сходства с другими объектами в наборе.

Код: Ссылка на Github

Название модели:SOT (трансдуктивный)

Оценка (↑): 93,83 (Предыдущая: 92,2)

Δ: 0,63 (показатель: точность)

Ссылки на модели. Модели в github link

Лицензия: нет в списке

Ссылка на демонстрационную страницу? Нет на сегодняшний день

‌№1 в классификации изображений с несколькими снимками в многоуровневой системе ImageNet 5-way (5-shot)

‌

Документ: Обучение суррогатов атрибутов и объединение спектральных токенов в трансформаторах для обучения за несколько шагов

Отправлено 17 марта 2022 г. Последний раз код обновлялся 15 августа 2022 г.

Примечания. В этом документе представлены новые преобразователи с иерархическим каскадированием, которые могут повысить эффективность данных за счет изучения суррогатов атрибутов и объединения спектральных токенов. В этой статье рассматривается недостаток преобразователей зрения, когда нет достаточного количества данных — он застревает в переоснащении и показывает низкую производительность. Для повышения эффективности данных в документе предлагаются иерархически каскадные преобразователи, которые используют внутренние структуры изображения посредством объединения спектральных токенов и оптимизируют обучаемые параметры с помощью скрытых суррогатов атрибутов.

Код: Ссылка на Github

Название модели:HCTransformers

Оценка (↑): 91,72 (Предыдущая: 91,09)

Δ: 0,63 (показатель: точность)

Ссылки на модели. Модели в github link

Лицензия: лицензия Apache, дающая разрешение на коммерческое использование.

Ссылка на демонстрационную страницу? Нет на сегодняшний день‌

ТВК №7

Вопросы по теме