Избранные статьи/новости на этой неделе

— — — — — — — — — — — — — — — — — — –

В следующих разделах я представлю различные статьи и документы не только по вышеуказанному содержанию, но и по следующим пяти темам.

  1. Избранные статьи/новости на этой неделе
  2. Пример использования машинного обучения
  3. Документы
  4. Статьи, связанные с технологией машинного обучения

— — — — — — — — — — — — — — — — — — –

1. Избранные статьи/новости на этой неделе

Изучение ViT, скрыв изображение маской и восстановив егоarxiv.org

[2111.06377] Маскированные автоэнкодеры — это масштабируемые обучающиеся зрительного восприятия
Они предлагают MAE (маскированные автоэнкодеры), которые могут достигать 87,8 % только в ImageNet, маскируя изображения и восстанавливая их с помощью обучения с самоконтролем, даже несмотря на то, что в нем используются модели на основе ViT. Предлагаемый метод скрывает большую часть изображения (например, 75%) и учится восстанавливать его и показывает более высокую производительность, чем существующие методы обучения с самоконтролем, такие как DINO и MoCo v3.

Модель, сочетающая авторегрессионную и диффузионную моделиarxiv.org

[2110.02037] Авторегрессионные диффузионные модели
Предлагаемые ARDM (авторегрессивные диффузионные модели), представляющие собой комбинацию авторегрессионной и диффузионной моделей. В отличие от авторегрессионных моделей, которые последовательно регрессируют от верхнего левого угла к нижнему правому, ARDM обучаются воспроизводить случайно выбранные точки из входных данных, что может быть похоже на модели маскированного языка BERT.

— — — — — — — — — — — — — — — — — — –

2. Пример использования машинного обучения

Защита сексуальных меньшинств с помощью преобразования голоса с помощью Deep Fakewww.wired.com



Трансгендеров могут преследовать за несоответствие голоса и пола, но использование Deep Fake для преобразования голоса может предотвратить такое преследование. Это облегчит сексуальным меньшинствам участие в онлайн-сообществе, которое им было трудно сделать.

Преодоление языковых барьеров с помощью многоязычных моделей чат-ботовventurebeat.com



Это введение в чат-бот, разработанный Moveworks, который использует многоязычную языковую модель. В глобальной компании это означает, что люди, говорящие на разных языках, могут получать поддержку без необходимости создавать центры поддержки в разных странах.

— — — — — — — — — — — — — — — — — — –

3. Документы по машинному обучению

Проверка табличных данных с помощью различных моделей глубокого обученияarxiv.org

[2106.11959] Revisiting Deep Learning Models for Tabular Data
Исследование, в ходе которого тестировались различные модели глубокого обучения на табличных данных, показало, что модели на основе ResNet надежны и что FT-Transformer, который токенизирует функции, является хорошей базой, но не значительно превосходит методы, основанные на GBDT.

Совет-адаптер для быстрого обучения без обученияarxiv.org

[2111.03930] Tip-Adapter: CLIP-адаптер, не требующий обучения, для лучшего моделирования зрительного языка
Усовершенствовав CLIP-Adapter, они предложили Tip-Adapter, который выполняет обучение за несколько шагов без обновления параметров. Сходство между тестовым изображением и набором данных Few-shot измеряется, и выходные данные категории основаны на сходстве и текстовой информации.

Метод, который можно напрямую применить к существующим методам обнаружения объектов для повышения точности. — arxiv.org

[2111.03056] Начальная загрузка вашего детектора объектов с помощью смешанного обучения
Предлагается смешанное обучение, которое заменяет существующие метки GT прогнозированием с высокой достоверностью при обнаружении объектов и контролирует степень увеличения данных в зависимости от сложности выборки. Его можно напрямую применять к существующим методам обнаружения объектов для повышения точности.

Исправление является причиной нестабильности обучения в ViT. — arxiv.org

[2106.14881] Ранние свертки помогают трансформерам видеть лучше
ViT менее стабилен в обучении, чем CNN, но авторы утверждали, что причиной этого является исправление начального слоя. Заменив первоначальное исправление 16x16 обычным Conv в сочетании с 3x3 Conv и т. д., ViT становится устойчивым к колебаниям скорости обучения, быстрее сходится и превосходит модель SotA CNN.

Дополнение данных AugMax для изучения разнообразия и образцов высокой сложности. — arxiv.org

[2110.13771] AugMax: состязательная композиция случайных дополнений для надежного обучения
Предлагаемый AugMax, который ищет более мощные дополнения данных, используя параметры обучения для смешивания дополнений данных. DuBIN также предлагается разделить разнообразие на уровне отдельных экземпляров и пакетов с помощью Instance Norm и BatchNorm, потому что это слишком сложно для изучения. Авторы утверждают, что он может изучать разнообразие и образцы высокой сложности.

Сравнение надежности CNN и Transformerarxiv.org

[2111.05464] Являются ли Transformers более надежными, чем CNN?
Transformer считается более надежным, чем CNN, но когда методы обучения, такие как обучающие данные и аугментация данных, согласованы, CNN может достичь того же уровня устойчивости к атакам злоумышленников, что и Трансформер. Однако для данных с выбросами, таких как ImageNet-A и -C, Transformer оказался сильнее.

— — — — — — — — — — — — — — — — — — –

4. Технические статьи

На что обратить внимание в проекте с использованием методов науки о данныхtowardsdatascience.com



Статья о том, на что следует обратить внимание в проекте с использованием методов науки о данных. В нем обсуждаются неорганизованные данные и конфликты с заинтересованными сторонами.

— — — — — — — — — — — — — — — — — — –

🌟Выкладываю еженедельные рассылки! Пожалуйста, подпишитесь!🌟



— — — — — — — — — — — — — — — — — — –

Другие блоги









— — — — — — — — — — — — — — — — — — –

Обо мне

Инженер-технолог/Инженер по машинному обучению/Ученый по данным/Магистр физики/ http://github.com/AkiraTOSEI/

Профиль LinkedIn

Твиттер, я публикую бумажный комментарий из одного предложения.