Неделя 24, 2021 (13 июня)

Избранные статьи/новости на этой неделе.

Машинное обучение в реальном мире

Документы

  • Есть две статьи о глубоком обучении табличных данных. Один показывает превосходство глубокого обучения, а другой — GBDT, но я думаю, что глубокое обучение также проникает в табличные данные, причем некоторые из лучших победителей Kaggle используют Transformer.

— — — — — — — — — — — — — — — — — — –

В следующих разделах я представлю различные статьи и документы не только по вышеуказанному содержанию, но и по следующим пяти темам.

  1. Избранные статьи/новости на этой неделе
  2. Пример использования машинного обучения
  3. Документы
  4. Статьи, связанные с технологией машинного обучения
  5. Другие темы

— — — — — — — — — — — — — — — — — — –

1. Избранные статьи/новости на этой неделе

Данные часто игнорируются, но они очень важны

[«Все хотят, чтобы работала модель, а не данные»: Каскады данных в ИИ с высокими ставками — исследование Google]
В исследованиях ИИ данные представляют значительный риск для оценки и развертывания моделей: 92 % Практики ИИ испытывают такие кризисы, вызванные данными, однако на международных конференциях преобладает улучшение моделей, а исследования природы данных остаются в центре внимания.

Модель, которая может выполнять множество задач, используя изображения и язык

[2104.00743] На пути к системам машинного зрения общего назначения
Они предлагают GPV, который может выполнять множество задач, используя изображения и язык. Используя в качестве входных данных изображение и вопрос (текст), система может не только обнаруживать объекты и рисовать изображения, но и отвечать на сложные задачи (вопросы), поставленные на языке.

— — — — — — — — — — — — — — — — — — –

2. Пример использования машинного обучения

Глубокая подделка спутниковых снимков



[Карты Deepfake могут действительно испортить ваше ощущение мира | WIRED]
В этой статье обсуждается угроза дипфейка спутниковых снимков. Спутниковые снимки можно использовать для цифрового картографирования, отслеживания погодных систем, принятия инвестиционных решений и т. д., и есть опасения по поводу их негативного воздействия.

Возможно, автономное оружие впервые атаковало людейthegradientpub.substack.com



[Обновление № 2: Роботы-убийцы и диффузионные модели — Градиент]
Было высказано предположение, что автономные дроны с искусственным интеллектом могли впервые использоваться в гражданской войне в Ливии. В отчете говорится, что, хотя в настоящее время наблюдается прогресс в регулировании ИИ, одного регулирования будет недостаточно без стимулов для прекращения использования оружия ИИ.

— — — — — — — — — — — — — — — — — — –

3. Документы

Эталонный набор данных для программирования

[2105.09938] Измерение компетенции в области кодирования с помощью APPS
Предоставляет APPS, эталонный набор данных для программирования. Задача очень общая: если есть проблема, напишите код для ее решения. Это сложная задача, которая еще не решена с помощью современных высокопроизводительных моделей.

Исправление маски сегментации высокого разрешения без тонкой настройкиarxiv.org

[2005.02551] CascadePSP: на пути к независимой от класса и сегментации с очень высоким разрешением посредством глобального и локального уточнения
Исследование уточнения сегментации для изображений с очень высоким разрешением, отсутствующих в обучающих данных без точной настройки. В качестве входных данных используются многомасштабные маски и изображение, а каскадная сеть используется для модификации маски со стороны низкого разрешения и ее повторного ввода. Маски сегментации очень высокого разрешения могут быть созданы без какой-либо точной настройки.

Сравнение DL и XGBoost на различных наборах табличных данныхarxiv.org

[2106.03253] Табличные данные: глубокое обучение — это еще не все, что вам нужно
Исследование, в котором DL и XGBoost сравниваются с различными наборами табличных данных. В табличных наборах данных XGBoost был более точным и простым в настройке.

Трансформер и самоконтролируемое обучение на табличных данныхarxiv.org

[2106.01342] SAINT: улучшенные нейронные сети для табличных данных с помощью внимания к строке и контрастного предварительного обучения
Исследование преобразования и обучения с самоконтролем на табличных данных. После предварительной подготовки с самостоятельным обучением выполните точную настройку. Они также предлагают межвыборочное внимание, которое переключает внимание между образцами, чтобы улучшить способность классификации.

— — — — — — — — — — — — — — — — — — –

4. Статьи, связанные с технологиями машинного обучения

Разрешить ИИ разрабатывать ИИ-чипыwww.nature.com

[Методология размещения графов для быстрого проектирования микросхем | Природа]

В исследовании использовалось обучение с подкреплением для разработки компьютерного чипа, который может превзойти человека по всем ключевым показателям, включая энергопотребление, производительность и площадь чипа, менее чем за шесть часов.

Лекции MLP Университета Карнеги-Меллонаwww.youtube.com

[CMU Neural Nets for NLP 2021]
Лекции MLP Университета Карнеги-Меллона теперь доступны на YouTube. Они не только о Transformer, но и о последних темах, таких как Reformer.

— — — — — — — — — — — — — — — — — — –

5. Другие темы

Регулирование ИИ в Европейском Союзеwww.lawfareblog.com



[Закон об искусственном интеллекте: каков европейский подход к ИИ? — Lawfare]
В этой статье кратко изложены правила Европейского Союза в отношении искусственного интеллекта. В нем говорится, что ИИ в таких областях, как пограничный контроль и управление демократическими процессами, будет регулироваться при человеческом надзоре и прозрачности.

Реализация MIP-микшераgithub.com



[GitHub — sayakpaul/MLP-Mixer-CIFAR10: реализует MLP-Mixer (https://arxiv.org/abs/2105.01601) с набором данных CIFAR-10.]
Репозиторий, реализующий MLP-Mixer, предоставляющий блокноты для классификации в CIFAR10 и визуализации изученных весов.

— — — — — — — — — — — — — — — — — — –

🌟Выкладываю еженедельные рассылки! Пожалуйста, подпишитесь!🌟



— — — — — — — — — — — — — — — — — — –

Обо мне

Инженер-технолог/Инженер по машинному обучению/Ученый по данным/Магистр физики/ http://github.com/AkiraTOSEI/

Твиттер, я публикую бумажный комментарий из одного предложения.