Неделя 24, 2021 (13 июня)
Избранные статьи/новости на этой неделе.
- Есть статья, в которой говорится, что сообщество машинного обучения сосредоточено только на улучшении моделей и пренебрегает влиянием, которое могут иметь неверные данные. По моему опыту, улучшение данных оказывает большее влияние, чем использование немного лучшей модели, поэтому было бы здорово увидеть больше исследований в этой области!
- Была представлена модель, способная решать самые разные задачи с помощью изображений и языка. Система задает открытые вопросы на языке и отвечает прямоугольниками языка и местоположения. Сочетание изображения и языка увеличивает количество вещей, которые можно делать одновременно, и мы с нетерпением ждем появления практических приложений.
Машинное обучение в реальном мире
- Есть статья, в которой указывается влияние Deep Fake на спутниковые снимки. Информация об изображении настолько убедительна, что даже поддельные изображения могут быть обманчивы, если их представить в качестве доказательства.
- Было высказано предположение, что автономное оружие, возможно, впервые атаковало людей, и, хотя регулирование ИИ улучшается, ему еще предстоит остановить автономное оружие.
Документы
- Есть две статьи о глубоком обучении табличных данных. Один показывает превосходство глубокого обучения, а другой — GBDT, но я думаю, что глубокое обучение также проникает в табличные данные, причем некоторые из лучших победителей Kaggle используют Transformer.
— — — — — — — — — — — — — — — — — — –
В следующих разделах я представлю различные статьи и документы не только по вышеуказанному содержанию, но и по следующим пяти темам.
- Избранные статьи/новости на этой неделе
- Пример использования машинного обучения
- Документы
- Статьи, связанные с технологией машинного обучения
- Другие темы
— — — — — — — — — — — — — — — — — — –
1. Избранные статьи/новости на этой неделе
Данные часто игнорируются, но они очень важны
[«Все хотят, чтобы работала модель, а не данные»: Каскады данных в ИИ с высокими ставками — исследование Google]
В исследованиях ИИ данные представляют значительный риск для оценки и развертывания моделей: 92 % Практики ИИ испытывают такие кризисы, вызванные данными, однако на международных конференциях преобладает улучшение моделей, а исследования природы данных остаются в центре внимания.
Модель, которая может выполнять множество задач, используя изображения и язык
[2104.00743] На пути к системам машинного зрения общего назначения
Они предлагают GPV, который может выполнять множество задач, используя изображения и язык. Используя в качестве входных данных изображение и вопрос (текст), система может не только обнаруживать объекты и рисовать изображения, но и отвечать на сложные задачи (вопросы), поставленные на языке.
— — — — — — — — — — — — — — — — — — –
2. Пример использования машинного обучения
Глубокая подделка спутниковых снимков
[Карты Deepfake могут действительно испортить ваше ощущение мира | WIRED]
В этой статье обсуждается угроза дипфейка спутниковых снимков. Спутниковые снимки можно использовать для цифрового картографирования, отслеживания погодных систем, принятия инвестиционных решений и т. д., и есть опасения по поводу их негативного воздействия.
Возможно, автономное оружие впервые атаковало людей — thegradientpub.substack.com
[Обновление № 2: Роботы-убийцы и диффузионные модели — Градиент]
Было высказано предположение, что автономные дроны с искусственным интеллектом могли впервые использоваться в гражданской войне в Ливии. В отчете говорится, что, хотя в настоящее время наблюдается прогресс в регулировании ИИ, одного регулирования будет недостаточно без стимулов для прекращения использования оружия ИИ.
— — — — — — — — — — — — — — — — — — –
3. Документы
Эталонный набор данных для программирования
[2105.09938] Измерение компетенции в области кодирования с помощью APPS
Предоставляет APPS, эталонный набор данных для программирования. Задача очень общая: если есть проблема, напишите код для ее решения. Это сложная задача, которая еще не решена с помощью современных высокопроизводительных моделей.
Исправление маски сегментации высокого разрешения без тонкой настройки — arxiv.org
[2005.02551] CascadePSP: на пути к независимой от класса и сегментации с очень высоким разрешением посредством глобального и локального уточнения
Исследование уточнения сегментации для изображений с очень высоким разрешением, отсутствующих в обучающих данных без точной настройки. В качестве входных данных используются многомасштабные маски и изображение, а каскадная сеть используется для модификации маски со стороны низкого разрешения и ее повторного ввода. Маски сегментации очень высокого разрешения могут быть созданы без какой-либо точной настройки.
Сравнение DL и XGBoost на различных наборах табличных данных — arxiv.org
[2106.03253] Табличные данные: глубокое обучение — это еще не все, что вам нужно
Исследование, в котором DL и XGBoost сравниваются с различными наборами табличных данных. В табличных наборах данных XGBoost был более точным и простым в настройке.
Трансформер и самоконтролируемое обучение на табличных данных — arxiv.org
[2106.01342] SAINT: улучшенные нейронные сети для табличных данных с помощью внимания к строке и контрастного предварительного обучения
Исследование преобразования и обучения с самоконтролем на табличных данных. После предварительной подготовки с самостоятельным обучением выполните точную настройку. Они также предлагают межвыборочное внимание, которое переключает внимание между образцами, чтобы улучшить способность классификации.
— — — — — — — — — — — — — — — — — — –
4. Статьи, связанные с технологиями машинного обучения
Разрешить ИИ разрабатывать ИИ-чипы — www.nature.com
[Методология размещения графов для быстрого проектирования микросхем | Природа]
В исследовании использовалось обучение с подкреплением для разработки компьютерного чипа, который может превзойти человека по всем ключевым показателям, включая энергопотребление, производительность и площадь чипа, менее чем за шесть часов.
Лекции MLP Университета Карнеги-Меллона — www.youtube.com
[CMU Neural Nets for NLP 2021]
Лекции MLP Университета Карнеги-Меллона теперь доступны на YouTube. Они не только о Transformer, но и о последних темах, таких как Reformer.
— — — — — — — — — — — — — — — — — — –
5. Другие темы
Регулирование ИИ в Европейском Союзе — www.lawfareblog.com
[Закон об искусственном интеллекте: каков европейский подход к ИИ? — Lawfare]
В этой статье кратко изложены правила Европейского Союза в отношении искусственного интеллекта. В нем говорится, что ИИ в таких областях, как пограничный контроль и управление демократическими процессами, будет регулироваться при человеческом надзоре и прозрачности.
Реализация MIP-микшера — github.com
[GitHub — sayakpaul/MLP-Mixer-CIFAR10: реализует MLP-Mixer (https://arxiv.org/abs/2105.01601) с набором данных CIFAR-10.]
Репозиторий, реализующий MLP-Mixer, предоставляющий блокноты для классификации в CIFAR10 и визуализации изученных весов.
— — — — — — — — — — — — — — — — — — –
🌟Выкладываю еженедельные рассылки! Пожалуйста, подпишитесь!🌟
— — — — — — — — — — — — — — — — — — –
Обо мне
Инженер-технолог/Инженер по машинному обучению/Ученый по данным/Магистр физики/ http://github.com/AkiraTOSEI/
Твиттер, я публикую бумажный комментарий из одного предложения.