Активное и полу-контролируемое машинное обучение: 12

Информационный бюллетень активного обучения

Активное и полу-контролируемое машинное обучение: 12–23 октября.

Подборка последних препринтов arXiv по активному (а иногда полу- или слабо контролируемому) глубокому обучению

Предыдущий выпуск:

Активное и полу-контролируемое машинное обучение: 28 сентября - 9 октября
Подборка последних препринтов arXiv, касающихся активного (а иногда полу- или слабо контролируемого) глубокого обучения towardsdatascience.com

Здесь вы также можете найти все мои текущие информационные бюллетени по активному обучению.

Первый ресурс, о котором я хотел бы упомянуть, - это еще одна запись в блоге, которая была опубликована здесь, на TDS, около месяца назад:

От исследования к производству с помощью глубокого полу-контролируемого обучения
Полу-контролируемое обучение (SSL) процветает в исследовательском сообществе глубокого обучения - мы делимся извлеченными уроками, извлекая… todatascience.com

Как бы мне ни нравился препринт, готовый к печати в формате arXiv, с некоторыми передовыми результатами исследований, ничто не может сравниться с отзывами тех, кто применил это исследование к реальным проблемам. Есть несколько практических выводов, которые команда, написавшая сообщение в блоге Uizard, обсуждает в основном в контексте обнаружения объектов, но наиболее интересным мне показался следующий:

Псевдо-метки - это предсказания с высокой степенью достоверности, сделанные на основе немаркированных данных с помощью модели, обученной на помеченных (и / или ранее псевдо-помеченных) обучающих выборках. Псевдо-маркировка (также известная как самообучение) может использоваться для автоматизации большей части процесса аннотации данных, резко сокращая связанные с этим затраты на маркировку. Однако он подвержен ошибкам: в частности, любые предубеждения, которые модель обнаруживает на ранней стадии, скорее всего, будут только усиливаться в будущем. Один из способов решения этой проблемы - проверка псевдо-меток вручную. Как правило, проверка занимает меньше времени, чем маркировка с нуля, поэтому использование этого подхода по-прежнему дает значительную добавленную стоимость. В сообщении в блоге автор описывает другое решение, которое Uizard счел эффективным, в частности, для задачи обнаружения объектов. Это решение эвристическое уточнение псевдометок. Их пример сообщения в блоге касается обнаружения определенных предметов мебели на изображениях квартир. Здесь эвристика, которую можно использовать для автоматического уточнения псевдо-меток, может выглядеть примерно так: комод и кухонный остров выглядят в некоторой степени похожими, но кровать и комод с гораздо большей вероятностью будут обнаружены на одном изображении, чем кровать и кухонный остров. Итак, если вы обнаружите кровать и кухонный остров, этот «остров», скорее всего, будет комодом. Все просто, правда? Можно представить себе множество таких эвристик в реальных случаях использования, так что эту стратегию определенно стоит иметь в виду.

Активное обучение часто рассматривается отдельно от обучения без учителя, но, по сути, первое можно рассматривать как подтип второго. Я уже обсуждал теорию активного обучения в одном из моих предыдущих постов в блоге:

Активное обучение: теория
Активное обучение по-прежнему является нишевым подходом в машинном обучении, но это обязательно изменится. medium.com

Основная идея состоит в том, чтобы обучить контролируемую модель на помеченных данных, а затем использовать прогнозы обученной модели на неконтролируемом наборе для определения приоритетов экземпляров, которые будут помечены следующими. Однако модель, обученная на небольшом количестве помеченных данных, явно не будет обеспечивать наилучшую производительность. А что, если вместо обучения с учителем внутри цикла активного обучения мы выполняем полу-контролируемое обучение? Вложенный полууправляемый подход, использующий немаркированные данные как для обучения, так и для пула меток «человек в цикле». Оказалось, что вариант этой идеи работает достаточно хорошо, как описано в:

Полуконтролируемое пакетное активное обучение с помощью двухуровневой оптимизации
Активное обучение - эффективный метод снижения затрат на маркировку за счет повышения эффективности данных. В этой работе мы… arxiv.org

Пока мы говорим об активном обучении, вот новая стратегия запросов, которую можно использовать в задачах обработки естественного языка (НЛП): насколько удивительной является данная фраза?

Чтобы дать количественный ответ на этот вопрос, авторы книги Активное обучение с холодного старта посредством самоконтролируемого языкового моделирования используют BERT. А именно, они используют его для вычисления того, что они называют неожиданными вложениями. Чтобы дать вам представление о результате, рассмотрим следующий пример из препринта: фраза «они испытывают двойственное отношение к католической психоделической синтетической народной музыке. »Считается более удивительным, чем« это мое любимое телешоу ». (Не могу с этим поспорить.) Это свойство становится частью стратегии запроса, используемой для определения приоритета следующей аннотации данных:

Холодный старт активного обучения посредством самостоятельного моделирования языка
Активное обучение направлено на сокращение затрат на аннотации за счет выбора наиболее важных примеров для маркировки. Обычно… arxiv.org

В области компьютерного зрения подходы к активному обучению чаще всего оцениваются либо по классификации изображений, либо по обнаружению объектов (это означает, что мы стремимся либо назначать метки классов на уровне изображения, либо рисовать ограничивающие рамки вокруг объектов и идентифицировать их). Однако другая распространенная задача компьютерного зрения, семантическая сегментация, когда метки классов назначаются на уровне пикселей, обычно намного дороже аннотировать данные. Это, конечно, делает его особенно желанным кандидатом для активного обучения!

В дополнение к стандартным стратегиям запросов (например, вариации выборки неопределенности и т. Д.), Мы можем определить меру, специфичную для проблемы сегментации - так же, как фраза «насколько удивительна эта фраза» была характерна для НЛП в препринте, обсуждаемом выше. . Здесь эта новая мера будет трудностью создания маски сегментации: например, Выбор маленьких фигур пешеходов, вероятно, будет сложнее, чем выбор большого прямоугольного здания или автобуса на рисунке выше. Включение этой трудности в активный процесс обучения обсуждается в:

СДЕЛКА: активное обучение с учетом трудностей для семантической сегментации
Активное обучение направлено на решение проблемы нехватки помеченных данных путем поиска наиболее информативных образцов. Однако когда… arxiv.org

Так что это еще один мой вывод из чтения машинного обучения, которым я занимался за последние две недели: будьте творческими. В жизни, на работе и, в частности, проявляйте творческий подход к своим стратегиям запросов для активного обучения.

На этой ноте до встречи в ноябре!

Активное и полу-контролируемое машинное обучение: 12–23 октября.

Информационный бюллетень активного обучения

Активное и полу-контролируемое машинное обучение: 12–23 октября.

Подборка последних препринтов arXiv по активному (а иногда полу- или слабо контролируемому) глубокому обучению

Вопросы по теме