Информационный бюллетень активного обучения

Активное и полу-контролируемое машинное обучение: 12–23 октября.

Подборка последних препринтов arXiv по активному (а иногда полу- или слабо контролируемому) глубокому обучению

Предыдущий выпуск:



Здесь вы также можете найти все мои текущие информационные бюллетени по активному обучению.

Первый ресурс, о котором я хотел бы упомянуть, - это еще одна запись в блоге, которая была опубликована здесь, на TDS, около месяца назад:



Как бы мне ни нравился препринт, готовый к печати в формате arXiv, с некоторыми передовыми результатами исследований, ничто не может сравниться с отзывами тех, кто применил это исследование к реальным проблемам. Есть несколько практических выводов, которые команда, написавшая сообщение в блоге Uizard, обсуждает в основном в контексте обнаружения объектов, но наиболее интересным мне показался следующий:

Псевдо-метки - это предсказания с высокой степенью достоверности, сделанные на основе немаркированных данных с помощью модели, обученной на помеченных (и / или ранее псевдо-помеченных) обучающих выборках. Псевдо-маркировка (также известная как самообучение) может использоваться для автоматизации большей части процесса аннотации данных, резко сокращая связанные с этим затраты на маркировку. Однако он подвержен ошибкам: в частности, любые предубеждения, которые модель обнаруживает на ранней стадии, скорее всего, будут только усиливаться в будущем. Один из способов решения этой проблемы - проверка псевдо-меток вручную. Как правило, проверка занимает меньше времени, чем маркировка с нуля, поэтому использование этого подхода по-прежнему дает значительную добавленную стоимость. В сообщении в блоге автор описывает другое решение, которое Uizard счел эффективным, в частности, для задачи обнаружения объектов. Это решение эвристическое уточнение псевдометок. Их пример сообщения в блоге касается обнаружения определенных предметов мебели на изображениях квартир. Здесь эвристика, которую можно использовать для автоматического уточнения псевдо-меток, может выглядеть примерно так: комод и кухонный остров выглядят в некоторой степени похожими, но кровать и комод с гораздо большей вероятностью будут обнаружены на одном изображении, чем кровать и кухонный остров. Итак, если вы обнаружите кровать и кухонный остров, этот «остров», скорее всего, будет комодом. Все просто, правда? Можно представить себе множество таких эвристик в реальных случаях использования, так что эту стратегию определенно стоит иметь в виду.

Активное обучение часто рассматривается отдельно от обучения без учителя, но, по сути, первое можно рассматривать как подтип второго. Я уже обсуждал теорию активного обучения в одном из моих предыдущих постов в блоге:



Основная идея состоит в том, чтобы обучить контролируемую модель на помеченных данных, а затем использовать прогнозы обученной модели на неконтролируемом наборе для определения приоритетов экземпляров, которые будут помечены следующими. Однако модель, обученная на небольшом количестве помеченных данных, явно не будет обеспечивать наилучшую производительность. А что, если вместо обучения с учителем внутри цикла активного обучения мы выполняем полу-контролируемое обучение? Вложенный полууправляемый подход, использующий немаркированные данные как для обучения, так и для пула меток «человек в цикле». Оказалось, что вариант этой идеи работает достаточно хорошо, как описано в:



Пока мы говорим об активном обучении, вот новая стратегия запросов, которую можно использовать в задачах обработки естественного языка (НЛП): насколько удивительной является данная фраза?

Чтобы дать количественный ответ на этот вопрос, авторы книги Активное обучение с холодного старта посредством самоконтролируемого языкового моделирования используют BERT. А именно, они используют его для вычисления того, что они называют неожиданными вложениями. Чтобы дать вам представление о результате, рассмотрим следующий пример из препринта: фраза «они испытывают двойственное отношение к католической психоделической синтетической народной музыке. »Считается более удивительным, чем« это мое любимое телешоу ». (Не могу с этим поспорить.) Это свойство становится частью стратегии запроса, используемой для определения приоритета следующей аннотации данных:



В области компьютерного зрения подходы к активному обучению чаще всего оцениваются либо по классификации изображений, либо по обнаружению объектов (это означает, что мы стремимся либо назначать метки классов на уровне изображения, либо рисовать ограничивающие рамки вокруг объектов и идентифицировать их). Однако другая распространенная задача компьютерного зрения, семантическая сегментация, когда метки классов назначаются на уровне пикселей, обычно намного дороже аннотировать данные. Это, конечно, делает его особенно желанным кандидатом для активного обучения!

В дополнение к стандартным стратегиям запросов (например, вариации выборки неопределенности и т. Д.), Мы можем определить меру, специфичную для проблемы сегментации - так же, как фраза «насколько удивительна эта фраза» была характерна для НЛП в препринте, обсуждаемом выше. . Здесь эта новая мера будет трудностью создания маски сегментации: например, Выбор маленьких фигур пешеходов, вероятно, будет сложнее, чем выбор большого прямоугольного здания или автобуса на рисунке выше. Включение этой трудности в активный процесс обучения обсуждается в:



Так что это еще один мой вывод из чтения машинного обучения, которым я занимался за последние две недели: будьте творческими. В жизни, на работе и, в частности, проявляйте творческий подход к своим стратегиям запросов для активного обучения.

На этой ноте до встречи в ноябре!