Активное и частично контролируемое машинное обучение: 28 сентября

Информационный бюллетень активного обучения

Активное и частично контролируемое машинное обучение: 28 сентября - 9 октября.

Подборка последних препринтов arXiv по активному (а иногда полу- или слабо контролируемому) глубокому обучению

Предыдущий выпуск:

Активное и частично контролируемое машинное обучение: 14–25 сентября
Подборка последних препринтов arXiv, касающихся активного (а иногда частично или слабо контролируемого) глубокого обучения todatascience.com

Здесь вы также можете найти все мои текущие информационные бюллетени по активному обучению.

Прошлый уик-энд был для меня особенно занудным: он включал в себя поездку в планетарий в субботу, а затем просмотр лекций курса Stanford CS224W (машинное обучение с графиками) - очень рекомендую, кстати, вы получите все удовлетворение от просмотра переедания без какой-либо вины. [Полное раскрытие: я твердо верю в то, что нельзя ругать себя за то, что вы не повредили свой список дел, если отвлечение делает вас счастливыми. Это просто хороший баланс работы и личной жизни! Пожалуйста, оставьте свои рекомендации Netflix в комментариях.]

Говоря о машинном обучении с помощью графиков, у меня есть для вас еще пара препринтов:

Новая архитектура на основе GCNN для классификации полууправляемых узлов
Узлы графа, существующие в конкретном кластере, с большей вероятностью будут подключаться друг к другу, чем к другим узлам в… arxiv.org

а также

Анализ шума меток при полууправляемом обучении на основе графиков
В машинном обучении нужно приобретать метки, чтобы контролировать модель, которая сможет обобщать невидимые данные ... arxiv.org

Если вы новичок в машинном обучении на основе графов, но предпочитаете не смотреть все шестнадцать полуторачасовых лекций, чтобы начать работу, я рекомендую просмотреть достаточно лекции 1, чтобы понять, что такое граф. есть, затем посмотрите лекции 6, 7 и 8, чтобы увидеть, как связать эту идею с моделями машинного обучения. Или вот моя версия…

… вкратце о машинном обучении на основе графиков

Думайте о каждой точке данных, которая у вас есть, как о узле графа. Допустим, каждый узел соответствует профилю человека в Facebook. Мы нарисуем грани между (т. Е. Соединим) те узлы, которые дружат друг с другом на Facebook. Узлы могут, но не обязательно, иметь характеристики (например, возраст, пол человека, политические взгляды, которые он сам описывает, а также наличие у него кошки). Теперь предположим, что вы хотите выяснить, может ли данный человек поддержать идею изоляции, навязанной covid, или нет. Другими словами, задача бинарной классификации. (Вы можете пометить те узлы, которые явно выразили свою поддержку или пренебрежение блокировкой, в своем профиле, и обучить их.) Если вы не хотели делать какие-либо из этих причудливых графических вещей, вы могли бы просто обучить классификатор с функциями, которые вы тренировочные данные имеют. Однако вы предполагаете, что человек, который дружит с большим количеством сторонников изоляции, с большей вероятностью разделяет эти взгляды, чем человек, чей круг друзей в Facebook решительно выступает против приказа оставаться дома. Если бы только мы могли включить такую реляционную информацию в наше моделирование ... Подождите, мы действительно можем: пока мы используем граф (узлы + их соединения с другими узлами) вместо простых узлов в качестве входных данных для нашей модели.

Это может показаться странным, но в каком-то смысле вы уже это делаете. Подумайте, например, о классификации изображений: изображение 1024 x 1024 можно рассматривать как сетку - очень скучный график, который имеет фиксированный размер и одинаковую топологию везде, кроме границы изображения. Каждый узел (пиксель) имеет заданное количество функций (которые определяют цвет пикселя). Обобщение знакомых понятий машинного обучения с сетки на граф произвольной сложности нетривиально, но возможно.

Для тех, кто уже хорошо разбирается в машинном обучении с помощью графиков, вот препринт, основанный на графах, более сложный в математике, сделанный около двух недель назад:

Параметрический UMAP: обучение вложениям с помощью глубоких нейронных сетей для представления и…
Мы предлагаем параметрический UMAP, параметрический вариант UMAP (Uniform Manifold Approximation and Projection)… arxiv.org

Модели, обученные в полууправляемом режиме, очень чувствительны к выбору, какие точки данных являются помеченными (фактически, оптимизация этого выбора является центральной целью активного обучения). Поэтому возникает соблазн сконцентрироваться на качестве помеченного подмножества, бросить все, что мы получили, в немаркированную часть, и позволить модели разобраться с этим. Однако было показано, что данные вне распределения среди немаркированных обучающих выборок оказывают негативное влияние на производительность полууправляемых моделей. При полууправляемом машинном обучении немаркированный обучающий набор обычно велик, и его прохождение с помощью тонкой гребенки, чтобы отсеять любые точки вне распределения, будет нарушением первоначальной цели. Авторы препринта, представленного ниже, решают эту проблему с помощью подхода, использующего пакетную нормализацию:

Надежное полу-контролируемое обучение с данными вне распределения
Полуконтролируемое обучение (SSL) на основе глубоких нейронных сетей (DNN) недавно доказало свою эффективность. Однако недавний… arxiv.org

Задачи сегментации изображений - это распространенные варианты использования компьютерного зрения, которые требуют особенно трудоемкого вида аннотации данных: очерчивания границ объекта или группы объектов одного класса (иногда с необходимостью точности на уровне пикселей). Когда дело доходит до аннотации данных, время, безусловно, равняется деньгам, поэтому все, что можно сделать для ускорения этого процесса, может иметь огромное значение в будущем (попытка каламбура с автономным транспортным средством). Неудивительно, что существует ряд групп, работающих над обучением под слабым учителем для сегментации изображений. Обычно для слабых меток требуются только аннотации ко всему изображению, например классификационные метки, которые намного проще получить, чем маски сегментации. В Обнаружении существенных экземпляров со слабым контролем авторы сопоставляют метки классов с количеством объектов, присутствующих в изображении, чтобы обучить сеть сегментации с тремя ветвями для создания масок сегментации:

Обнаружение существенных экземпляров со слабым контролем
Существующие методы обнаружения значимых экземпляров (SID) обычно обучаются на основе аннотированных наборов данных на уровне пикселей. В этом документе… arxiv.org

Некоторые из других недавних препринтов слабо контролируемой сегментации изображений включают Причинное вмешательство для слабо контролируемой семантической сегментации

Причинное вмешательство для слабо контролируемой семантической сегментации
Мы представляем структуру причинного вывода для улучшения слабо контролируемой семантической сегментации (WSSS). В частности, мы стремимся… arxiv.org

и Движение к крайностям: слабо контролируемая сегментация медицинских изображений, где слабые метки представляют собой крайние точки на поверхности органа, выбранные аннотатором на трехмерном медицинском изображении:

До крайности: слабо контролируемая сегментация медицинских изображений
Аннотации медицинских изображений - серьезное препятствие для разработки точных и надежных моделей машинного обучения. Аннотация… arxiv.org

Наконец, это не был бы информационный бюллетень Active Learning, если бы мы не говорили об активном обучении ;-) Живя в Париже, я не мог бы передать статью с OLALA в заголовке:

OLALA: Аннотация макета на основе активного обучения на уровне объекта
В задачах обнаружения объектов макета наборы достоверных данных создаются путем аннотирования экземпляров объектов… arxiv.org

Обнаружение макета документа - это задача обнаружения объектов в компьютерном зрении, где рассматриваемые объекты представляют собой различные области содержимого в изображениях документа. (Естественно, большая часть теории переносится на обнаружение объектов в целом.) Когда дело доходит до активного обучения обработке изображений, запросы обычно выполняются на уровне изображения, что означает, что к оракулу обращается запрос для аннотирования всего изображения. Однако в случае использования, когда определенные категории объектов имеют тенденцию появляться несколько раз на одном изображении, тогда как другие нет, стратегия на уровне изображения часто приводит к чрезмерному представлению общих объектов в обучающем наборе. Подход на уровне объектов (также известный как OLALA) позволяет избежать этой проблемы, запрашивая вместо этого метки выбранных объектов в изображениях.

Возвращаясь к проблеме сегментации изображений, активное обучение - это, конечно, еще один способ сократить высокие затраты на аннотацию данных, связанные с выбором масок сегментации:

MetaBox +: новый метод активного обучения на основе региона для семантической сегментации с использованием карт приоритетов
Мы представляем новый метод активного обучения на основе региона для семантической сегментации изображений, который называется MetaBox +. Для… arxiv.org

Увидимся через две недели :)

Активное и частично контролируемое машинное обучение: 28 сентября - 9 октября.

Информационный бюллетень активного обучения

Активное и частично контролируемое машинное обучение: 28 сентября - 9 октября.

Подборка последних препринтов arXiv по активному (а иногда полу- или слабо контролируемому) глубокому обучению

Вопросы по теме