1. Интерпретируемое дистанционное метрическое обучение для распознавания рукописных китайских иероглифов (arXiv)

Автор: Босян Дун, Апарна С. Варде, Данило Стеванович, Цзяин Ван, Лян Чжао

Аннотация. Распознавание рукописного ввода имеет решающее значение как для взаимодействия человека с компьютером (HCI), так и для оцифровки документов. В общей области оптического распознавания символов (OCR) распознавание рукописных китайских иероглифов сталкивается с огромными проблемами из-за чрезвычайно больших наборов символов и удивительного разнообразия стилей письма. Изучение подходящей метрики расстояния для измерения разницы между входными данными является основой точного распознавания рукописных символов. Существующие подходы к дистанционному метрическому обучению либо приводят к неприемлемому уровню ошибок, либо мало интерпретируют результаты. В этой статье мы предлагаем интерпретируемый подход к дистанционному метрическому обучению для распознавания рукописных китайских иероглифов. Изученная метрика представляет собой линейную комбинацию понятных базовых метрик и, таким образом, обеспечивает осмысленную информацию для обычных пользователей. Наши экспериментальные результаты на эталонном наборе данных демонстрируют превосходную эффективность, точность и интерпретируемость предложенного нами подхода.

2.SLADE: система самообучения для дистанционного обучения метрике (arXiv)

Автор: Джиали Дуан, Йен-Лян Линь, Сон Тран, Ларри С. Дэвис, К. -С. Джей Куо

Аннотация. В большинстве существующих подходов к дистанционному метрическому обучению используются полностью размеченные данные для изучения сходства выборок в пространстве встраивания. Мы представляем самообучающуюся платформу SLADE для повышения производительности поиска за счет использования дополнительных немаркированных данных. Сначала мы обучаем модель учителя на размеченных данных и используем ее для создания псевдометок для неразмеченных данных. Затем мы обучаем модель ученика как меткам, так и псевдометкам, чтобы создать окончательные вложения функций. Мы используем самоконтролируемое репрезентативное обучение для инициализации модели учителя. Чтобы лучше справляться с шумными псевдометками, генерируемыми сетью учителей, мы разрабатываем новый компонент обучения на основе признаков для сети учеников, который изучает базовые функции представлений признаков для неразмеченных данных. Выученные базисные векторы лучше измеряют попарное сходство и используются для выбора высоконадежных выборок для обучения студенческой сети. Мы оцениваем наш метод на стандартных поисковых бенчмарках: CUB-200, Cars-196 и In-shop. Экспериментальные результаты показывают, что наш подход значительно повышает производительность по сравнению с современными методами.

3. Регуляризация под руководством экспертов с помощью дистанционного метрического обучения (arXiv)

Автор:Шоувик Мани, Мехди Маасуми, Сина Паказад, Хенрик Олссон

Аннотация. Многомерное прогнозирование представляет собой сложную задачу для традиционных статистических моделей. Хотя регуляризация улучшает производительность модели в больших размерностях, она недостаточно использует знания о важности признаков, которыми обладают эксперты в предметной области. В качестве альтернативы стандартным методам регуляризации мы предлагаем Дистанционную метрическую регуляризацию обучения (DMLreg) — подход к получению предварительных знаний от экспертов в предметной области и интеграции этих знаний в регуляризованную линейную модель. Во-первых, мы изучаем метрику расстояния Махаланобиса между наблюдениями из попарных сравнений сходства, предоставленных экспертом. Затем мы используем изученную метрику расстояния, чтобы поместить предыдущие распределения коэффициентов в линейную модель. С помощью экспериментальных результатов по смоделированной задаче многомерного прогнозирования мы показываем, что DMLreg приводит к улучшению производительности модели, когда эксперт в предметной области хорошо осведомлен.

4. Обучение метрике расстояния передачи на основе декомпозиции для классификации изображений (arXiv)

Автор:Юн Луо, Тунлян Лю, Дачэн Тао, Чао Сюй

Аннотация . Дистанционное метрическое обучение (DML) является критическим фактором для анализа изображений и распознавания образов. Чтобы узнать надежную метрику расстояния для целевой задачи, нам нужна обильная дополнительная информация (т. е. попарные ограничения сходства/несходства для помеченных данных), которая обычно недоступна на практике из-за высокой стоимости маркировки. В этой статье рассматривается настройка трансферного обучения с использованием большого количества дополнительной информации из определенных связанных, но разных исходных задач, чтобы помочь в обучении целевых показателей (с небольшой дополнительной информацией). Современные алгоритмы обучения метрике обычно терпят неудачу в этой настройке, потому что распределения данных исходной задачи и целевой задачи часто сильно различаются. Мы решаем эту проблему, предполагая, что целевая метрика расстояния лежит в пространстве, натянутом на собственные векторы исходных метрик (или других случайно сгенерированных базисов). Целевая метрика представлена ​​как комбинация базовых метрик, которые вычисляются с использованием декомпозированных компонентов исходных метрик (или просто набора случайных баз); мы называем предложенный метод передачей на основе декомпозиции DML (DTDML). В частности, DTDML изучает разреженную комбинацию базовых метрик для построения целевой метрики, заставляя целевую метрику быть близкой к интеграции исходных метрик. Основное преимущество предлагаемого метода по сравнению с существующими подходами к обучению метрике передачи заключается в том, что мы напрямую изучаем коэффициенты базовой метрики вместо целевой метрики. Для этого необходимо изучить гораздо меньше переменных. Таким образом, мы получаем более надежные решения, учитывая ограниченную дополнительную информацию, и оптимизация, как правило, происходит быстрее. Эксперименты по классификации популярных рукописных изображений (цифр, букв) и сложные задачи аннотирования естественных изображений демонстрируют эффективность предложенного метода.