Как расстояние Махаланобиса используется в сценариях машинного обучения, часть 7

Пример сложности изучения метрик расстояния Махаланобиса (arXiv)

Аннотация: метрическое обучение направлено на преобразование пространства признаков, которое повышает качество прогнозирования для данной задачи. В этой работе мы приводим уровни сложности выборки в стиле PAC для обучения метрик с учителем. Мы даем соответствующие нижние и верхние границы, показывающие, что сложность выборки масштабируется с размерностью представления, когда не делается никаких предположений о базовом распределении данных. Однако, используя структуру распределения данных, мы показываем, что можно достичь скорости, точно настроенной на конкретное понятие внутренней сложности для данного набора данных. Наш анализ показывает, что дополнение метрического критерия оптимизации обучения простой регуляризацией на основе норм может помочь адаптироваться к внутренней сложности набора данных, обеспечивая лучшее обобщение. Эксперименты с эталонными наборами данных подтверждают наш анализ и показывают, что регуляризация метрики может помочь различить сигнал, даже если данные содержат большое количество шума.

2. Изучение локальных инвариантных расстояний Махаланобиса (arXiv)

Автор: Итан Фетая, Шимон Ульман.

Аннотация: Для многих задач и типов данных существуют естественные преобразования, к которым данные должны быть инвариантны или нечувствительны. Например, при визуальном распознавании естественные изображения должны быть нечувствительны к повороту и перемещению. Это требование и его последствия были важны во многих приложениях машинного обучения, и устойчивость к преобразованиям изображений была достигнута в первую очередь за счет использования надежных векторов признаков. В этой статье мы предлагаем новый и эффективный с вычислительной точки зрения способ изучения локальной метрики Махаланобиса для данных и показываем, как мы можем изучить локальную инвариантную метрику для любого преобразования, чтобы улучшить производительность.

Как расстояние Махаланобиса используется в сценариях машинного обучения, часть 7

Вопросы по теме