Как работает контекстное обучение, часть 2 (машинное обучение)

Использование контекстного обучения для повышения безопасности диалога (arXiv)

Автор: Николас Мид, Спандана Гелла, Деваманью Хазарика, Пракхар Гупта, Ди Джин, Шива Редди, Ян Лю, Дилек Хаккани-Тюр.

Аннотация: В то время как большие диалоговые модели на основе нейронных сетей становятся все более эффективными в качестве диалоговых агентов, недавняя работа выявила проблемы безопасности с этими системами. Например, эти системы можно подтолкнуть к созданию токсичного контента, который часто увековечивает социальные предубеждения или стереотипы. Мы исследуем основанную на поиске структуру для снижения предвзятости и токсичности ответов, генерируемых нейронными чат-ботами. Он использует контекстное обучение, чтобы направить модель в сторону более безопасных поколений. Конкретно, чтобы сгенерировать реакцию на небезопасный контекст диалога, мы извлекаем демонстрации безопасных моделей ответов на аналогичные контексты диалога. Мы считаем, что предлагаемый нами подход работает конкурентоспособно с сильными базовыми показателями, которые используют тонкую настройку. Например, используя автоматическую оценку, мы обнаружили, что наш лучший точно настроенный базовый уровень генерирует только безопасные ответы на небезопасные контексты диалога от DiaSafety на 2,92% больше, чем наш подход. Наконец, мы также предлагаем простую процедуру повторного ранжирования, которая может еще больше повысить безопасность реагирования.

2. Что делает хорошие примеры для визуального контекстного обучения? (arXiv)

Автор: Юаньхань Чжан, Кайян Чжоу, Цзывэй Лю.

Аннотация: Крупномасштабные модели, обученные на широких данных, в последнее время стали основной архитектурой в компьютерном зрении из-за их высокой производительности обобщения. В этой статье основное внимание уделяется эмерджентной способности в больших моделях видения, известной как обучение в контексте, которое позволяет делать выводы о невидимых задачах, обуславливая примеры в контексте (также известные как подсказки) без обновления параметров модели. Эта концепция хорошо известна в области обработки естественного языка, но совсем недавно стала изучаться для больших моделей зрения. Мы впервые проводим всестороннее исследование влияния контекстных примеров на компьютерное зрение и обнаруживаем, что производительность очень чувствительна к выбору контекстных примеров. Чтобы преодолеть эту проблему, мы предлагаем систему быстрого поиска для автоматизации выбора контекстных примеров. В частности, мы представляем (1) метод быстрого поиска без учителя, основанный на поиске ближайшего примера с использованием готовой модели, и (2) метод быстрого поиска с учителем, который обучает нейронную сеть выбирать примеры, которые непосредственно максимизируют контекст. успеваемость в обучении. Результаты показывают, что наши методы могут принести нетривиальные улучшения в визуальное обучение в контексте по сравнению с обычно используемым случайным выбором.

Как работает контекстное обучение, часть 2 (машинное обучение)

Вопросы по теме