Публикации по теме 'few-shot-learning'


Исследование DeepMind показывает, что языковые модели могут учиться на объяснениях в контексте даже без…
Если вы когда-нибудь задумывались над ответом на вопрос и задавались вопросом «…но почему?» вы не одиноки. У людей есть врожденная способность улучшать свое обучение и расширять свое понимание с помощью объяснений, которые связывают примеры с принципами. Сообщество машинного обучения в последние годы стало свидетелем быстрого роста…

BLEURT - Неисправности
Новая метрика для измерения текстового сходства, или, лучше сказать, метрика 21-го века, которую можно использовать, может быть, вечно. Любая задача или архитектура, которую мы создаем, должны быть оценены, чтобы установить эталон. Этот тест может использовать некоторые простые метрики, такие как Жаккар, или какую-то причудливую математическую формулировку статистического обучения, но возникает тот же вопрос, достаточно ли этих метрик? Каждый исследователь НЛП задается вопросом, как я..

Promptagator от Google создает нейронные ретриверы для конкретных задач всего из 8 примеров
Автоматизированный поиск информации стал ведущей парадигмой доступа к информации в современном мире, используемой каждый раз, когда кто-то вводит запрос в поисковую систему. Хотя в последние годы в области поиска информации наблюдается быстрый прогресс благодаря развитию глубоких нейронных сетей, которые могут извлекать знания из крупномасштабных…

Сила многократного обучения в языковых моделях
Введение В быстром развитии обработки естественного языка (НЛП) возникла новая тенденция: не зависящие от задачи архитектуры предварительного обучения и не зависящие от задач архитектуры. Этот прогресс привел к значительному улучшению сложных задач НЛП, таких как понимание прочитанного, ответы на вопросы и понимание текста. Тем не менее, шагом для конкретной задачи остается точная настройка большого набора данных примеров для адаптации модели, не зависящей от задачи, для выполнения..

Введение в обучение несколькими выстрелами
Машинное обучение очень успешно работает в приложениях, интенсивно использующих данные, но часто затрудняется, когда набор данных мал. Для решения этой проблемы было предложено обучение с небольшим количеством выстрелов (FSL). Он используется в различных областях компьютерного зрения, НЛП и т. д. Он приобрел популярность, потому что помогает делать прогнозы, используя ограниченное количество примеров с контролируемой информацией, то есть с небольшим количеством обучающих выборок. Мы..

Распознавание именованных объектов Zero-Shot с использованием ответов на вопросы
TLDR Распознавание именованных сущностей (NER) является важной задачей для многих систем понимания естественного языка. Сбор размеченных данных является серьезным препятствием для применения этих подходов в промышленности. Рассматривая NER как проблему ответа на вопрос, мы можем собирать зашумленные данные для обучения модели, что может обеспечить хорошую производительность без необходимости множества аннотаций. Значительно лучшие результаты могут быть достигнуты при сочетании этого..

Модельное агностическое метаобучение (MAML): интуитивно понятный способ
В последние годы произошел большой прогресс в исследованиях в области метаобучения. Так же произошло расширение доступной литературы и сообщений в блогах. Модельное агностическое метаобучение (MAML) лежит в основе разработок в этой области. Было много отличных сообщений в блогах, объясняющих метаобучение в целом ( здесь и здесь ) и MAML в частности ( здесь и здесь ). Сложные термины и сложные уравнения делают алгоритм похожим на крупную ракетную науку. Однако в этом блоге я..