Публикации по теме 'nlp'


От закона Галла к закону Галла
«Неизменно обнаруживается, что сложная система, которая работает, развилась из простой системы, которая работала. Сложная система, разработанная с нуля, никогда не работает, и ее нельзя исправить, чтобы она заработала. Вы должны начать все сначала с работающей простой системой». - Джон Галл «Gallia est omnia divisa in partes tres» - Юлий Цезарь, Commentarii de Bello Gallico Если вы собираетесь построить сложную систему, вам следует начать с простой системы. Кажется..

Что такое М2М-100?
Первая модель многоязычного машинного перевода Вы когда-нибудь думали об использовании Facebook на своем родном языке или задавались вопросом, как это делается? Недавно Facebook разработал модель обработки естественного языка, которая переводит 200 языков без предварительного перевода данных на английский язык. Эта модель называется моделью перевода M2M (многие ко многим). Большая часть предыдущей работы по переводу была основана на англо-ориентированных наборах данных и моделях,..

Классификация текста с несколькими метками с помощью XLNet
Современная классификация текста с несколькими ярлыками и классами с помощью XLNet На момент публикации 19 июня 2019 года XLNet достигла самых современных результатов по 18 задачам, включая классификацию текста, ответы на вопросы, вывод естественного языка, анализ тональности и ранжирование документов. Он даже превзошел BERT на 20 задачах! XLNet, разработанная Университетом Карнеги-Меллона и Google Brain, представляет собой авторегрессивную языковую модель на основе перестановок...

Чат-боты зависят от домена и должны обнаруживать нерелевантность
Чат-боты зависят от домена и должны обнаруживать нерелевантность Как обрабатывать разговоры пользователей, которые вне домена Введение Как вы разрабатываете для пользовательского ввода, не имеющего отношения к вашему дизайну… Как правило, чат-боты разрабатываются и разрабатываются для определенного домена. Эти области узки и применимы к интересам организации, которую они обслуживают. Следовательно, чат-боты создаются по индивидуальному заказу и специально создаются как..

Я заставил ИИ прочитать 80 статей Тима Деннинга, и теперь это плохая машина для создания вдохновляющих цитат
Вот основные моменты Тим Деннинг - одна из самых успешных фигур в культуре самосовершенствования и предпринимательского ведения блогов. Имея более 140 тысяч подписчиков и 100 миллионов просмотров только на Medium, ясно, что он понял эту игру. Я люблю писать подобные статьи, но, очевидно, я не умею так хорошо, как он. Но, возможно, мне и не нужно. Что я могу сделать (я наивно подумал), так это скормить модели машинного обучения все статьи на timdenning.com и заставить..

Массовая предварительная подготовка для двуязычного машинного перевода
Мысли и теория Массовая предварительная подготовка для двуязычного машинного перевода Экскурсия по mBART, языковой модели кодировщика-декодера, которая открывает интересные перспективы для многоязычных задач, связанных с последовательностью. Примечание. Это первая статья из трех. Массовый предварительный тренинг для двуязычного машинного перевода (этот) Многоязычная точная настройка mBART50 (вторая часть) Перевод речи с mBART (еще не выпущен) . Если вы работали над..

Использование науки о данных, чтобы помочь женщинам сделать выбор противозачаточных средств
Krittika Krishnan была Insight Fellow летом 2018 года, а сейчас работает специалистом по анализу данных в CVS. До Insight она получила докторскую степень в области поведенческой нейробиологии в Техасском университете в Остине, где изучала влияние химических веществ, нарушающих эндокринную систему (обнаруженных в большинстве пластмасс и косметики), и того, как их эффекты передаются от одного поколения к другому. Заинтересованы в переходе к карьере в области науки о данных в..