Публикации по теме 'nlp'


Изучите AI — Структуры данных и алгоритмы
В этой статье мы рассмотрим основные определения структур данных и алгоритмов. В будущем мире ИИ, науки о данных и т. д. нужно быть готовым к решению вычислительных задач, которые приведут к эффективным решениям для данной постановки задачи. Проблема может быть решена только путем нахождения решения этой проблемы. Говоря вычислительными терминами, вам нужно написать программу, которая даст ответ, который вы ищете. Программа, которую вы напишете, будет представлять собой серию..

LDA2vec: вложения слов в тематические модели
Узнайте больше о LDA2vec, модели, которая изучает плотные векторы слов вместе с распределенными по Дирихле скрытыми смесями тематических векторов на уровне документа. В этом сообщении блога вы познакомитесь с lda2vec, тематической моделью, опубликованной Крисом Муди в 2016 году . lda2vec расширяет модель word2vec, описанную Mikolov et al. в 2013 , с векторами тем и документов и объединяет идеи как встраивания слов, так и моделей тем. Общая цель тематической модели - создать..

Скрытые затраты на встраивание слов низкого качества
Английское НЛП и, в частности, неанглийские приложения НЛП часто могут повысить точность классификатора до 10% за счет перехода на высококачественные вложения слов. Сегодня память и дисковое пространство дешевы, но многие приложения все еще расплачиваются за использование некачественных векторных представлений слов. Почему неанглоязычные модели особенно уязвимы из-за некачественного вложения слов ? Библиотека НЛП SpaCy предлагает модели на английском и многих других языках, а..

Кантри-музыка пьет больше, чем другие жанры?
Благодаря плейлистам Spotify Hot Country и Country Nights я недавно вошел в необычную фазу прослушивания музыки в стиле кантри. Рок обычно больше мой жанр, так что для меня это было впервые. После того, как я сразу осознал, насколько привлекательной может быть страна, меня по-настоящему поразило то, что, похоже, было так упоминаний алкоголя и выпивки! Возьмите эти вдохновляющие строки Криса Стэплтона ниже. Как вы думаете, он знает, что безалкогольные напитки тоже можно..

Глубокое обучение с помощью НЛП в темах Reuters Newswire
В этом посте я в основном буду работать с классификацией тем новостной ленты Reuters. Набор данных содержит 11 228 новостных лент Рейтер с 46 обозначенными темами. Этот набор данных взят из Keras, и каждый провод закодирован как последовательность индексов слов. Подробности о наборе данных доступны здесь . Поскольку нам нужно классифицировать темы ленты новостей по одной из 46 тем, это оставляет нам многоклассовую классификацию вместо двоичной. С помощью главы 6 книги Глубокое..

Модели MUSE, но быстрее и легче
Авторы: Клеман Частаньол, руководитель отдела науки о данных, Лоик Пети, старший инженер по обработке данных, и Цзе Лу, специалист по анализу данных в Sidetrade . Вы пользуетесь многоязычным встраиванием слов MUSE в Facebook? Если да, то у нас для вас хорошие новости: теперь вы можете загружать их в свой код в 100 раз быстрее с файлами, которые в 5 раз меньше ! А что насчет моделей MUSE? Вложения MUSE в некоторой степени волшебны, потому что они позволяют очень быстро..

Глава 9: Обработка естественного языка.
до сих пор мы говорили об алгоритмах машинного обучения и глубокого обучения, которые можно использовать в любой области. Одной из основных областей, где используются алгоритмы ML / DL, является обработка естественного языка (NLP), поэтому с этого момента давайте поговорим о NLP. НЛП - это большая область, вероятно, больше, чем машинное обучение, потому что концепция языка очень интенсивна, поэтому мы не собираемся сосредоточиваться на ней полностью, а сосредоточимся на небольшой..