Публикации по теме 'nlp'


Внедрение поисковой системы TF-IDF
Простой способ создать поисковую систему - использовать модель векторного пространства (VSM). В этом посте давайте рассмотрим концепцию VSM и реализуем ее в Python 3 с помощью Numpy, Pandas и Scikit-Learn. Основная идея VSM - представить текст в виде вектора. Хотя существует множество эффективных и сложных подходов к визуализации текста в векторизованном формате, в этом посте мы рассмотрим наивный способ. Интересный факт, есть подполе ИИ и машинного обучения под названием Представление..

2,8 миллиарда слов расшифрованной речи для социальных наук и обработки естественного языка
2,8 миллиарда слов расшифрованной речи для социальных наук и обработки естественного языка Ученые опубликовали крупномасштабный корпус расшифровок разговорного радио Это краткое изложение исследования – лишь одно из многих, которые еженедельно публикуются в информационном бюллетене для ученых, занимающихся искусственным интеллектом. Чтобы начать получать еженедельную рассылку , зарегистрируйтесь здесь . Данные становятся все более полезными для машин и областей глубокого..

Арифметические свойства вложений слов
Потому что вы всегда хотели знать, почему король-мужчина + женщина = королева. Вы узнаете слово по компании, которую оно составляет . - Джон Р. Ферт (1957) Значение слова - это его использование в языке (…) Невозможно угадать, как слово функционирует. Надо посмотреть на его использование и извлечь из этого уроки . - Людвиг Витгенштейн (1953) Тот факт, что мы можем анализировать использование слов в языке, чтобы определить их значение, является фундаментальной..

НЛП без готового набора данных
Обработка естественного языка (NLP) является частью многих повседневных приложений, которые мы используем. Популярное описание НЛП наполнено различными алгоритмами, современными архитектурами нейронных сетей и так далее. Хотя это недалеко от реальности, это также дает неполную картину. Типичный конвейер разработки системы НЛП может выглядеть так, как показано на рисунке ниже: (источник: рис. 2–1, глава 2 на сайте www.practicalnlp.ai) Как видно из рисунка, отправной точкой..

Год изучения ИИ
Я начал изучать ИИ за год до этого. В то время изучение ИИ было для меня просто областью интересов. До этого я занимался Java и базовыми веб-разработками. Использование Servlets, Swings, JSP, HTML, CSS было довольно интересной задачей. Но после погружения в область ИИ (науки о данных) я почувствовал, что это более захватывающе. Первым приложением, которое я сделал в ИИ, была NIM Game с использованием эвристики ИИ. Это довольно простая и приятная игра, в которой я установил некоторые..

Сети LSTMs
Понимание математики интуиции В моем последнем блоге мы обсуждали недостатки RNN, у которых есть проблема исчезающего градиента, что приводит к тому, что не учатся более длинные последовательности, отвечающие за кратковременную память. LSTM и ГРУ рассматриваются как решение краткосрочных воспоминаний. Теперь давайте посмотрим, как это работает, чтобы понять это. У них есть механизм ворот, которые управляют потоком информации. Эти ворота решают, какую последовательность..

Обучаем компьютеры понимать тональность твитов
Потому что мы действительно не хотим читать все, что пишет Дональд Трамп. У людей редко возникают проблемы с пониманием того, является ли твит положительным или отрицательным. С компьютерами, однако, совсем другая история - сложная структура предложения, сарказм, образный язык и т. Д. Мешают компьютерам судить о значении и тональности предложения. Однако автоматическая оценка настроения твита позволит провести крупномасштабный анализ мнений населения по всем видам вопросов и поможет..