Публикации по теме 'nlp'


Обновленные методы предварительной обработки текста для анализа тональности
Давайте обсудим недостатки некоторых методов и способы их улучшения. Люди используют множество техник предварительной обработки текста, но сколько из них действительно полезно? Я работаю с текстовыми данными почти 6 месяцев и чувствую, что есть много проблем, когда вы работаете над продуктом, который будет использоваться многими людьми. Вот несколько техник, которые вы встретите повсюду: Удаление цифр, знаков препинания, смайликов и т. Д. Удаление стоп-слов Лемматизация или..

Автоматизированная оценка эссе — Конкурс Kaggle, комплексная реализация проекта, часть 3
Часть 3. Создание веб-приложения для проекта и развертывание модели ML Пожалуйста, пройдите Часть 1 , Часть 2 и Часть 3 для полного понимания и выполнения проекта с данным Github . 2. /mysite/grader/views.py для получения контекста с веб-страницы и оценки эссе из сохраненной модели. Библиотеки Django и utils импортируются, когда всякий раз, когда пользователь просматривает веб-приложение, будет вызываться первая индексная функция, которая будет внутренне вызывать файл..

Попадание в душу машин через НЛП
Краткий обзор НЛП с библиотекой NLTK ВСТУПЛЕНИЕ Обработка естественного языка, или коротко НЛП, - это подполе искусственного интеллекта, используемого компьютерами для понимания человеческого языка. Изучение НЛП началось в 1950-х годах, и до 1980-х годов разработчики писали сложные рукописные правила для построить систему НЛП. Все изменилось, и революция началась, когда были разработаны алгоритмы машинного обучения для обработки естественного языка. Новые системы НЛП были..

Как я научился перестать беспокоиться и полюбить ошибку
Мир - безумное место для ИИ. Давайте не будем пытаться - вместо этого вычислим, как в 1999 году. Для тех из вас, кто не может вспомнить (или никогда не заботился), 2000 год выявил экзистенциальную проблему для общества. В кодовых базах витала тонна двузначных лет, которые могли вызвать взрыв, потому что компьютеры не были достаточно умны, чтобы знать, был ли это 2000 или 1900 или какой-нибудь год-кончается-00. Страшный результат? Некоторые игровые автоматы на ипподроме в..

Релевантность обзора @ Thumbtack
Ежегодно миллионы клиентов используют торговую площадку Thumbtack, чтобы найти подходящих местных профессионалов практически для чего угодно. Некоторые используют канцелярскую кнопку, чтобы быстро найти надежного сантехника и починить протекающий мусор, в то время как другие могут использовать канцелярскую кнопку, чтобы проконсультироваться с дизайнером интерьера при ремонте своего дома. На Thumbtack клиенты могут найти профессионалов примерно по 500 категориям услуг. В зависимости от..

Основные события Interspeech 2018
В этом году команда Sciforce побывала в Индии на одном из самых важных событий в сообществе обработки речи - конференции Interspeech . Это действительно научная конференция, где каждое выступление, постер или демонстрация сопровождается статьей, опубликованной в журнале ISCA. Как обычно, он охватывал большинство тем, связанных с речью, и даже больше: автоматическое распознавание речи (ASR) и генерация (TTS), преобразование голоса и шумоподавление, проверка говорящего и диаризация,..

Помощь ИИ с PyText
Помощь ИИ с PyText PyText - это инструмент обработки естественного языка (NLP) с открытым исходным кодом, недавно разработанный командой Facebook: AI . Хотя существует довольно много приложений этого инструмента, для целей этого примера давайте посмотрим, как с помощью этого инструмента можно разработать помощника / чат-бота AI. Однако, прежде чем углубляться в пример, важно отметить, что инструмент может быть легко использован как экспертами по машинному обучению (ML), так и..