Публикации по теме 'nlp'


Южноафриканский Твиттерсфера во время Covid19
Авторы: Зак Вольпе и Киган Стокоу Мы живем в беспрецедентные времена. Несмотря на то, что мы сталкиваемся с серьезными финансовыми и медицинскими проблемами, нельзя пренебрегать эмоциональным и психологическим бременем, вызванным нарушением нормальности. Хотя социальные сети и ограничены, они позволяют заглянуть в условия жизни человека. Вдохновленный появлением чувства единства и связи, вот краткий анализ SA Twitter. Давайте измерим, как Южная Африка относится к Covid19..

Внедрение моделей машинного обучения в веб-приложения (часть 1)
Лучший способ изучать науку о данных - это делать это, и другой альтернативы нет. В этом посте я собираюсь отразить свои знания о том, как я разработал модель машинного обучения, которая может классифицировать обзоры фильмов как положительные или отрицательные, и как я встраиваю эту модель в веб-приложение Python Flask. Конечная цель - реализовать проект от начала до конца. Я твердо уверен, что в конце этого поста вы будете вооружены всеми необходимыми навыками, необходимыми для..

Логистическая регрессия и ее приложения в обработке естественного языка
Машинное обучение - одно из самых популярных словечек 2018 года. Так что же такое машинное обучение? Я объясню это своими словами. Это процесс обучения компьютера на примерах, а не жесткого кодирования всех возможных ситуаций. Если вы знаете, что такое машина В замешательстве? Потерпите несколько минут. Я объясню это на примере. Предположим, вы хотите научиться спортивному футболу. Вы будете делать то же самое, что и все остальные. Вы найдете человека, который хорошо разбирается в..

Анализ видео Youtube с помощью Neo4j и GraphAware NLP
В GraphAware одним из наших решений на основе Graph является платформа знаний, интеллектуальный механизм анализа, созданный на основе Neo4j. Чтобы предоставить нашим клиентам возможность открывать скрытые идеи из новых форм данных, мы решили начать этап исследований и разработок для анализа видео. В этом сообщении в блоге мы проанализируем стенограммы видео канала Neo4j Youtube, извлечем некоторые идеи и покажем, какую ценность для бизнеса может принести такой анализ. Часть I...

fastText для классификации текста
Я исследую классификатор fastText для мультиклассовой классификации. В своей предыдущей статье я исследовал 2 разные модели НЛП для задачи классификации текста. Хотя я не планировал делать это серией, я наткнулся на несколько более новых моделей в области НЛП и решил написать о них. Если хотите, можете проверить первую статью , в которой я сосредоточусь на обучении собственному встраиванию слов и сравниваю его с предварительно обученной моделью встраивания слов GloVe. Мы будем..

Текстовое представление для науки о данных и интеллектуального анализа текста
Работа с текстовыми данными - одна из самых захватывающих вещей, когда дело доходит до проектов, связанных с наукой о данных. 20 лет назад казалось невозможным, что обработка и хранение текстовых данных будут почти гарантированностью для многих организаций и что многие конвейеры данных будут вращаться вокруг этого типа данных. Как ни странно, хранение текстовых данных для обработки функций или алгоритмов обработки данных не так естественно, как можно было бы подумать. Во-первых, на..

NER корпоративного уровня с spaCy
"Обработка естественного языка" NER корпоративного уровня с spaCy Создавайте промышленные приложения для распознавания именованных сущностей (NER) за считанные минуты ... Распознавание именованных сущностей - одна из наиболее важных и широко используемых задач НЛП. Это метод извлечения сущностей (ключевой информации) из стека неструктурированных или полуструктурированных данных. Сущность может быть любым словом или серией слов, которые последовательно относятся к одному и тому же..