Публикации по теме 'nlp'


Анализируйте ответы на опросы с помощью машинного обучения
В наши дни искусственный интеллект - самый популярный пирог в секторе информационных технологий. Это очень мощный инструмент, который может помочь сектору B2B получить практическую информацию из тысяч отзывов клиентов. Всякий раз, когда на рынок выводится новый продукт, получение обратной связи становится довольно утомительным, и даже если вы добьетесь успеха в сборе отзывов с помощью ответов на опросы , вам еще предстоит пройти долгий путь. У вас недостаточно времени и инструментов,..

Извлечение признаков и классификация с использованием NLTK — PART-5
В моей предыдущей статье мы узнали о различных способах классификации токенов. Я также говорил о различных используемых функциях тегов. В этой статье мы рассмотрим различные небольшие приложения обработки языка, и в то же время вы также научитесь извлекать важные функции из контента. Гендерная идентификация Если нам дают имя, мы должны быть в состоянии идентифицировать его как мужское или женское. Было замечено, что имена, оканчивающиеся на «n», «r», «t», с большей вероятностью..

Обобщение с помощью простых преобразователей
"Обработка естественного языка" Обобщение с помощью простых преобразователей Практическое руководство по составлению сводок с помощью простых преобразователей Библиотека Simpletransformers построена на основе трансформаторов Huggingface. Я использовал оба и обнаружил, что простые трансформаторы очень просты в использовании и интуитивно понятны. Это помогает нам решать такие проблемы, как классификация, ответы на вопросы, языковое моделирование, модели Seq2Seq для суммирования и т...

Понимание архитектуры BERT
BERT - это, пожалуй, одна из самых интересных разработок в НЛП за последние годы. Буквально в прошлом месяце даже Google объявил , что использует BERT в своем поиске, что якобы является самым большим шагом вперед , который он сделал в понимании поиска за последние пять лет. Это огромное свидетельство от Google. О поиске! Вот насколько важен BERT. Теперь есть несколько удивительных ресурсов для детального понимания сетей BERT, Transformers и Attention (Attention и Transformers..

Обнаружение аномалий в твитах: подход на основе кластеризации и близости
Как использовать алгоритм кластеризации и анализ близости (LOF baed) для обнаружения выбросов / аномалий в текстовых твитах Twitter. Сравнение двух подходов Обнаружение аномалий / выбросов - одна из очень популярных тем в мире машинного обучения. Это относится к процессу «обучения без учителя». Здесь у нас нет никаких предварительных знаний о шаблонах данных, в отличие от «контролируемого обучения». «Аномалия или выброс» - это точка данных, которая не очень похожа на другие точки..

Как EdTech является основой для разработки ИИ, способного рассуждать
Нас догоняют машины. За последние несколько лет произошел значительный прогресс в развитии искусственного интеллекта. То есть компьютеры, распознающие образы, которые соответствуют или превосходят возможности человека. Метод, лежащий в основе разработки этой захватывающей технологии, невероятно гибкий и мощный. Это называется машинным обучением. С большими наборами данных, умными алгоритмами и мощными компьютерами мы можем обучать модели, способные распознавать все закономерности,..

Классификация текста — с использованием CNN и LSTM
Электронные письма, чаты, веб-страницы и социальные сети содержат неструктурированный контент. Однако получение ценности из этих данных является сложной задачей, если они не структурированы определенным образом. Раньше это была трудоемкая и дорогостоящая процедура, поскольку требовалось время и ресурсы для ручного анализа данных. Текстовые классификаторы, использующие NLP, оказались отличным выбором для быстрой, экономичной и масштабируемой структуры текстовых данных. Что такое..