Публикации по теме 'nlp'
Как языковые предубеждения увековечиваются с помощью технологий
Изучение набора данных встраиваемых слов
Особенно в течение этого года технологическая отрасль подвергалась широкой критике за ее неустанное стремление к исследованиям и разработкам в области искусственного интеллекта (ИИ). Это связано с тем, что доминирующая парадигма в этой области называется машинным обучением , в котором компьютер полагается на распознавание шаблонов в существующих данных для выполнения конкретной задачи. В машинном обучении многие алгоритмы работают, принимая..
Создайте конвейер НЛП с помощью SciKit-Learn: Ham or Spam?
Руководство для начинающих по созданию простой модели детектора спама с использованием библиотеки обработки естественного языка Scikit-Learn.
Автор: Эдвард Крюгер и Дуглас Франклин .
Посмотрите код в нашем репозитории GitHub !
Эта проблема
Как и во многих других проблемах НЛП, определение того, какие электронные письма относятся к спаму, а какие вы, возможно, захотите прочитать, является проблемой классификации.
Мы можем спросить, к какому классу относится электронное..
Лингвистические знания в обработке естественного языка
С тех пор, как я погрузился в обработку естественного языка (NLP), я всегда хотел написать что-то довольно вводное об этом на высоком уровне, чтобы обеспечить некоторую структуру в моем понимании и дать другую перспективу в этой области - в отличие от популярности. о выполнении НЛП с использованием глубокого обучения.
Этапы анализа в НЛП
Для данного предложения традиционно следующие этапы анализа предложения для более глубокого понимания.
1. Морфология
На этом этапе мы заботимся..
Использование Rasa для разработки чат-ботов на любом родном языке
Использование Rasa для разработки чат-ботов на любом родном языке
Региональные языки не должны быть препятствием для развития диалогового интерфейса
Вступление
Приступая к изучению чат-ботов и разговорного ИИ, процесс начинается с поиска доступных фреймворков. Обычно это приводит вас к одному из крупных поставщиков услуг облачных чат-ботов.
Скорее всего, вы в конечном итоге будете использовать IBM Watson Assistant, Microsoft LUIS / Bot Framework, Dialog Flow и т. Д. Есть..
Наши последние студенческие проекты Data Science из класса №14
CodeNotary: AIOps — сокращение расходов на сервер с помощью машинного обучения
Ученики: Джанлука Макауда , Марица Нортон Олесон
По мере того, как наша зависимость от цифровых платформ растет, все больше и больше организаций — от банков до государственных учреждений — обнаруживают, что их операционные расходы раздуты из-за неправильно настроенных настроек сервера. CodeNotary может предоставить экспертные знания для решения этих проблем, но авансовое инвестирование ресурсов трудно..
Анализ скрытых тем в отобранной биомедицинской литературе
В моем предыдущем сообщении в блоге я обсуждал различных игроков, участвующих в опровержении биомедицинской и медико-биологической литературы. Один вопрос, который заинтриговал меня и остался без ответа: какие темы / темы исследований представлены в этих отозванных публикациях? Я пытаюсь ответить на этот вопрос в этом сообщении блога, используя тематическое моделирование.
Тематическое моделирование - это поиск, организация и понимание текстовой информации из корпуса или коллекции..
Представляем SuperGLUE: новую надежду против Muppetkind
За последний год модели машинного обучения значительно улучшили результаты по многим задачам понимания языка в НЛП. ELMo , BERT , ALICE, модель, ранее известная как BigBird (теперь MT-DNN ), и OpenAI GPT предложили удивительно эффективный рецепт, сочетающий предварительное обучение языкового моделирования на огромных наборах текстовых данных с простой многозадачностью и переносом. методы обучения, которые адаптируют полученную модель к последующим приложениям.
КЛЕЙ , выпущенный год..