LIVEPROJECT

Построение специфичных для предметной области языковых моделей

Модель N-грамм, RNN, LSTM, AllenNLP

Мы только что запустили нашу платформу liveProject, где вы можете подписаться на структурированный проект и получить реальный опыт.

В this liveProject вы станете специалистом по обработке естественного языка данных, работающим в Stack Exchange. У Stack Exchange есть сеть сайтов вопросов и ответов по различным темам, от программирования до кулинарии. Ваш босс хочет, чтобы вы создали языковые модели, настроенные на конкретную лексику различных сайтов Stack Exchange. Язык зависит от предметной области, например, в документах страховой компании используется совершенно другая терминология, чем в сообщениях в социальных сетях. Из-за этого готовые модели НЛП, обученные на общем тексте, могут быть неточными для специализированных областей. Ваша цель - построить языковую модель, способную выполнять запросы, генерировать текст и выбирать предложения для предметно-ориентированного языка сайта перекрестной проверки статистики и машинного обучения. Задачи, которые вам предстоит решить, включают подготовку ваших наборов данных, построение и оценку языковых моделей на основе n-граммов, а также построение символьной языковой модели с помощью AllenNLP.

Узнайте больше о liveProject здесь: https://liveproject.manning.com/