Обработка языка с помощью нейронной сети
Нейронные сети позволяют обрабатывать проблемы так, как если бы они представляли собой временные ряды и последовательности.
Даже если они обеспечивают лучшую точность, все равно стоит проверить перед их внедрением, стоит ли их вычислительная стоимость улучшения по сравнению с более простыми классификаторами.
Функции
Вы должны учитывать вычислительную мощность вашего приложения, а также достаточный уровень точности, чтобы определить размер встраивания.
Архитектуры
- РНН
Это семейство нейронных сетей обрабатывает данные последовательно: каждое предсказанное слово учитывает предыдущее состояние для актуализации.
Состояние можно рассматривать как память, чтобы учитывать всю историю предсказания t.
Итак, у вас есть временной ряд, который на каждом шагу принимает в качестве входных данных наблюдение и предыдущее состояние.
- Сети с долговременной кратковременной памятью (LSTM)
LSTM может забыть некоторые прошлые наблюдения, чтобы важная информация могла быть взвешена в реальном прогнозе: ворота будут определять, насколько важны эти наблюдения, чтобы решить, следует ли записывать выходные данные или нет.
Остаточные нейронные сети
Они используются как для изображений, так и для текстов.
Это позволяет уменьшить жестокий эффект градиентного спуска, добавив в математическую функцию предыдущее состояние.