Познакомьтесь с ландшафтом обработки естественного языка!

Русский химик Дмитрий Менделеев опубликовал первую Периодическую таблицу в 1869 году. Пришло время организовать задачи НЛП в стиле Периодической таблицы!

Варианты и структура задач НЛП бесконечны. Тем не менее, вы можете подумать о создании конвейеров НЛП на основе стандартных задач НЛП и разделении их на группы. Но что влекут за собой эти задачи?

Более 80 часто используемых задач НЛП включены в 15 групп!

Группы задач

  1. Загрузка исходных данных 💾 Задачи из этой группы заботятся о текстовых данных для анализа НЛП.
  2. Генерация обучающих данных 💎 Генерация золотых данных, которые необходимы для обучения языковых моделей.
  3. Анализ слов 🔬 Разделение текста на токены и создание первых структурированных метаданных для каждого токена.
  4. Обработка текста 🛠 Улучшение формата токена на лексическом уровне.
  5. Фразы и сущности 🗣 Распознавание многобуквенных фраз.
  6. Entity Enriching 🏛 Обогащение сущностей структурированными метаданными.
  7. Предложения и абзацы 📃 Работа со смыслом и связностью слов на уровне предложений и абзацев.
  8. Документы 📚 Обработка единства текстовых данных на уровне документов.
  9. Модели естественного языка 💃 Шаги по построению респектабельной языковой модели.
  10. Контролируемая классификация 🚩 Классификация текстовых данных на всех уровнях.
  11. Неконтролируемая передача сигналов 🙈 Неконтролируемое обнаружение важных сигналов.
  12. Сходство 👯 Вычисление близости разных фрагментов текста.
  13. Создание естественного языка 🤖 Создание контента, как если бы он был написан людьми.
  14. Системы 🚀 Системы НЛП как основа для интерактивных приложений.
  15. Визуализация информации ✨ Визуализация текстовой информации для лучшего понимания сложных текстовых данных.

Здесь вы можете найти статьи о группах и задачах НЛП!