Познакомьтесь с ландшафтом обработки естественного языка!
Русский химик Дмитрий Менделеев опубликовал первую Периодическую таблицу в 1869 году. Пришло время организовать задачи НЛП в стиле Периодической таблицы!
Варианты и структура задач НЛП бесконечны. Тем не менее, вы можете подумать о создании конвейеров НЛП на основе стандартных задач НЛП и разделении их на группы. Но что влекут за собой эти задачи?
Более 80 часто используемых задач НЛП включены в 15 групп!
Группы задач
- Загрузка исходных данных 💾 Задачи из этой группы заботятся о текстовых данных для анализа НЛП.
- Генерация обучающих данных 💎 Генерация золотых данных, которые необходимы для обучения языковых моделей.
- Анализ слов 🔬 Разделение текста на токены и создание первых структурированных метаданных для каждого токена.
- Обработка текста 🛠 Улучшение формата токена на лексическом уровне.
- Фразы и сущности 🗣 Распознавание многобуквенных фраз.
- Entity Enriching 🏛 Обогащение сущностей структурированными метаданными.
- Предложения и абзацы 📃 Работа со смыслом и связностью слов на уровне предложений и абзацев.
- Документы 📚 Обработка единства текстовых данных на уровне документов.
- Модели естественного языка 💃 Шаги по построению респектабельной языковой модели.
- Контролируемая классификация 🚩 Классификация текстовых данных на всех уровнях.
- Неконтролируемая передача сигналов 🙈 Неконтролируемое обнаружение важных сигналов.
- Сходство 👯 Вычисление близости разных фрагментов текста.
- Создание естественного языка 🤖 Создание контента, как если бы он был написан людьми.
- Системы 🚀 Системы НЛП как основа для интерактивных приложений.
- Визуализация информации ✨ Визуализация текстовой информации для лучшего понимания сложных текстовых данных.
Здесь вы можете найти статьи о группах и задачах НЛП!