Вы когда-нибудь думали, что хотите прочитать не полный текст, а только краткое содержание? Я думал об этом много раз. Концепция суммирования текста помогает в этом.

Определение

Согласно Берри М.В. и соавт. реферирование текста — это процесс извлечения наиболее важной информации из текста для создания сокращенной версии для конкретной задачи и пользователя.

Очень важно, чтобы правильное и полезное резюме было беглым, непрерывным и отображало важное.

Почему автоматическое суммирование текста

Есть много причин, по которым следует использовать автоматическое суммирование текста. Некоторые из них очевидны, некоторые нет.

Каждый может подумать, что автоматическое суммирование текста может сократить время чтения. Более того, когда кто-то ищет конкретный документ, ему будет легче найти его, прочитав сводку искомых документов.

Однако автоматическое суммирование текста может сделать индексацию более эффективной и менее предвзятой, чем человек. Используя такое обобщение, коммерческие службы могут обрабатывать больше документов.

Типы реферирования текста

Существует две основные категории методов суммирования текста:

  1. экстрактивный
  2. Абстрактное

Извлекающее суммирование текста

Этот метод был разработан первым, и его основная цель состоит в том, чтобы создать резюме, добавив наиболее значимые предложения. Этот метод создает резюме с предложениями из исходного текста.

Абстрактное суммирование текста

Это более продвинутый и сложный метод. Этот подход воспроизводит контекст, определяя наиболее значимые части. В отличие от предыдущего метода, реферат не состоит из подлинных предложений исходного текста. Наоборот, предложения генерируются по-новому, на основе исходного документа.

Ссылки на журналы





https://www.machinelearningplus.com/nlp/text-summarization-approaches-nlp-example/

Рекомендации

Берри М.В., Дюме С.Т. и О’Брайен Г.В. Использование линейной алгебры для интеллектуального поиска информации. SIAM Rev., 37(4): 573–595, 1995.