Предположим, у меня очень длинный текст, и я хотел бы выделить определенную длину контекста вокруг определенного слова. Например, в следующем тексте я хотел бы выделить 8 слов вокруг слова воин.
........
........
... умер. Он был очень храбрым воином, борющимся за свободу вопреки всему ...
........
........
В этом случае результат будет
Он был очень храбрым воином, борющимся за свободу
Обратите внимание, как я отбросил слово «умер», так как я предпочел бы начинать с начала полного предложения, и как я извлек больше, чем 8 слов, потому что fight for freedom
гораздо значительнее, чем просто борьба за.
Существуют ли какие-либо алгоритмы или исследования в этой области, которым я мог бы следовать? Как мне подойти к решению этой проблемы.