Как словарь переносов используется для расстановки переносов?

Я читал о расстановке переносов и узнал, что расстановка переносов зависит от словаря, который мы используем для конкретного языка. Для некоторых слов Microsoft Office расставляет переносы не так, как LibreOffice. Я попытался открыть словарьhyph_en_US.dic, но не смог понять его содержание. Чего я не понял, так это того, как используется словарь.

  1. Содержит ли он список слов для переноса?
  2. Содержит ли он правила для принятия решения о переносе слова через дефис?

Примечание. Я знаю, что они также используют алгоритмы для улучшения расстановки переносов, но в какой степени словарь играет роль?

Любая помощь будет высоко ценится.

С уважением, Анкур Вашиштха


person Coffee_lover    schedule 13.07.2018    source источник


Ответы (1)


LibreOffice, как и TeX, и многие другие программы используют алгоритм расстановки переносов, созданный Франклином М. Ляном. Этот алгоритм использует метод сопоставления с образцом для поиска точек переноса в словах. Для каждого языка используется отдельный файл словаря, содержащий шаблоны. Согласно тезису Франклина М. Ляна:

Эти шаблоны находят 89% дефисов в списке слов карманного словаря практически без ошибок.

Трудно сказать, как это делает Word, поскольку это проприетарное программное обеспечение. Я предполагаю, что он использует не такой алгоритм, а настоящий словарь со 100% правильными точками переноса. Это объясняет, почему переносы в Word отличаются и более точны.

person Krisztián Balla    schedule 02.02.2019