тренировочный тессеракт и многостраничный tiff

Я использую tesseract 3.0.1 на Windows 7 64 бит.

В документации по обучению сказано:

Каждый шрифт должен быть помещен в один многостраничный TIFF (только если вы используете libtiff!)

Я не знаком с libtiff. Я использую ImageMagick для создания многостраничных TIFF. Пока это работает хорошо, или, по крайней мере, кажется. Ожидается ли, что позже я получу несколько дорожных препятствий? Если да, то что делать с libtiff - достаточно запустить его настройку или надо что-то настраивать?


person Yaron Naveh    schedule 27.05.2012    source источник


Ответы (1)


Tesseract не волнует, как вы создали свой многостраничный tiff, если он может прочитать его с помощью leptonica (которая внутренне зависит от libtiff). Если tesseract может обработать ваш TIFF сейчас, он может делать то же самое для остальной части процесса обучения, а также запускать OCR, так что все готово. Я создал свой многостраничный TIFF со стандартной библиотекой .Net, и у tesseract не было с этим проблем.

person Showang You    schedule 28.05.2012