Публикации по теме 'tesseract'


ИЗВЛЕЧЕНИЕ ДОКУМЕНТА
Извлечение или классификация документов являются основными вариантами использования в любой отрасли, особенно там, где основная часть операций по-прежнему выполняется с использованием физических документов. Документы часто сильно неструктурированы, написаны от руки и требуют ручных усилий для извлечения или обновления любой информации о процессе, что увеличивает усилия и работу организации. В таких случаях извлечение информации может быть ручным занятием. Механизм оптического..

Tesseract OCR с JavaScript
OCR (оптическое распознавание символов) - это электронное или механическое преобразование печатных изображений, рукописного или набранного текста в машинно-кодированный текст. Tesseract .js - это библиотека OCR, которая позволяет нам читать символы с изображения и преобразовывать их в текст, который может быть обработан с помощью JavaScript. В этой статье я продемонстрирую, как вы можете настроить новый проект JavaScript, который использует Tesseract.js. Затем я покажу, как..

Набор инструментов для визуального тестирования
Интеграция OpenCV, Galen и Tesseract с Selenium Наиболее распространенным вариантом использования визуального тестирования является регрессионное тестирование с использованием базовых изображений. Однако есть и другие аспекты визуального тестирования, которые стоит обсудить. Мы рассмотрим сопоставление шаблонов (с использованием OpenCV ), тестирование макета (с использованием Galen ) и OCR (с использованием Tesseract ) и покажем, как легко интегрировать эти инструменты в..

Простое распознавание текста с помощью Tesseract
Как научить Tesseract читать ваш уникальный шрифт В этой статье я хочу поделиться с вами, как создать простое распознавание текста с помощью Tesseract, « механизма оптического распознавания символов для различных операционных систем ». Сам Tesseract - это бесплатное программное обеспечение, первоначально разработанное Hewlett-Packard до 2006 года, когда разработку взяла на себя Google. Это, пожалуй, лучший на сегодняшний день готовый механизм распознавания текста с поддержкой..

Приложения и проблемы интеграции OCR на нашу платформу
Сегодня сотрудники живут насыщенной жизнью, и у них мало времени для выполнения транзакционных задач, таких как заполнение форм приема на работу, своевременное уведомление о расходах и т. Д. Возможность автоматизировать транзакционные задачи и высвободить пропускную способность для сотрудников всегда была в центре внимания Darwinbox. Это, в сочетании с намерением постоянно улучшать взаимодействие с пользователем на платформе, побудило нас решать инженерные задачи, которые могут вывести..

Вопросы по теме 'tesseract'

Какой идеальный шрифт для распознавания текста?
Есть ли у кого-нибудь опыт работы с разными шрифтами для OCR? Я генерирую идентификатор, а затем пытаюсь отсканировать его с помощью tesseract. На данный момент я просто использую разные шрифты, но это кажется довольно неэффективным. Я пробовал...
41575 просмотров
schedule 22.03.2023

Компиляция tesseract-ocr на ARM/Gumstix?
Можно ли скомпилировать tesseract-ocr для Intel PXA270 найдено в некоторых доски Gumstix ? Кто-нибудь сделал это успешно, и если да, то как вы это сделали?
1958 просмотров

Значение Bytes Per Pixel для байтового представления изображения в Android
В настоящее время я пишу приложение для Android, в котором необходимо использовать OCR. Для этого я использую Tesseract в сочетании с проектом tesseract-android-tools . Мне удалось инициализировать Tesseract API, и мне нужно использовать...
6762 просмотров
schedule 22.04.2022

Приложение вылетает в iOS 4.1+, но успешно работает в 4.0
У меня есть приложение, которое использует некоторые сторонние библиотеки, например библиотеку Tesseract. Приложение было разработано в Xcode 3 с SDK 4.0 и отлично работало. Но несколько дней назад я решил обновить свой Xcode и SDK. Итак, я...
430 просмотров
schedule 07.03.2023

проблема с этим модулем Image::OCR::Tesseract
У меня установлен activestate perl v5.8.8. Я устанавливаю следующий модуль Image::OCR::Tesseract с ppm когда я пытаюсь запустить следующий код: use Image::OCR::Tesseract 'get_ocr'; my $image = 'my_image.jp'; my $text = get_ocr($image);...
592 просмотров
schedule 20.06.2022

Тессеракт путает два числа
Пишу приложение для сканирования чисел с изображения. В числах используется шрифт OCR-B, они также могут содержать символы + и > . Это мое исходное изображение: Сканирование с использованием Tesseract было не очень хорошим, даже...
11545 просмотров
schedule 23.10.2023

внедрить tesseract OCR в iphone
я хочу реализовать распознавание рукописного ввода в своем проекте например, когда пользователь пишет A на экране, на экране должно отображаться A , Я искал в Google и до сих пор нашел tesseract OCR , но я не понимаю, что такое tesseract...
4328 просмотров
schedule 23.11.2022

Преобразование черно-белого UIImage, а не оттенков серого для использования tesseract
Я использую tesseract в своем приложении для iPhone. Я попробовал несколько фильтров на своем изображении для преобразования его в изображение в градациях серого, однако я хотел бы получить результат, в котором порог устанавливается так, чтобы...
6039 просмотров
schedule 09.06.2023

тренировочный тессеракт и многостраничный tiff
Я использую tesseract 3.0.1 на Windows 7 64 бит. В документации по обучению сказано: Каждый шрифт должен быть помещен в один многостраничный TIFF ( только если вы используете libtiff! ) Я не знаком с libtiff. Я использую ImageMagick...
1431 просмотров
schedule 19.05.2022

OCR — получение текста из изображения с использованием tesseract 3.0 и imagemagick 6.6.5
Я пытаюсь создать сценарий оболочки, который позволяет мне искать текст в изображении. Основываясь на тексте, скрипт сделает все возможное, чтобы получить текст с изображения. Я хотел, чтобы вы внесли свой вклад в это, поскольку этот скрипт,...
12945 просмотров
schedule 29.01.2023

php exec tesseract выводит пустой массив
Я установил tesseract v3.01 на Windows 7. Я добавил путь tesseract к переменным среды. Я получаю правильный вывод после ввода этой команды в окнах cmd: «tesseract test.tif test». Когда я пытаюсь получить тот же результат в php, используя следующий...
1790 просмотров
schedule 07.06.2022

Проблемы сборки Tesseract 3.01 и Pocket-OCR
У меня возникли некоторые проблемы, указанные ниже, при попытке создать Pocket-OCR Неопределенные символы для архитектуры i386: "tesseract :: TessBaseAPI :: SetVariable (char const *, char const *)", ссылка на которую имеется: -...
1580 просмотров
schedule 29.03.2023

Есть ли в Matlab встроенная библиотека OCR или набор инструментов?
Мне нужна предварительно созданная (то есть уже обученная) библиотека OCR, которая распознает простые символы (стандартные шрифты, такие как Arial, Times New Roman, Courier и т. д.). Есть ли в Matlab что-то подобное в одном из наборов инструментов?...
4526 просмотров
schedule 18.04.2022

Добавление пользовательских фраз в белый список Tesseract
Я создаю простое приложение Tesseract для Android, целью которого является распознавание простых команд, таких как CALL, MESSAGE и т. д. Поскольку количество команд невелико и фиксировано, я хочу добавить их в белый список, чтобы программа могла...
1684 просмотров
schedule 05.08.2022

Android Tesseract и Leptonica OCR. Чтение отдельного поля и символа
Я работаю с Tesseract на Android, и у меня есть следующий код для извлечения строки и полей, считанных из изображения: TessBaseAPI baseApi = new TessBaseAPI(); baseApi.init(tess_path, "eng"); baseApi.setImage(bitmap); String recognizedText =...
2532 просмотров
schedule 17.04.2023

Tess4J: Как использовать ResultIterator?
Я конвертирую свое приложение OCR с c++ на java. Используя Tess4J, я хотел бы получить ограничивающие рамки для каждого слова. Однако, по-видимому, TessResultIterator не предоставляет никаких методов. Так что я хотел бы, если можно как-то получить...
5947 просмотров
schedule 13.02.2023

tessbaseAPI.getUTF8Text() аварийно завершает работу при запуске на Samsung GalaxyTab
Я работаю над приложением для Android на основе OCR. Для этого я использую библиотеку Tesseract. Мое приложение отлично работает на устройстве Sony Ericsson Xperia Arc S . Однако это же приложение аварийно завершает работу на моем Samsung...
1742 просмотров
schedule 13.05.2022

Извлечение строк из изображения для передачи в OCR - Tesseract
Я смотрел это выступление на pycon http://youtu.be/B1d9dpqBDVA?t=15m34s около на отметке 15:33 говорящий говорит об извлечении строк из изображения (квитанции) и последующей передаче их в механизм распознавания текста, чтобы текст можно было лучше...
8340 просмотров
schedule 14.07.2022

Обучение тессеракту - проблема с кластеризацией формы
Я пытаюсь обучить tesseract (добавляя новый шрифт только для цифр) в соответствии с инструкциями, найденными здесь: http://code.google.com/p/tesseract-ocr/wiki/TrainingTesseract3 Что я наделал: Создал PDF с образцом текста, преобразовал в...
2373 просмотров
schedule 25.06.2023

распознавание китайских иероглифов с помощью Tesseract OCR
Я использовал Tesseract 3.0.2 OCR SDK для извлечения текста из изображений. Но если я использую китайские текстовые изображения и прохожу через OCR, тогда Tesseract не предоставляет мне китайские иероглифы, вместо этого я получаю числовые и...
14694 просмотров
schedule 17.05.2022