Публикации по теме 'tesseract'
ИЗВЛЕЧЕНИЕ ДОКУМЕНТА
Извлечение или классификация документов являются основными вариантами использования в любой отрасли, особенно там, где основная часть операций по-прежнему выполняется с использованием физических документов. Документы часто сильно неструктурированы, написаны от руки и требуют ручных усилий для извлечения или обновления любой информации о процессе, что увеличивает усилия и работу организации. В таких случаях извлечение информации может быть ручным занятием. Механизм оптического..
Tesseract OCR с JavaScript
OCR (оптическое распознавание символов) - это электронное или механическое преобразование печатных изображений, рукописного или набранного текста в машинно-кодированный текст.
Tesseract .js - это библиотека OCR, которая позволяет нам читать символы с изображения и преобразовывать их в текст, который может быть обработан с помощью JavaScript.
В этой статье я продемонстрирую, как вы можете настроить новый проект JavaScript, который использует Tesseract.js. Затем я покажу, как..
Набор инструментов для визуального тестирования
Интеграция OpenCV, Galen и Tesseract с Selenium
Наиболее распространенным вариантом использования визуального тестирования является регрессионное тестирование с использованием базовых изображений. Однако есть и другие аспекты визуального тестирования, которые стоит обсудить. Мы рассмотрим сопоставление шаблонов (с использованием OpenCV ), тестирование макета (с использованием Galen ) и OCR (с использованием Tesseract ) и покажем, как легко интегрировать эти инструменты в..
Простое распознавание текста с помощью Tesseract
Как научить Tesseract читать ваш уникальный шрифт
В этой статье я хочу поделиться с вами, как создать простое распознавание текста с помощью Tesseract, « механизма оптического распознавания символов для различных операционных систем ». Сам Tesseract - это бесплатное программное обеспечение, первоначально разработанное Hewlett-Packard до 2006 года, когда разработку взяла на себя Google. Это, пожалуй, лучший на сегодняшний день готовый механизм распознавания текста с поддержкой..
Приложения и проблемы интеграции OCR на нашу платформу
Сегодня сотрудники живут насыщенной жизнью, и у них мало времени для выполнения транзакционных задач, таких как заполнение форм приема на работу, своевременное уведомление о расходах и т. Д. Возможность автоматизировать транзакционные задачи и высвободить пропускную способность для сотрудников всегда была в центре внимания Darwinbox. Это, в сочетании с намерением постоянно улучшать взаимодействие с пользователем на платформе, побудило нас решать инженерные задачи, которые могут вывести..
Вопросы по теме 'tesseract'
Какой идеальный шрифт для распознавания текста?
Есть ли у кого-нибудь опыт работы с разными шрифтами для OCR? Я генерирую идентификатор, а затем пытаюсь отсканировать его с помощью tesseract. На данный момент я просто использую разные шрифты, но это кажется довольно неэффективным. Я пробовал...
41575 просмотров
schedule
22.03.2023
Компиляция tesseract-ocr на ARM/Gumstix?
Можно ли скомпилировать tesseract-ocr для Intel PXA270 найдено в некоторых доски Gumstix ? Кто-нибудь сделал это успешно, и если да, то как вы это сделали?
1958 просмотров
schedule
24.05.2023
Значение Bytes Per Pixel для байтового представления изображения в Android
В настоящее время я пишу приложение для Android, в котором необходимо использовать OCR.
Для этого я использую Tesseract в сочетании с проектом tesseract-android-tools .
Мне удалось инициализировать Tesseract API, и мне нужно использовать...
6762 просмотров
schedule
22.04.2022
Приложение вылетает в iOS 4.1+, но успешно работает в 4.0
У меня есть приложение, которое использует некоторые сторонние библиотеки, например библиотеку Tesseract. Приложение было разработано в Xcode 3 с SDK 4.0 и отлично работало. Но несколько дней назад я решил обновить свой Xcode и SDK. Итак, я...
430 просмотров
schedule
07.03.2023
проблема с этим модулем Image::OCR::Tesseract
У меня установлен activestate perl v5.8.8. Я устанавливаю следующий модуль Image::OCR::Tesseract с ppm
когда я пытаюсь запустить следующий код:
use Image::OCR::Tesseract 'get_ocr';
my $image = 'my_image.jp';
my $text = get_ocr($image);...
592 просмотров
schedule
20.06.2022
Тессеракт путает два числа
Пишу приложение для сканирования чисел с изображения.
В числах используется шрифт OCR-B, они также могут содержать символы + и > .
Это мое исходное изображение:
Сканирование с использованием Tesseract было не очень хорошим, даже...
11545 просмотров
schedule
23.10.2023
внедрить tesseract OCR в iphone
я хочу реализовать распознавание рукописного ввода в своем проекте
например, когда пользователь пишет A на экране, на экране должно отображаться A ,
Я искал в Google и до сих пор нашел tesseract OCR , но я не понимаю, что такое tesseract...
4328 просмотров
schedule
23.11.2022
Преобразование черно-белого UIImage, а не оттенков серого для использования tesseract
Я использую tesseract в своем приложении для iPhone.
Я попробовал несколько фильтров на своем изображении для преобразования его в изображение в градациях серого, однако я хотел бы получить результат, в котором порог устанавливается так, чтобы...
6039 просмотров
schedule
09.06.2023
тренировочный тессеракт и многостраничный tiff
Я использую tesseract 3.0.1 на Windows 7 64 бит.
В документации по обучению сказано:
Каждый шрифт должен быть помещен в один многостраничный TIFF ( только если вы используете libtiff! )
Я не знаком с libtiff. Я использую ImageMagick...
1431 просмотров
schedule
19.05.2022
OCR — получение текста из изображения с использованием tesseract 3.0 и imagemagick 6.6.5
Я пытаюсь создать сценарий оболочки, который позволяет мне искать текст в изображении. Основываясь на тексте, скрипт сделает все возможное, чтобы получить текст с изображения. Я хотел, чтобы вы внесли свой вклад в это, поскольку этот скрипт,...
12945 просмотров
schedule
29.01.2023
php exec tesseract выводит пустой массив
Я установил tesseract v3.01 на Windows 7. Я добавил путь tesseract к переменным среды. Я получаю правильный вывод после ввода этой команды в окнах cmd: «tesseract test.tif test».
Когда я пытаюсь получить тот же результат в php, используя следующий...
1790 просмотров
schedule
07.06.2022
Проблемы сборки Tesseract 3.01 и Pocket-OCR
У меня возникли некоторые проблемы, указанные ниже, при попытке создать Pocket-OCR
Неопределенные символы для архитектуры i386: "tesseract :: TessBaseAPI :: SetVariable (char const *, char const *)", ссылка на которую имеется: -...
1580 просмотров
schedule
29.03.2023
Есть ли в Matlab встроенная библиотека OCR или набор инструментов?
Мне нужна предварительно созданная (то есть уже обученная) библиотека OCR, которая распознает простые символы (стандартные шрифты, такие как Arial, Times New Roman, Courier и т. д.). Есть ли в Matlab что-то подобное в одном из наборов инструментов?...
4526 просмотров
schedule
18.04.2022
Добавление пользовательских фраз в белый список Tesseract
Я создаю простое приложение Tesseract для Android, целью которого является распознавание простых команд, таких как CALL, MESSAGE и т. д. Поскольку количество команд невелико и фиксировано, я хочу добавить их в белый список, чтобы программа могла...
1684 просмотров
schedule
05.08.2022
Android Tesseract и Leptonica OCR. Чтение отдельного поля и символа
Я работаю с Tesseract на Android, и у меня есть следующий код для извлечения строки и полей, считанных из изображения:
TessBaseAPI baseApi = new TessBaseAPI();
baseApi.init(tess_path, "eng");
baseApi.setImage(bitmap);
String recognizedText =...
2532 просмотров
schedule
17.04.2023
Tess4J: Как использовать ResultIterator?
Я конвертирую свое приложение OCR с c++ на java. Используя Tess4J, я хотел бы получить ограничивающие рамки для каждого слова. Однако, по-видимому, TessResultIterator не предоставляет никаких методов. Так что я хотел бы, если можно как-то получить...
5947 просмотров
schedule
13.02.2023
tessbaseAPI.getUTF8Text() аварийно завершает работу при запуске на Samsung GalaxyTab
Я работаю над приложением для Android на основе OCR. Для этого я использую библиотеку Tesseract. Мое приложение отлично работает на устройстве Sony Ericsson Xperia Arc S . Однако это же приложение аварийно завершает работу на моем Samsung...
1742 просмотров
schedule
13.05.2022
Извлечение строк из изображения для передачи в OCR - Tesseract
Я смотрел это выступление на pycon http://youtu.be/B1d9dpqBDVA?t=15m34s около на отметке 15:33 говорящий говорит об извлечении строк из изображения (квитанции) и последующей передаче их в механизм распознавания текста, чтобы текст можно было лучше...
8340 просмотров
schedule
14.07.2022
Обучение тессеракту - проблема с кластеризацией формы
Я пытаюсь обучить tesseract (добавляя новый шрифт только для цифр) в соответствии с инструкциями, найденными здесь: http://code.google.com/p/tesseract-ocr/wiki/TrainingTesseract3
Что я наделал:
Создал PDF с образцом текста, преобразовал в...
2373 просмотров
schedule
25.06.2023
распознавание китайских иероглифов с помощью Tesseract OCR
Я использовал Tesseract 3.0.2 OCR SDK для извлечения текста из изображений. Но если я использую китайские текстовые изображения и прохожу через OCR, тогда Tesseract не предоставляет мне китайские иероглифы, вместо этого я получаю числовые и...
14694 просмотров
schedule
17.05.2022