Публикации по теме 'text-recognition'


Распознавание текста сцены в iOS 11
Примечание: этот пост изначально появился здесь . С выпуском iOS 11 в этом году Apple выпустила много новых фреймворков, и Vision framework является одним из них. Фреймворк Vision позволяет разработчикам приложений выполнять любую задачу, связанную с компьютерным зрением, даже без детального знания предмета. Сюда входит анализ лица (улыбка, хмурый взгляд и т. Д.), Обнаружение штрих-кода, классификация изображений сцены, обнаружение объектов, отслеживание и т. Д. В этом посте мы..

Быстрое ориентированное определение текста с помощью объединенной сети (FOTS)
Обнаружение и распознавание текста (также известное как определение текста) на изображении — очень полезная и сложная проблема, над которой исследователи глубокого обучения работают уже много лет из-за ее практического применения в таких областях, как сканирование документов, навигация роботов, поиск изображений и т. д. До сих пор почти все методы состояли из двух отдельных этапов: 1) Обнаружение текста 2) Распознавание текста. Обнаружение текста просто определяет, где находится текст..

IncepText: новый инструмент распознавания текста Alibaba с орлиным взглядом
Эта статья является частью серии Academic Alibaba и взята из статьи Qiangpeng Yang под названием Новый модуль начального текста с деформируемым объединением PSROI для многонаправленного обнаружения текста сцены . , Mengli Cheng, Wenmeng Zhou, Yan Chen, Minghui Qiu, Wei Lin и Wei Chu, принятые IJCAI 2018. Полностью статью можно прочитать здесь . Обнаружение текста сцены — расшифровка текста, который появляется в окружающей среде непосредственно из видеозаписи с камеры — является..

Социальная поддержка в быстром сканировании ссылок
Если вы не знаете, что такое Quick Link Scan , это приложение, которое я разработал пару лет назад. Исходная версия поддерживала только сканирование URL-адресов, с возможностью делать это с распечатанного плаката, выносного меню, визитной карточки или где-либо еще, просто отсканировав его с помощью телефона. Недавно я поддерживал соц. The Elevator Pitch Приложение, позволяющее открывать платформы социальных сетей путем сканирования тега учетной записи или хэштега. На..

Машина опорных векторов для распознавания рукописного алфавита
Цель написания этой статьи - использовать очень грубый подход к классификации изображений, в данном случае изображений рукописного текста. Хотя мы используем модели сверточной нейронной сети с нуля или используем предварительно обученную модель на наборах данных MNIST, она более подготовлена ​​для этой работы. Мы используем трансферное обучение, и в этом процессе я сам, будучи студентом, упускаю из виду самые основы. Это похоже на то, что я веду машину с автоматической коробкой передач, в..

Живой текст, больше похожий на новый текст
Через несколько недель iOS 15 станет общедоступной, и есть новая функция, которую Apple называет «Живой текст». Где вы можете захватить текст прямо с вашей камеры или с прошлой фотографии. Теперь это может звучать здорово, но вы можете проверить некоторые вещи, прежде чем прыгать на подножку, чтобы использовать эту функцию в iOS 15. Эта функция не обязательно новая, но теперь она встроена прямо в собственное программное обеспечение Apple, чтобы ускорить процесс вокруг нее. Подобные..

Распознавание текста с помощью Firebase MLKit
Официальное руководство по началу работы по распознаванию текста с помощью MLKit довольно простое. По крайней мере, при обработке локальных изображений: Мне было немного сложнее делать снимки на камеру и обрабатывать их, поэтому я собираюсь описать это. Официальное руководство разработчика по фотографированию сначала выглядит простым, начните намерение и получите фотографию в onActivityResult() , но если вы просто быстро пролетаете над ним, как я, вы можете пропустить, что..