Это продолжение туториальной части 1.
Недостатком алгоритма сопоставления на основе шаблона является то, что мы рассматриваем только корреляцию, которой может быть недостаточно для распознавания.
Алгоритм 3:
Распознавание на основе машинного обучения
Создание набора данных:
Если мы будем следовать шагам алгоритма 2, у нас будет набор изображений символов размером 50x50 и соответствующие метки.
Идея состоит в том, чтобы извлечь признаки LBP из набора данных и использовать для классификации алгоритм машинного обучения с учителем SVM. Я выбрал функции LBP, которые могут захватывать текстуру изображения с помощью LBP.
Поскольку для этой задачи нет общедоступного набора данных, я использовал подход с обратной связью, при котором я предсказываю текст, написанный пользователем, и запрашиваю обратную связь от пользователя, запрашивающего прогнозы ошибок в тексте. Таким образом, я дополнил набор данных поезда от пользователя.
- Этот подход может дать точность выше средней, поскольку мы используем подход с обратной связью для увеличения, и SVM может изучить задачу распознавания символов с достаточным количеством данных.
- Полный код доступен по адресу: https://github.com/manikantanallagatla/OCR-With-MachineLearning.
Алгоритм 4:
Распознавание на основе глубокого обучения
Идея состоит в том, чтобы создать глубокую нейронную сеть для классификации персонажей. Основным недостатком этого подхода является то, что нам потребуется большой набор данных, который недоступен.