Это продолжение туториальной части 1.

Недостатком алгоритма сопоставления на основе шаблона является то, что мы рассматриваем только корреляцию, которой может быть недостаточно для распознавания.

Алгоритм 3:

Распознавание на основе машинного обучения

Создание набора данных:

Если мы будем следовать шагам алгоритма 2, у нас будет набор изображений символов размером 50x50 и соответствующие метки.

Идея состоит в том, чтобы извлечь признаки LBP из набора данных и использовать для классификации алгоритм машинного обучения с учителем SVM. Я выбрал функции LBP, которые могут захватывать текстуру изображения с помощью LBP.

Поскольку для этой задачи нет общедоступного набора данных, я использовал подход с обратной связью, при котором я предсказываю текст, написанный пользователем, и запрашиваю обратную связь от пользователя, запрашивающего прогнозы ошибок в тексте. Таким образом, я дополнил набор данных поезда от пользователя.

  • Этот подход может дать точность выше средней, поскольку мы используем подход с обратной связью для увеличения, и SVM может изучить задачу распознавания символов с достаточным количеством данных.
  • Полный код доступен по адресу: https://github.com/manikantanallagatla/OCR-With-MachineLearning.

Алгоритм 4:

Распознавание на основе глубокого обучения

Идея состоит в том, чтобы создать глубокую нейронную сеть для классификации персонажей. Основным недостатком этого подхода является то, что нам потребуется большой набор данных, который недоступен.