Уведомления

Группа в Telegram: @pythonsu

#1 Июль 15, 2015 18:17:52

taketa
Зарегистрирован: 2015-05-22
Сообщения: 8
Репутация: +  0  -
Профиль   Отправить e-mail  

Подготовка изображения для Tesseract OCR

Доброго времени суток.
Нужно распознавать числа с изображений (светлые числа на темном фоне).
Подскажите каким образом можно с помощью Python подготавливать изображения для лучшего распознавания в Tesseract OCR.
Вручную добился наилучшего распознавания через XnViewMP используюя следующие параметры:

1)HLS - make it grayscale:
Hue: 0
Lightness: 0
Saturation: -127
2)Levels - lower black level a bit so that the gray noise will disappear
Black point: 0
White point: 212 - may vary depending on image
3)Reduce noise filter
4)Adjust for increasing the contrast
Brightness: 0
Contrast: 127 - this one matters
Gamma: 1.06
5)Minimum for making the black thicker
Filter size: 5x5 - may vary depending on image

Заранее благодарен за помощь.

Офлайн

#2 Июль 15, 2015 19:59:22

4kpt_III
Зарегистрирован: 2014-12-22
Сообщения: 999
Репутация: +  39  -
Профиль   Отправить e-mail  

Подготовка изображения для Tesseract OCR

Смотрите в сторону Pillow. Там собрана большая часть механизмов для работы с изображениями…

Офлайн

Board footer

Модераторировать

Powered by DjangoBB

Lo-Fi Version