DjangoBB LoFi version

Полная версия: Подготовка изображения для Tesseract OCR

Начало » Python для новичков » Подготовка изображения для Tesseract OCR

taketa

Июль 15, 2015 18:17:52

Доброго времени суток.
Нужно распознавать числа с изображений (светлые числа на темном фоне).
Подскажите каким образом можно с помощью Python подготавливать изображения для лучшего распознавания в Tesseract OCR.
Вручную добился наилучшего распознавания через XnViewMP используюя следующие параметры:

1)HLS - make it grayscale:
Hue: 0
Lightness: 0
Saturation: -127
2)Levels - lower black level a bit so that the gray noise will disappear
Black point: 0
White point: 212 - may vary depending on image
3)Reduce noise filter
4)Adjust for increasing the contrast
Brightness: 0
Contrast: 127 - this one matters
Gamma: 1.06
5)Minimum for making the black thicker
Filter size: 5x5 - may vary depending on image

Заранее благодарен за помощь.

4kpt_III

Июль 15, 2015 19:59:22

Смотрите в сторону Pillow. Там собрана большая часть механизмов для работы с изображениями…