Форум сайта python.su
0
Доброго времени суток.
Нужно распознавать числа с изображений (светлые числа на темном фоне).
Подскажите каким образом можно с помощью Python подготавливать изображения для лучшего распознавания в Tesseract OCR.
Вручную добился наилучшего распознавания через XnViewMP используюя следующие параметры:
1)HLS - make it grayscale:
Hue: 0
Lightness: 0
Saturation: -127
2)Levels - lower black level a bit so that the gray noise will disappear
Black point: 0
White point: 212 - may vary depending on image
3)Reduce noise filter
4)Adjust for increasing the contrast
Brightness: 0
Contrast: 127 - this one matters
Gamma: 1.06
5)Minimum for making the black thicker
Filter size: 5x5 - may vary depending on image
Заранее благодарен за помощь.
Офлайн
39
Смотрите в сторону Pillow. Там собрана большая часть механизмов для работы с изображениями…
Офлайн