Найти - Пользователи
Полная версия: Подготовка изображения для Tesseract OCR
Начало » Python для новичков » Подготовка изображения для Tesseract OCR
1
taketa
Доброго времени суток.
Нужно распознавать числа с изображений (светлые числа на темном фоне).
Подскажите каким образом можно с помощью Python подготавливать изображения для лучшего распознавания в Tesseract OCR.
Вручную добился наилучшего распознавания через XnViewMP используюя следующие параметры:

1)HLS - make it grayscale:
Hue: 0
Lightness: 0
Saturation: -127
2)Levels - lower black level a bit so that the gray noise will disappear
Black point: 0
White point: 212 - may vary depending on image
3)Reduce noise filter
4)Adjust for increasing the contrast
Brightness: 0
Contrast: 127 - this one matters
Gamma: 1.06
5)Minimum for making the black thicker
Filter size: 5x5 - may vary depending on image

Заранее благодарен за помощь.
4kpt_III
Смотрите в сторону Pillow. Там собрана большая часть механизмов для работы с изображениями…
This is a "lo-fi" version of our main content. To view the full version with more information, formatting and images, please click here.
Powered by DjangoBB