Привет.
Прошу направить на нужный путь. Конкретного решения не требуется, требуется подсказать инструменты и принцип реализации.
Дано: скрипт, которому на вход будет дан pdf файл (обязательно созданный из офисного документа, то есть в pdf не изображения, а слой с текстом). Скрипт будет определять, на каких страницах отсутствует текст в количестве строк N+1 от конца последнего абзаца до нижнего колонтитула (его высота задана в скрипте). На месте этой пустой области скрипт будет рисовать какой-то символ.
Pdf файлы обрабатываю через PyPDF2. Вопрос с инструментом (готовой питоновской библиотекой, если такая есть) для обнаружение пустых мест между текстом и нижним колонтитулом. OpenCV? Что-то еще?
По принципу, все, конечно, зависит от библиотеки, но в первом приближении вижу такое исполнение: найти ширину строки в у.е. и кол-во строк. Умножив, получаю примерную (точную не нужно) заполненность страницы в у.е. и сравниваю с у.е. полностью заполненной страницы. Если разница получится больше или равна N+1 у.е., то рисую знак. Чем рисовать, пока не понял.