Форум сайта python.su
По хорошему завидую людям, хорошо владеющим английским Я читаю как первокласник - продуманно, по буквам и слогам) Прекрасно понимаю, что английский - необходимость для всех программистов (кроме 1С). Его, к сожалению даже в школе не учил. Самонедоучка я)
Про подтяжку хлама, да, по ходу я был не прав - это pandas большая и тянет всё, даже код, который в контексте твоей программы окажется “мертвым” (к примеру pyqt4 и pyqt5). Почему-то так и не смог установить pandas через pip (venv под pycharm, windows 10). Есть другие способы установки, но мне почему-то сдался именно этот.
Слушай, это конечно красиво через pandas, который много умеет. Думаю, что для парсинга хватит python с батарейками, а записать в excel через какой-нибудь xlwt (именно он пишет pandas). Как думаешь, возможно?
Про venv думаю это не столько блажь (строго не обязательная сейчас для тебя), сколько путь приобщения к хорошим питонячьим практикам.
Офлайн
mc-blackТут некоторые опытные люди высказывают мнение что он вообще не нужен во многих проектах. Мы его тоже практически не используем.
Про venv думаю это не столько блажь (строго не обязательная сейчас для тебя), сколько путь приобщения к хорошим питонячьим практикам.
Офлайн
mc-blackВыпустил новый релиз, который не требует использования Foxit Reader для промежуточной конвертации PDF в текст. Для этого пришлось внести изменения в штатный pdfminer.six
По поводу раздельного (вручную) распознавания foxit в текст. Это пожалуй слабое место, нельзя ли программно это сделать через интерфейс командной строки (если он есть) или через средства автоматизации? Может быть найдется бесплатная альтернатива, работающая из командной строки и без установки?
Отредактировано Ev2geny (Сен. 2, 2020 14:19:41)
Офлайн