Форум сайта python.su
Здравствуйте.
Есть вот такой файл:
https://grfc.ru/upload/medialibrary/7bd/Perechen-voprosov-dlya-proverki-sootvetstviya-ekspluatatsionnoy-i-tekhnicheskoy-gotovnosti.docx
Как его распарсить?
Я просто сохранил в текстовый, и потом делал f.read(). Потерялись картинки.
Офлайн
docx это zip архив с блекджеком и шлю… xml и картинками, можете просто выдрать картинки оттуда, если знаете куда их потом поместить, или распарсить xml с помощью одноименного модуля, или воспользоваться готовым модулем для работы с .docx: python-docx.
[code python][/code]
Отредактировано PEHDOM (Июнь 8, 2021 17:22:09)
Офлайн
nosejo22Синтакси́ческий ана́лиз (или разбор, жарг. па́рсинг ← англ. parsing) — процесс сопоставления линейной последовательности лексем (слов, токенов) естественного или формального языка с его формальной грамматикой. Результатом обычно является дерево разбора (синтаксическое дерево).
Как его распарсить?
Офлайн