nosejo22
Июнь 8, 2021 08:39:41
PEHDOM
Июнь 8, 2021 17:21:09
docx это zip архив с блекджеком и шлю… xml и картинками, можете просто выдрать картинки оттуда, если знаете куда их потом поместить, или распарсить xml с помощью одноименного модуля, или воспользоваться готовым модулем для работы с .docx: python-docx.
doza_and
Июнь 8, 2021 18:57:12
nosejo22
Как его распарсить?
Синтакси́ческий ана́лиз (или разбор, жарг. па́рсинг ← англ. parsing) — процесс сопоставления линейной последовательности лексем (слов, токенов) естественного или формального языка с его формальной грамматикой. Результатом обычно является дерево разбора (синтаксическое дерево).
https://ru.wikipedia.org/wiki/Синтаксический_анализ Вы не определили формальную грамматику или результат синтаксического разбора. Без этого вопрос о способе парсинга не имеет смысла так как данному потоку байт может соответствовать множество различных грамматик.