Уведомления

Группа в Telegram: @pythonsu

#1 Июль 11, 2018 10:54:27

djigit0s
Зарегистрирован: 2018-07-11
Сообщения: 2
Репутация: +  0  -
Профиль   Отправить e-mail  

doc в docx

Доброе время суток, такая проблемка. Есть код который конвертирует файлы формата doc в docx, все работает. После конвертации из полученных файлов docx пытаюсь прочитать информацию (вложенные таблицы) выдает ошибку что не может найти вложенную таблицу. Если в ручную открыть файл docx внести любые изменения и сохранить то все работает.

Код конвертации

 import os
import time
import win32com.client
dir_path = 'D:\\doc\\'
wrd = win32com.client.Dispatch("Word.Application")
wrd.visible = 0
for item in os.listdir(dir_path):
    if item.endswith(".doc"):
        print(item)
        file_name, file_exteniosn = os.path.splitext(item)
        file_path = os.path.join(dir_path, item)
        wb = wrd.Documents.Open(file_path)
        wb.Convert
        wb.SaveAs2(f'{file_path}x', FileFormat=16)
        wb.Close()
        
wrd.Quit()

Код чтения вложенной таблицы.
 from docx import Document
doc = Document(file_path)
tb = doc.tables[0]
fio_inn = tb.cell(3,3).tables[0].cell(0,0).text

Офлайн

Board footer

Модераторировать

Powered by DjangoBB

Lo-Fi Version