я во многом чайник, но хочется сделать одну штуку.
Есть файл rtf либо html. в этом файле кучка информации, в том числе в виде таблиц.
Хочется через питон по заранее известному тэгу найти строчку в этом файле и взять из нее число.
Сделать эту задачу с ТХТ-файлами получилось довольно легко.
А вот на RTF и HTML затормозил.
В чем здесь фишка? нужно ли использовать какие-то дополнительные библиотеки или модули? Можно ли обращаться к этим файлам так же, как и к ТХТ?
Мой код для ТХТ вот:
[
from __future__ import print_function
import io
noWord='Нет cовпадений'
word = u'рпы'
with io.open('L:/file.docx', encoding='cp1251') as file:
for line in file:
if word in line:
print(line, end='')
[int(s) for s in line.split() if s.isdigit()]
#int(aa)
print(s)
else:
print(noWord.decode('utf-8'))
input()]
File2.txt', encoding='utf-8') as file:
)