DjangoBB LoFi version

Полная версия: Парсинг html таблиц от FastReport

Начало » Центр помощи » Парсинг html таблиц от FastReport

1 2 3

xam1816

Окт. 15, 2021 22:01:25

Cyr
Видимо ему не до этого…

я бы вот так сделал

 from bs4 import BeautifulSoup
import csv
def get_data_from_html(file_html):
	with open(file_html,encoding='utf-8') as file:
		soup = BeautifulSoup(file,'lxml')
	tags = soup.find_all('div',class_=['s29','s47','s35','s53','s38','s56'])
	values = [t.text for t in tags]
	data = [values[i:i+3] for i in range(0,len(values),3)]
	return data
def write_csv(file_name,data):
	with open(file_name, 'w', newline='') as file:
		writer = csv.writer(file,delimiter=';')
		writer.writerows(data)
data = get_data_from_html('Детализация.html')
write_csv('details.csv',data)

а вообще детализацию можно сразу в xlxs загрузить из личного кабинета

Cyr

Окт. 16, 2021 12:51:23

xam1816
я бы вот так сделал

спасибо.

xam1816
а вообще детализацию можно сразу в xlxs загрузить из личного кабинета

Я в курсе. Просто я хотел переводить секунды в минуты (с округление до большего), а потом сделать итоги по видам услуг (с суммированием минут).

xam1816

Окт. 16, 2021 13:14:08

Cyr
Я в курсе.

я к тому что с xlsx дынные доставать более надежнее,потому что в html файле блоки сделаны в каком-то своем порядке,а где imei вообще попадаются 5 одинаковых блоков,т.е. парсинг с этого html может стать непредсказуемым