Уведомления

Группа в Telegram: @pythonsu

#1 Окт. 15, 2021 22:01:25

xam1816
Зарегистрирован: 2020-05-11
Сообщения: 1308
Репутация: +  112  -
Профиль   Отправить e-mail  

Парсинг html таблиц от FastReport

Cyr
Видимо ему не до этого…
я бы вот так сделал
 from bs4 import BeautifulSoup
import csv
def get_data_from_html(file_html):
	with open(file_html,encoding='utf-8') as file:
		soup = BeautifulSoup(file,'lxml')
	tags = soup.find_all('div',class_=['s29','s47','s35','s53','s38','s56'])
	values = [t.text for t in tags]
	data = [values[i:i+3] for i in range(0,len(values),3)]
	return data
def write_csv(file_name,data):
	with open(file_name, 'w', newline='') as file:
		writer = csv.writer(file,delimiter=';')
		writer.writerows(data)
data = get_data_from_html('Детализация.html')
write_csv('details.csv',data)

а вообще детализацию можно сразу в xlxs загрузить из личного кабинета

Офлайн

#2 Окт. 16, 2021 12:51:23

Cyr
Зарегистрирован: 2012-09-08
Сообщения: 13
Репутация: +  0  -
Профиль   Отправить e-mail  

Парсинг html таблиц от FastReport

xam1816
я бы вот так сделал
спасибо.
xam1816
а вообще детализацию можно сразу в xlxs загрузить из личного кабинета
Я в курсе. Просто я хотел переводить секунды в минуты (с округление до большего), а потом сделать итоги по видам услуг (с суммированием минут).

Отредактировано Cyr (Окт. 18, 2021 10:46:23)

Офлайн

#3 Окт. 16, 2021 13:14:08

xam1816
Зарегистрирован: 2020-05-11
Сообщения: 1308
Репутация: +  112  -
Профиль   Отправить e-mail  

Парсинг html таблиц от FastReport

Cyr
Я в курсе.
я к тому что с xlsx дынные доставать более надежнее,потому что в html файле блоки сделаны в каком-то своем порядке,а где imei вообще попадаются 5 одинаковых блоков,т.е. парсинг с этого html может стать непредсказуемым

Офлайн

Board footer

Модераторировать

Powered by DjangoBB

Lo-Fi Version