Найти - Пользователи
Полная версия: Парсинг html таблиц от FastReport
Начало » Центр помощи » Парсинг html таблиц от FastReport
1 2 3
xam1816
Cyr
Видимо ему не до этого…
я бы вот так сделал
 from bs4 import BeautifulSoup
import csv
def get_data_from_html(file_html):
	with open(file_html,encoding='utf-8') as file:
		soup = BeautifulSoup(file,'lxml')
	tags = soup.find_all('div',class_=['s29','s47','s35','s53','s38','s56'])
	values = [t.text for t in tags]
	data = [values[i:i+3] for i in range(0,len(values),3)]
	return data
def write_csv(file_name,data):
	with open(file_name, 'w', newline='') as file:
		writer = csv.writer(file,delimiter=';')
		writer.writerows(data)
data = get_data_from_html('Детализация.html')
write_csv('details.csv',data)

а вообще детализацию можно сразу в xlxs загрузить из личного кабинета
Cyr
xam1816
я бы вот так сделал
спасибо.
xam1816
а вообще детализацию можно сразу в xlxs загрузить из личного кабинета
Я в курсе. Просто я хотел переводить секунды в минуты (с округление до большего), а потом сделать итоги по видам услуг (с суммированием минут).
xam1816
Cyr
Я в курсе.
я к тому что с xlsx дынные доставать более надежнее,потому что в html файле блоки сделаны в каком-то своем порядке,а где imei вообще попадаются 5 одинаковых блоков,т.е. парсинг с этого html может стать непредсказуемым
This is a "lo-fi" version of our main content. To view the full version with more information, formatting and images, please click here.
Powered by DjangoBB