Форум сайта python.su
Cyrя бы вот так сделал
Видимо ему не до этого…
from bs4 import BeautifulSoup import csv def get_data_from_html(file_html): with open(file_html,encoding='utf-8') as file: soup = BeautifulSoup(file,'lxml') tags = soup.find_all('div',class_=['s29','s47','s35','s53','s38','s56']) values = [t.text for t in tags] data = [values[i:i+3] for i in range(0,len(values),3)] return data def write_csv(file_name,data): with open(file_name, 'w', newline='') as file: writer = csv.writer(file,delimiter=';') writer.writerows(data) data = get_data_from_html('Детализация.html') write_csv('details.csv',data)
Офлайн
xam1816спасибо.
я бы вот так сделал
xam1816Я в курсе. Просто я хотел переводить секунды в минуты (с округление до большего), а потом сделать итоги по видам услуг (с суммированием минут).
а вообще детализацию можно сразу в xlxs загрузить из личного кабинета
Отредактировано Cyr (Окт. 18, 2021 10:46:23)
Офлайн
Cyrя к тому что с xlsx дынные доставать более надежнее,потому что в html файле блоки сделаны в каком-то своем порядке,а где imei вообще попадаются 5 одинаковых блоков,т.е. парсинг с этого html может стать непредсказуемым
Я в курсе.
Офлайн