Форум сайта python.su
0
Всем привет ! Я парсю дату с этого ресурса.Все бы хорошо,но есть одно но.Когда я получил эти данные (3 Сентября, 23:30 721) парсится лишние цифры 721.Как можно убрать эти лишние цифры 721? Чтобы у меня было при парсинге только так (3 Сентября, 23:30).
Вот место с которого я беру дату:
Вот участок кода который парсит даты:
def get_item_datetime(item_page,datetime_rule,datetime1_rule): if item_page is None: return soup = BeautifulSoup(item_page, 'lxml') item_datetime = soup.find(datetime_rule[0],{datetime_rule[1]:datetime_rule[2]}) if item_datetime is not None: item_datetime = soup.find(datetime_rule[0],{datetime_rule[1]:datetime_rule[2]}).text item_datetime = dateparser.parse(item_datetime) else: if (len(datetime1_rule) == 3): item_datetime = soup.find(datetime1_rule[0],{datetime1_rule[1]:datetime1_rule[2]}).text item_datetime = dateparser.parse(item_datetime) else: item_datetime = '' return item_datetime
Офлайн
44
# coding: utf-8 # даные (3 Сентября, 23:30 721) --> даные (3 Сентября, 23:30) # при условии что обрабатывемый даные, текст data = "3 Сентября, 23:30 721" if len(data.split(" ")) > 3: data = " ".join(data.split(" ")[:3]) print(data) # или data = "(3 Сентября, 23:30 721)" if len(data.split(" ")) > 3: data = " ".join(data.split(" ")[:-1]) + ")" print(data) # зы у меня очучение дежавю, ТС вы так тролите чёли?
и вставьте ссылку на его url Офлайн