Уведомления

Группа в Telegram: @pythonsu

#1 Апрель 28, 2015 10:40:00

PashaShulga
Зарегистрирован: 2015-02-22
Сообщения: 8
Репутация: +  0  -
Профиль   Отправить e-mail  

BeautifulSoup как правильно парсить одинаковые елементы

Есть код который парсит все таблицы с сайта, таких таблиц на сайте целых 3

def one_page(html):
    soup = BeautifulSoup(html)
    table = soup.find_all('table')
    one_broker = []
    for row in table:
        cons = row.find_all('td')
        #one_broker.extend(cons)
        one_broker.append({
            'foreign_id': cons[1].text,
            'create_date': cons[5].text,
            'name': cons[3].text,
            'profit': cons[23].text,
            'exp': cons[19].text,
        })
    return one_broker
Я бьюсь головой и не могу сделать так, чтобы теги td били независимыми и их индексация на зависила от таблиц ибо когда мне нужно вытащить 4 элемент
print(cons[3])
в результате я получу четвертый (нумерация списка начинается с нуля) элемент из всех трех таблиц, что в итоге будет три разные значения.

Офлайн

#2 Май 2, 2015 21:32:44

lorien
От:
Зарегистрирован: 2006-08-20
Сообщения: 755
Репутация: +  37  -
Профиль  

BeautifulSoup как правильно парсить одинаковые елементы

Забудьте про BeautifulSoup - используйте библиотеку lxml, делайте выборки элементов через XPATH

Офлайн

Board footer

Модераторировать

Powered by DjangoBB

Lo-Fi Version