Python-сообщество

PashaShulga · Апрель 28, 2015 10:40:00

Есть код который парсит все таблицы с сайта, таких таблиц на сайте целых 3

def one_page(html):
    soup = BeautifulSoup(html)
    table = soup.find_all('table')
    one_broker = []
    for row in table:
        cons = row.find_all('td')
        #one_broker.extend(cons)
        one_broker.append({
            'foreign_id': cons[1].text,
            'create_date': cons[5].text,
            'name': cons[3].text,
            'profit': cons[23].text,
            'exp': cons[19].text,
        })
    return one_broker

Я бьюсь головой и не могу сделать так, чтобы теги td били независимыми и их индексация на зависила от таблиц ибо когда мне нужно вытащить 4 элемент

print(cons[3])

в результате я получу четвертый (нумерация списка начинается с нуля) элемент из всех трех таблиц, что в итоге будет три разные значения.

lorien · Май 2, 2015 21:32:44

Забудьте про BeautifulSoup - используйте библиотеку lxml, делайте выборки элементов через XPATH

Python-сообщество

Уведомления

#1 Апрель 28, 2015 10:40:00

BeautifulSoup как правильно парсить одинаковые елементы

#2 Май 2, 2015 21:32:44

BeautifulSoup как правильно парсить одинаковые елементы

Board footer