Форум сайта python.su
Вообщем есть такая задача со страницы спарсить формы а точнее все ее поля которые пойдут в сабмит, а именно пары имя значение, выдать ввиде словаря.
Чем быстрее решать такие задачи? вижу такие варианты
1) regexp
2) BeautifulSoup
3) html5lib
2 и 3 ни разу не пользовался, подскажите что объективно удобнее в подобных случаях?
Офлайн
Я бы, из перечисленного, BeautifulSoup взял.
Отредактировано (Окт. 8, 2009 15:46:27)
Офлайн
Красивый суп может в виде словаря предоставить формы
Офлайн
pasaranaxа как не подскажите?
Красивый суп может в виде словаря предоставить формы
def extract_fields(form):
soup = BeautifulSoup(form)
data = {}
for f in soup.findAll('input'):
#print f
if f.get('name'):
data[f.get('name')] = f.get('value')
for f in soup.findAll('textarea'):
#print f
if f.get('name'):
data[f.get('name')] = f.get('value')
for k in data:
if (not data[k]):
data[k] = ""
return data
Отредактировано (Окт. 12, 2009 18:49:28)
Офлайн
Офлайн