Найти - Пользователи
Полная версия: Выдрать поля из формы, что лучше подходит для решения?
Начало » Web » Выдрать поля из формы, что лучше подходит для решения?
1
Evg
Вообщем есть такая задача со страницы спарсить формы а точнее все ее поля которые пойдут в сабмит, а именно пары имя значение, выдать ввиде словаря.

Чем быстрее решать такие задачи? вижу такие варианты
1) regexp
2) BeautifulSoup
3) html5lib
2 и 3 ни разу не пользовался, подскажите что объективно удобнее в подобных случаях?
Ferroman
Я бы, из перечисленного, BeautifulSoup взял.
pasaranax
Красивый суп может в виде словаря предоставить формы
Evg
pasaranax
Красивый суп может в виде словаря предоставить формы
а как не подскажите?

а то у меня как то длинно получилось:
def extract_fields(form):
soup = BeautifulSoup(form)
data = {}
for f in soup.findAll('input'):
#print f
if f.get('name'):
data[f.get('name')] = f.get('value')

for f in soup.findAll('textarea'):
#print f
if f.get('name'):
data[f.get('name')] = f.get('value')

for k in data:
if (not data[k]):
data[k] = ""
return data
ксатати у этого супа последняя версия какая то странная не открывает документы, поставил старую вроде 3.0.7 и вроде все в порядке.
slav0nic
глянь http://wwwsearch.sourceforge.net/ClientForm/
This is a "lo-fi" version of our main content. To view the full version with more information, formatting and images, please click here.
Powered by DjangoBB