Уведомления

Группа в Telegram: @pythonsu

#1 Июнь 22, 2010 16:05:21

Александр Кошелев
От: Москва
Зарегистрирован: 2007-02-03
Сообщения: 1724
Репутация: +  2  -
Профиль   Отправить e-mail  

Парсил, парсил, да не выпарсил

o7412369815963
а он ломаный html хавает?
Да.



Офлайн

#2 Июнь 22, 2010 19:24:07

Enchantner
От:
Зарегистрирован: 2009-02-11
Сообщения: 442
Репутация: +  0  -
Профиль   Отправить e-mail  

Парсил, парсил, да не выпарсил

Daevaorn
спасибо, слышал, но не пробовал на вкус. Думаю, стоит.



Офлайн

#3 Июнь 30, 2010 15:43:13

Enchantner
От:
Зарегистрирован: 2009-02-11
Сообщения: 442
Репутация: +  0  -
Профиль   Отправить e-mail  

Парсил, парсил, да не выпарсил

А есть по нему какая-нибудь вменяемая туториалка? Я никак не пойму, чем надо строить дерево и как из него потом по тегам выбирать…



Офлайн

#4 Июнь 30, 2010 21:34:33

alex312
От:
Зарегистрирован: 2009-11-06
Сообщения: 6
Репутация: +  0  -
Профиль   Отправить e-mail  

Парсил, парсил, да не выпарсил

Enchantner
А есть по нему какая-нибудь вменяемая туториалка? Я никак не пойму, чем надо строить дерево и как из него потом по тегам выбирать…
http://wiki.python.su/Документации/BeautifulSoup



Офлайн

#5 Июль 1, 2010 07:38:28

Enchantner
От:
Зарегистрирован: 2009-02-11
Сообщения: 442
Репутация: +  0  -
Профиль   Отправить e-mail  

Парсил, парсил, да не выпарсил

alex312
Спасибо, но я просил не по супу, а по html5lib :)



Офлайн

#6 Июль 1, 2010 07:40:41

Александр Кошелев
От: Москва
Зарегистрирован: 2007-02-03
Сообщения: 1724
Репутация: +  2  -
Профиль   Отправить e-mail  

Парсил, парсил, да не выпарсил

Удобней всего взять py-dom-xpath и через xpath делать выборки.



Офлайн

#7 Июль 1, 2010 15:42:41

Enchantner
От:
Зарегистрирован: 2009-02-11
Сообщения: 442
Репутация: +  0  -
Профиль   Отправить e-mail  

Парсил, парсил, да не выпарсил

Daevaorn

py-dom-xpath requires Python 2.5 or greater.
а на сервере 2.4. Не пойдет.



Офлайн

Board footer

Модераторировать

Powered by DjangoBB

Lo-Fi Version