evilempirer
Сен. 19, 2010 19:52:53
Даже когда беру пример из статьи с этого сайта, то при вызове soup.findALL('b') получаю TypeError: ‘NoneType’ object is not callable
, хотя type(soup) <class ‘BeautifulSoup.BeautifulSoup’>. Читал на сайте разработчика что есть проблемы с последней версией, и рекомендовано пользоваться версией 3.0.8 - из за этого может быть такое ? Если да то как посмотреть свою версию и откатиться если что на предыдущую ?
lorien
Сен. 19, 2010 19:54:17
> soup.findALL('b')
Почему ALL? Может быть All попробуете?
evilempirer
Сен. 20, 2010 08:14:06
ЭЭэээээээээ =)
Александр Кошелев
Сен. 20, 2010 10:50:24
И конечно не надо уже пользоваться BeautofulSoup
evilempirer
Сен. 23, 2010 09:31:31
Daevaorn
И конечно не надо уже пользоваться BeautofulSoup
В принципе в данном случае обошелся регуляркой, но на будущее чем сейчас пользуются ?
Enchantner
Сен. 23, 2010 20:49:34
evilempirer
lxml
boris_blade
Сен. 30, 2010 15:10:24
А в чем профит lxml?
Мне вот тут недавно люди с пеной у рта доказывали что биутифул суп это наше все.
regall
Сен. 30, 2010 15:11:35
boris_blade
А в чем профит lxml?
В скорости. lxml несравненно быстрее, так как реализован на C, а BS - pure python.
boris_blade
Сен. 30, 2010 15:16:29
Погуглил и что-то не нашел примером как им парсит хтмл.
Можно пример рабочего кода в студию?
Александр Кошелев
Сен. 30, 2010 15:46:10
Непосредственно lxml уже тоже не в моде для парсинга html.
Единственно верный инструмент - html5lib.