Форум сайта python.su
0
Имеется код:
from lxml.html import parse
# Получаем страничку
page = parse('http://habrahabr.ru/').getroot()# Ищем все теги <a> с css классом topic
hrefs = page.cssselect("a.topic")
for row in hrefs:
# Получаем атрибут href
print(row.text)
from urllib.request import urlopen
from lxml import html
page = urlopen("http://habrahabr.ru/")
doc = html.document_fromstring(page.read())
for topic in doc.cssselect('a.topic'):
print(topic.text)
Офлайн
25
a.topic -> a.post_title
bollustradoА html посмотреть не проще?
Пробовал переустанавливать python и lxml, не помогает.
Офлайн
0
Большое спасибо, я уже хотел винду сносить)
Офлайн
0
from lxml.html import parse
page = parse('http://pogoda.yandex.ru/moscow/').getroot()
hrefs = page.cssselect("div.b-forecast__tday")
for row in hrefs:
print(row.text)
Офлайн
25
Яндексу печеньки нужны:
from urllib2 import build_opener, HTTPHandler, HTTPCookieProcessor
from lxml.html import document_fromstring
browser = build_opener(HTTPHandler(), HTTPCookieProcessor())
html = browser.open('http://pogoda.yandex.ru/moscow/').read()
doc = document_fromstring(html)
for div in doc.cssselect("div.b-forecast__tday"):
print(div.text)
Отредактировано (Март 16, 2012 14:43:51)
Офлайн
0
from urllib.request import build_opener, HTTPHandler, HTTPCookieProcessor
from lxml.html import document_fromstring
browser = build_opener(HTTPHandler(), HTTPCookieProcessor())
html = browser.open('http://pogoda.yandex.ru/moscow/').read()
doc = document_fromstring(html)
for div in doc.cssselect("div.b-forecast__tday"):
print(div.text)
HTTPError: HTTP Error 302: Found - Redirection to url
'moscow?ncrnd=107' is not allowed
Офлайн
25
from urllib2 import build_opener, HTTPHandler, HTTPCookieProcessor, HTTPRedirectHandler
from lxml.html import document_fromstring
browser = build_opener(HTTPHandler(), HTTPCookieProcessor(), HTTPRedirectHandler())
html = browser.open('http://pogoda.yandex.ru/moscow/').read()
doc = document_fromstring(html)
for div in doc.cssselect("div.b-forecast__tday"):
print(div.text)
Офлайн
0
не помогает, та же ошибка.
Офлайн
25
Возможно проблема в том, что я использую второй питон, а вы - третий
попробуйте заменить вот так:
from urllib.request import build_opener, HTTPHandler, HTTPCookieProcessor, HTTPRedirectHandler
Офлайн
0
Спасибо
Офлайн