Я только учусь писать на Python и у меня возник следующий вопрос: на данный момент я пишу код для парсинга сайта rp5.ru Суть данного кода заключается в том что бы скачивать информацию о погоде.
Но у меня абсолютно не получается, если вы поможете мне разобраться буду очень благодарен. Вот код:
import lxml.html import io from urllib import request import requests from urllib.parse import urljoin from lxml.html import fromstring url = "http://rp5.ru/%D0%9F%D0%BE%D0%B3%D0%BE%D0%B4%D0%B0_%D0%B2_%D0%9A%D1%80%D0%B0%D1%81%D0%BD%D0%BE%D0%B4%D0%B0%D1%80%D0%B5,_%D0%9A%D1%80%D0%B0%D1%81%D0%BD%D0%BE%D0%B4%D0%B0%D1%80%D1%81%D0%BA%D0%B8%D0%B9_%D0%BA%D1%80%D0%B0%D0%B9" http_proxy = "http://R_VG:Zd213HYr@10.5.45.250:3128" proxyDict = { "http" : http_proxy } r = requests.get(url, proxies=proxyDict) html= fromstring(r.content) temp= html.xpath("//div[@class='t_0']/a/text()")[0]
И вот такую ошибку он мне выдает :
Traceback (most recent call last): File "C:/Python32/xd", line 18, in <module> html= fromstring(r.content) File "C:\Python32\lib\site-packages\lxml\html\__init__.py", line 630, in fromstring if start.startswith('<html') or start.startswith('<!doctype'): TypeError: expected an object with the buffer interface
