Форум сайта python.su
def getabondisable_or_create (login): SITES2 = 'https://172.241.50.1:2433/admin/index.cgi' payloads2 = {'search':'1' , 'LOGIN':login} r = requests.get(SITES2, verify=False , auth=HTTPBasicAuth('login', 'pass') , params=payloads2) doc = lxml.html.document_fromstring(r.text) txt2 = doc.xpath(".//*[@id='info_message']/div[2]/text()[3]") print txt2
Офлайн
r.text - это страница в Юникоде. Кодировка берется из хедеров или определяется автоматически. Думаю, причиной может быть неправильно определенная кодировка.
Попробуйте передавать r.content (исходная страница - байты) в lxml.html.document_fromstring() или перекодировать явно.
Также, страница может быть сгенерированна динамически с помощью JavaScript.
Офлайн
r.content выдает точно такую же страницу как и r.text :(
А как можно перекодировать страницу ? где за это можно почитать ?
Офлайн