Форум сайта python.su
0
Здравствуйте.
Знаю что по этой теме тонны материалов, но что-то как-то всё не то.
В общем расскажу про свой случай.
# -*- coding: utf-8 -*-
from ghost import Ghost
from lxml import html,etree
ghost = Ghost()
page, extra_resources = ghost.open('http
адрес-сайта/')
res = ghost.content
tree = etree.parse(res)
Кодировка страницы - utf-8.
Кодировка у ghost.content и соответственно у res - unicode.
Скрипт завершается небезызвестным UnicodeDecodeError.
Спасибо заранее.
Офлайн
857
загрузи страницу вручную и передай файл в lxml.html.parse()
Офлайн
tree = etree.parse(res.encode('utf-8'))
:)
Офлайн