> Кодировка страницы UTF-8. Страница частично испорчена, но те данные которые я оттуда беру нормальные. Т.е. браузер их нормально отображает.
Тогда так:
ubody = body.decode('utf-8', ‘ignore’)
tree = lxml.html.fromstring(ubody)
lorien
> Кодировка страницы UTF-8. Страница частично испорчена, но те данные которые я оттуда беру нормальные. Т.е. браузер их нормально отображает.
Тогда так:
ubody = body.decode('utf-8', ‘ignore’)
tree = lxml.html.fromstring(ubody)