Найти - Пользователи
Полная версия: Не могу справится с кракозябрами
Начало » Python для новичков » Не могу справится с кракозябрами
1 2
lorien
> Кодировка страницы UTF-8. Страница частично испорчена, но те данные которые я оттуда беру нормальные. Т.е. браузер их нормально отображает.

Тогда так:
ubody = body.decode('utf-8', ‘ignore’)
tree = lxml.html.fromstring(ubody)
SergiK
lorien
> Кодировка страницы UTF-8. Страница частично испорчена, но те данные которые я оттуда беру нормальные. Т.е. браузер их нормально отображает.

Тогда так:
ubody = body.decode('utf-8', ‘ignore’)
tree = lxml.html.fromstring(ubody)

а как получить отдельно только то, что в body?
lorien
эээ
This is a "lo-fi" version of our main content. To view the full version with more information, formatting and images, please click here.
Powered by DjangoBB