← Сtrl

lorien · Июнь 18, 2012 13:46:07

> Кодировка страницы UTF-8. Страница частично испорчена, но те данные которые я оттуда беру нормальные. Т.е. браузер их нормально отображает.

Тогда так:
ubody = body.decode('utf-8', ‘ignore’)
tree = lxml.html.fromstring(ubody)

SergiK · Июнь 18, 2012 14:32:10

lorien
> Кодировка страницы UTF-8. Страница частично испорчена, но те данные которые я оттуда беру нормальные. Т.е. браузер их нормально отображает.

Тогда так:
ubody = body.decode('utf-8', ‘ignore’)
tree = lxml.html.fromstring(ubody)

а как получить отдельно только то, что в body?

lorien · Июнь 18, 2012 15:51:36

эээ

Python-сообщество

Уведомления

#1 Июнь 18, 2012 13:46:07

Не могу справится с кракозябрами

#2 Июнь 18, 2012 14:32:10

Не могу справится с кракозябрами

#3 Июнь 18, 2012 15:51:36

Не могу справится с кракозябрами

Board footer