Уведомления

Группа в Telegram: @pythonsu

#1 Март 25, 2010 01:07:50

vromv
От:
Зарегистрирован: 2010-03-25
Сообщения: 1
Репутация: +  0  -
Профиль   Отправить e-mail  

BeautifulSoup и кодировка

Помогите разобраться с кодировкой

# -*- coding: utf-8 -*-
from BeautifulSoup import BeautifulSoup
from urllib2 import urlopen
import re

url = "http://www.003.ru/model/600_790011968.html"
doc = BeautifulSoup(urlopen(url))

print doc
Русские символы выводит нормально.

print doc.originalEncoding
windows-1251
print doc.meta
<meta name=“Keywords” content=“Морозильная камера Морозильная камера NORD 155-3-010, продажа морозильной камеры Морозильная камера NORD 155-3-010 РІ 003.Ru, купить морозильную камеру Морозильная камера NORD 155-3-010” />

А теперь уже в utf-8

Как быть?

example = doc.find(text=re.compile("Модель"))
Ничего не найдет. Уже всяко разно пробовал конвертировать, ничего не выходит. Видимо, неправильно пробовал.



Офлайн

Board footer

Модераторировать

Powered by DjangoBB

Lo-Fi Version