Помогите разобраться с кодировкой
# -*- coding: utf-8 -*-
from BeautifulSoup import BeautifulSoup
from urllib2 import urlopen
import re
url = "http://www.003.ru/model/600_790011968.html"
doc = BeautifulSoup(urlopen(url))
print doc
Русские символы выводит нормально.
print doc.originalEncoding
windows-1251
<meta name=“Keywords” content=“Морозильная камера Морозильная камера NORD 155-3-010, продажа морозильной камеры Морозильная камера NORD 155-3-010 РІ 003.Ru, купить морозильную камеру Морозильная камера NORD 155-3-010” />
А теперь уже в utf-8
Как быть?
example = doc.find(text=re.compile("Модель"))
Ничего не найдет. Уже всяко разно пробовал конвертировать, ничего не выходит. Видимо, неправильно пробовал.