Форум сайта python.su
Всем привет. установил BeautifulSoup решил попробовать, но возникли проблемы с кодировкой
вот код
import urllib2
from BeautifulSoup import BeautifulSoup
f = urllib2.urlopen('http://www.yandex.ru/')
soup = BeautifulSoup(f, fromEncoding="utf-8")
print soup.find('title')
print soup.originalEncoding
Отредактировано (Окт. 18, 2011 20:40:34)
Офлайн
Дело в выводе самого IDLE
Тк в файл записывает нормально.
А как можно поменять кодировку в IDLE чтобы правильно выводило русский?
Офлайн
А если писать soup.find('title').string тогда нормально русский выводит. Кто что скажет?
Офлайн
import urllib2
from BeautifulSoup import BeautifulSoup
f = urllib2.urlopen('http://www.yandex.ru/')
soup = BeautifulSoup(f, fromEncoding="utf-8")
s = str(soup.find('title'))
print s
print s.decode('utf8')
print soup.originalEncoding
#<title>Яндекс</title>
#<title>Яндекс</title>
utf-8
Офлайн
sp3Если оригинальная кодировка utf-8 то зачем ещё s.decode('utf8') ?import urllib2
from BeautifulSoup import BeautifulSoup
f = urllib2.urlopen('http://www.yandex.ru/')
soup = BeautifulSoup(f, fromEncoding="utf-8")
s = str(soup.find('title'))
print s
print s.decode('utf8')
print soup.originalEncoding
#<title>Яндекс</title>
#<title>Яндекс</title>
utf-8
Офлайн