Форум сайта python.su
0
Добрый вечер, всем!
python 2.7 + eclipse + PyDev
Код:
import urllib import re regex = '<title>(.+?)</title>' pattern= re.compile(regex) htmlfile = urllib.urlopen ("http://ya.ru") htmltext = htmlfile.read() titles = re.findall(pattern,htmltext) print titles
['\xd0\xaf\xd0\xbd\xd0\xb4\xd0\xb5\xd0\xba\xd1\x81']
Отредактировано FishHook (Окт. 23, 2013 20:33:04)
Офлайн
568
for x in titles: print x
Офлайн
0
FFishHook вы чудо!
Получилось!
Если не трудно можете объяснить?
Офлайн
0
А если выпадает вот такое:
[code python]�����. ������. - ����� - �������� � ������ �������. ������.[/code]
Офлайн
0
Сам решил проблему так:
print x.decode('cp1251')
Офлайн