Форум сайта python.su
0
Помоги те плиз, не могу разобраться с кодировкой, ошибку выдает
вот ошибка:
utf-8 codec cann't decode byte 0xfb in position o: invalid stert byte
вот код:
#!/usr/bin/env python
# -*- encoding: UTF-8 -*-
import sys
import re
str1 = ‘hgcjuk<title>ыкерьжекдылрь</title>ghjghjghjghjgj’
str1 = str1.decode('utf-8')
pattern = re.search('\<title\>(.*)\<\/title\>', str1)
str2 = pattern.group()
print (str2)
Офлайн
857
>>> import re >>> >>> s = 'hgcjuk<title>ыкерьжекдылрь</title>ghjghjghjghjgj' >>> pat = re.search('<title>(.*)</title>', s.decode('utf-8')) >>> pat.group() u'<title>\u044b\u043a\u0435\u0440\u044c\u0436\u0435\u043a\u0434\u044b\u043b\u0440\u044c</title>' >>> print pat.group() <title>ыкерьжекдылрь</title> >>> print pat.group(1) ыкерьжекдылрь >>>
daria_kh
utf-8 codec cann't decode byte 0xfb in position o: invalid stert byte
>>> '\xfb'.decode('cp1251') u'\u044b' >>> print '\xfb'.decode('cp1251') ы >>>
Отредактировано py.user.next (Сен. 17, 2012 07:44:30)
Офлайн
0
Поставила кодировку cp1251, выдает такую же ошибку
Офлайн
0
Все заработало, поставила кодировку windows-1251
Офлайн