Найти - Пользователи
Полная версия: Не выводит русские буквы
Начало » Python для новичков » Не выводит русские буквы
1
daria_kh
Помоги те плиз, не могу разобраться с кодировкой, ошибку выдает
вот ошибка:
utf-8 codec cann't decode byte 0xfb in position o: invalid stert byte

вот код:
#!/usr/bin/env python
# -*- encoding: UTF-8 -*-
import sys
import re
str1 = ‘hgcjuk<title>ыкерьжекдылрь</title>ghjghjghjghjgj’
str1 = str1.decode('utf-8')
pattern = re.search('\<title\>(.*)\<\/title\>', str1)
str2 = pattern.group()
print (str2)
py.user.next
>>> import re
>>> 
>>> s = 'hgcjuk<title>ыкерьжекдылрь</title>ghjghjghjghjgj'
>>> pat = re.search('<title>(.*)</title>', s.decode('utf-8'))
>>> pat.group()
u'<title>\u044b\u043a\u0435\u0440\u044c\u0436\u0435\u043a\u0434\u044b\u043b\u0440\u044c</title>'
>>> print pat.group()
<title>ыкерьжекдылрь</title>
>>> print pat.group(1)
ыкерьжекдылрь
>>>


daria_kh
utf-8 codec cann't decode byte 0xfb in position o: invalid stert byte
>>> '\xfb'.decode('cp1251')
u'\u044b'
>>> print '\xfb'.decode('cp1251')
ы
>>>
вероятно, файл в кодировке cp1251
daria_kh
Поставила кодировку cp1251, выдает такую же ошибку
daria_kh
Все заработало, поставила кодировку windows-1251
This is a "lo-fi" version of our main content. To view the full version with more information, formatting and images, please click here.
Powered by DjangoBB