Уведомления

Группа в Telegram: @pythonsu

#1 Сен. 17, 2012 06:15:50

daria_kh
Зарегистрирован: 2012-09-17
Сообщения: 6
Репутация: +  0  -
Профиль   Отправить e-mail  

Не выводит русские буквы

Помоги те плиз, не могу разобраться с кодировкой, ошибку выдает
вот ошибка:
utf-8 codec cann't decode byte 0xfb in position o: invalid stert byte

вот код:
#!/usr/bin/env python
# -*- encoding: UTF-8 -*-
import sys
import re
str1 = ‘hgcjuk<title>ыкерьжекдылрь</title>ghjghjghjghjgj’
str1 = str1.decode('utf-8')
pattern = re.search('\<title\>(.*)\<\/title\>', str1)
str2 = pattern.group()
print (str2)

Офлайн

#2 Сен. 17, 2012 07:40:30

py.user.next
От:
Зарегистрирован: 2010-04-29
Сообщения: 10016
Репутация: +  857  -
Профиль   Отправить e-mail  

Не выводит русские буквы

>>> import re
>>> 
>>> s = 'hgcjuk<title>ыкерьжекдылрь</title>ghjghjghjghjgj'
>>> pat = re.search('<title>(.*)</title>', s.decode('utf-8'))
>>> pat.group()
u'<title>\u044b\u043a\u0435\u0440\u044c\u0436\u0435\u043a\u0434\u044b\u043b\u0440\u044c</title>'
>>> print pat.group()
<title>ыкерьжекдылрь</title>
>>> print pat.group(1)
ыкерьжекдылрь
>>>


daria_kh
utf-8 codec cann't decode byte 0xfb in position o: invalid stert byte
>>> '\xfb'.decode('cp1251')
u'\u044b'
>>> print '\xfb'.decode('cp1251')
ы
>>>
вероятно, файл в кодировке cp1251



Отредактировано py.user.next (Сен. 17, 2012 07:44:30)

Офлайн

#3 Сен. 19, 2012 03:23:39

daria_kh
Зарегистрирован: 2012-09-17
Сообщения: 6
Репутация: +  0  -
Профиль   Отправить e-mail  

Не выводит русские буквы

Поставила кодировку cp1251, выдает такую же ошибку

Офлайн

#4 Сен. 19, 2012 07:26:52

daria_kh
Зарегистрирован: 2012-09-17
Сообщения: 6
Репутация: +  0  -
Профиль   Отправить e-mail  

Не выводит русские буквы

Все заработало, поставила кодировку windows-1251

Офлайн

Board footer

Модераторировать

Powered by DjangoBB

Lo-Fi Version