VeNOm
Янв. 8, 2010 11:30:28
Граблю с сайта информацию
(12:48) xxx: \xd3\xe2\xe0\xe6\xe0\xe5\xec\xfb\xe5 \xf1\xee\xf2\xf0\xf3\xe4\xed\xe8\xea\xe8 *****, \xf1\xe5\xe3\xee\xe4\xed\xff \xe1\xf3\xe4\xe5\xf2 \xee\xf0\xe3\xe0\xed\xe8\xe7\xee\xe2\xe0\xed \xf7\xe5\xec\xef\xe8\xee\xed\xe0\xf2 \xef\xee \xc4\xce\xd2\xc5, \xe2 17:00 \xe6\xe4\xf3 \xe2\xf1\xe5\xf5 \xe6\xe5\xeb\xe0\xfe\xf9\xe8\xf5 \xe2 309 \xea\xee\xec\xed\xe0\xf2\xe5.<br>(13:23) xxx: \xd7\xe5\xec\xef\xe8\xee\xed\xe0\xf2 \xee\xf2\xec\xe5\xed\xff\xe5\xf2\xf1\xff! \xcc\xe5\xed\xff \xf3\xe2\xee\xeb\xe8\xeb\xe8 (((
как это в русский преобразовать?
igor.kaist
Янв. 8, 2010 11:56:45
да сколько можно… читайте учебники…
for x in s.groups():
print(x.decode('cp1251'))
текст ошибки ЯВНО указывает на ошибку!!!
VeNOm
Янв. 8, 2010 12:07:40
эххх
AttributeError: ‘str’ object has no attribute ‘decode’
библиотеку codecs импортировал
python v. 3.1
Gradient
Июнь 15, 2010 11:54:54
Декодировать лучше сразу:
res=str(res.read().decode('cp1251'))
igor.kaist
Июнь 15, 2010 12:29:45
Gradient, раз уж поднял тему… зачем делать str для юникодной строки?
Gradient
Июнь 15, 2010 13:08:12
Согласен, незачем. Это был копипаст, над которым я недостаточно подумал :-)
Тут ещё вероятно с регекспом что-то или ещё с чем: возвращается только первая цитата со страницы. Глубоко не лазил.
Но текст получается.