Форум сайта python.su
есть список вида
['\xd0\x98\xd0\xbd\xd0\xb4\xd0\xb5\xd0\xba\xd1\x81 \xd1\x86\xd0\xb8\xd1\x82\xd0\xb8\xd1\x80\xd0\xbe\xd0\xb2\xd0\xb0\xd0\xbd\xd0\xb8\xd1\x8f (\xd1\x82\xd0\x98\xd0\xa6) \xd1\x80\xd0\xb5\xd1\x81\xd1\x83\xd1\x80\xd1\x81\xd0\xb0 \xd0\xbc\xd0\xb5\xd0\xbd\xd1\x8c\xd1\x88\xd0\xb5 10.</b>']
"['\\xd0\\x98\\xd0\\xbd\\xd0\\xb4\\xd0\\xb5\\xd0\\xba\\xd1\\x81 \\xd1\\x86\\xd0\\xb8\\xd1\\x82\\xd0\\xb8\\xd1\\x80\\xd0\\xbe\\xd0\\xb2\\xd0\\xb0\\xd0\\xbd\\xd0\\xb8\\xd1\\x8f (\\xd1\\x82\\xd0\\x98\\xd0\\xa6) \\xd1\\x80\\xd0\\xb5\\xd1\\x81\\xd1\\x83\\xd1\\x80\\xd1\\x81\\xd0\\xb0 \\xd0\\xbc\\xd0\\xb5\\xd0\\xbd\\xd1\\x8c\\xd1\\x88\\xd0\\xb5 10.</b>']"
Офлайн
>>> l = ['\xd0\x98\xd0\xbd\xd0\xb4\xd0\xb5\xd0\xba\xd1\x81 \xd1\x86\xd0\xb8\xd1\x82\xd0\xb8\xd1\x80\xd0\xbe\xd0\xb2\xd0\xb0\xd0\xbd\xd0\xb8\xd1\x8f (\xd1\x82\xd0\x98\xd0\xa6) \xd1\x80\xd0\xb5\xd1\x81\xd1\x83\xd1\x80\xd1\x81\xd0\xb0 \xd0\xbc\xd0\xb5\xd0\xbd\xd1\x8c\xd1\x88\xd0\xb5 10.</b>']
>>> ''.join(l).find('тИЦ')
37
Офлайн
а там вообще одна строка
>>> print l[0].decode('utf-8')
Индекс цитирования (тИЦ) ресурса меньше 10.</b>
>>> l[0].decode('utf-8').find(u'тИЦ')
20
>>>
Офлайн
Оооо, спасибо. А вообще в третей ветки проблемы с юникодом как-то решены, может пора на нее?
Офлайн
evilempirerПроблем с уникодом нет и до 3ей ветки.
А вообще в третей ветки проблемы с юникодом как-то решены, может пора на нее?
Офлайн
Не знаю, просто последнее время начал плотно пользоваться питоном так как появилась скорость скриптования =) пользую за место баша (его просто не знаю) и постоянно у меня затыки на юникоде происходят (раньше просто не приходилось работать с русскими текстами)
Офлайн