Найти - Пользователи
Полная версия: Локаль 1251
Начало » Python для экспертов » Локаль 1251
1
nerezus
#-*- coding: windows-1251 -*-

import re
import locale
locale.setlocale(locale.LC_ALL, '.1251')

document = "<B>ЖёП</B>"

reobj = re.compile(r"<B>([А-ЯЁ]+)</B>", re.DOTALL | re.IGNORECASE)
for match in reobj.finditer(document):
print match.group(0)
Почему не находит?
IGNORECASE то включен.
Файл в 1251.
ZZZ
Матерь-Сратерь… На Дебиане cp1251! У меня просто нет слов… Вернее есть, но за них меня забанят. “Против глупости сами Боги бороться бессильны.” (с) Великий Айзек

Не работайте с текстом как с набором байт (str). Декодируйте в unicode и добавьте флаг re.UNICODE. Трабла может решиться.
This is a "lo-fi" version of our main content. To view the full version with more information, formatting and images, please click here.
Powered by DjangoBB