Форум сайта python.su
Читаю-читаю. Не сообразить.
Как создать шаблон для регулярного выражения, со следующей структурой:
Открывающая скобка, русские и английские буквы, пробелы, переход на другую строку, пробелы, закрывающая скобка
Подскажите, пожалуйста.
Офлайн
Сама дошла до такого выражения r"\(\)"
но не работает
Офлайн
пример текста который надо парсить мб будет?
Офлайн
\w кажись ловит только ascii…
И желательно все же пример данных показать.
import re
pattern = re.compile(u'.+(\([a-z,A-Z,а-я,А-Я,\s]+\n\s+\))')
data = u'22 sf (one два three \n ) 2sdf sdf blah blah\n '
matches = pattern.findall(data)
print matches[0]
(one два three
)
Офлайн
Нашла решение r"\(*?\)"
Офлайн
:)
Офлайн
Пример текста:
Dla-dla.sql (Много текста на русском “Ещё какой-то текст
english.word any ”) 004.00
Офлайн
Поторапилась, ещё ж русские буквы….
Офлайн
>>> s = 'Dla-dla.sql (Много текста на русском "Ещё какой-то текст \
english.word any ") 004.00'
>>> re.search(r'\(.*\)',s).group(0)
'(\xcc\xed\xee\xe3\xee \xf2\xe5\xea\xf1\xf2\xe0 \xed\xe0 \xf0\xf3\xf1\xf1\xea\xee\xec "\xc5\xf9\xb8 \xea\xe0\xea\xee\xe9-\xf2\xee \xf2\xe5\xea\xf1\xf2 english.word any ")'
Офлайн
d1ffuz0r, спасибо работает.
и
pill, возникли проблемы.
Отредактировано (Окт. 4, 2011 10:39:16)
Офлайн