Форум сайта python.su
А не встречал ли никто нормального мануала по работе с регэкспами?
Что то простое представляю как сделать, а вот например,щас задача встала, с помощью регекспов выделять из текста строки типа:
<a href=“/t/b146.torrent”> Bleach 146 </a>
<a href=“/t/b147.torrent”> Bleach 147 </a>
Изменяются только цифры. Как такое реализовать с помощью регекспов? Не понимаю вообще, какого вида шаблон должен быть…
Офлайн
Аяяй :) Ну не давать же вам готовое решение, в самом деле, Вы же так регулярные выражения не разберёте….
Напишите хоть какие пробовали, и где затык…
Тут почитайте, довольно понятно написано, просто попробовать надо…
Офлайн
Friedl J.E.Mastering regular expressions.2002
Фридл Дж.Регулярные выражения.Библиотека программиста.2003
Watt A.Beginning regular expressions.2005
Stubblebine T.Regular expression pocket reference.2003
Mertz D.Text processing in Python.2003
Офлайн
Офлайн
шаблон такой:
“(<a href=”/t/b\d+.torrent“> Bleach \d+ </a>)”
Скобочки означают - выделение группы - все что внутри них - пойдет в результат.
\d - означает цифру.
\d+ - означает - что цифр будет одна или больше.
использовать в питоне так:
result = re.findall(r'(<a href=“/t/b\d+.torrent”> Bleach \d+ </a>)', data)
результатом будет список =)
Офлайн
Да уж, точно, каждому - своё…
Офлайн
shiza
спасибо. Попонятнее стало.
Ferroman
на интуите я читал, не понял я как составлять шаблон. :(
Офлайн
Да, регулярные выражения такая штука, что нужно обязательно попробовать и тогда все понятно станет. Сходу, без практики, очень трудно въехать.
Офлайн
Немного оффтоп, но - в кде есть замечательная программка - kregexpeditor. Отличная софтина, чтобы поиграть с регулярными выражениями.
Офлайн
Всем привет, столкнулся с проблемой и не понял в чем прикол. Есть xml-ина, из которой я решил быстро регуляркой удалить ненужное. xml весит 120 кб, вот часть, которая меня интересует:
... <ZTMC> ... </ZTMC> ...
re.compile (r"\<ztmc.*ztmc\>", re.IGNORECASE)
re.compile (r"\<ztmc\>.*\<\\ztmc\>", re.IGNORECASE)
Офлайн