Форум сайта python.su
1
А не встречал ли никто нормального мануала по работе с регэкспами?
Что то простое представляю как сделать, а вот например,щас задача встала, с помощью регекспов выделять из текста строки типа:
<a href=“/t/b146.torrent”> Bleach 146 </a>
<a href=“/t/b147.torrent”> Bleach 147 </a>
Изменяются только цифры. Как такое реализовать с помощью регекспов? Не понимаю вообще, какого вида шаблон должен быть…
Офлайн
1
Аяяй :) Ну не давать же вам готовое решение, в самом деле, Вы же так регулярные выражения не разберёте….
Напишите хоть какие пробовали, и где затык…
Тут почитайте, довольно понятно написано, просто попробовать надо…
Офлайн
0
Friedl J.E.Mastering regular expressions.2002
Фридл Дж.Регулярные выражения.Библиотека программиста.2003
Watt A.Beginning regular expressions.2005
Stubblebine T.Regular expression pocket reference.2003
Mertz D.Text processing in Python.2003
Офлайн
0
Офлайн
0
шаблон такой:
“(<a href=”/t/b\d+.torrent“> Bleach \d+ </a>)”
Скобочки означают - выделение группы - все что внутри них - пойдет в результат.
\d - означает цифру.
\d+ - означает - что цифр будет одна или больше.
использовать в питоне так:
result = re.findall(r'(<a href=“/t/b\d+.torrent”> Bleach \d+ </a>)', data)
результатом будет список =)
Офлайн
1
Да уж, точно, каждому - своё…
Офлайн
1
shiza
спасибо. Попонятнее стало.
Ferroman
на интуите я читал, не понял я как составлять шаблон. :(
Офлайн
1
Да, регулярные выражения такая штука, что нужно обязательно попробовать и тогда все понятно станет. Сходу, без практики, очень трудно въехать.
Офлайн
10
Немного оффтоп, но - в кде есть замечательная программка - kregexpeditor. Отличная софтина, чтобы поиграть с регулярными выражениями.
Офлайн
0
Всем привет, столкнулся с проблемой и не понял в чем прикол. Есть xml-ина, из которой я решил быстро регуляркой удалить ненужное. xml весит 120 кб, вот часть, которая меня интересует:
... <ZTMC> ... </ZTMC> ...
re.compile (r"\<ztmc.*ztmc\>", re.IGNORECASE)
re.compile (r"\<ztmc\>.*\<\\ztmc\>", re.IGNORECASE)
Офлайн