Найти - Пользователи
Полная версия: регулярные выражения
Начало » Python для экспертов » регулярные выражения
1 2
aliens
А не встречал ли никто нормального мануала по работе с регэкспами?
Что то простое представляю как сделать, а вот например,щас задача встала, с помощью регекспов выделять из текста строки типа:
<a href=“/t/b146.torrent”> Bleach 146 </a>
<a href=“/t/b147.torrent”> Bleach 147 </a>

Изменяются только цифры. Как такое реализовать с помощью регекспов? Не понимаю вообще, какого вида шаблон должен быть…
Ferroman
Аяяй :) Ну не давать же вам готовое решение, в самом деле, Вы же так регулярные выражения не разберёте….
Напишите хоть какие пробовали, и где затык…
Тут почитайте, довольно понятно написано, просто попробовать надо…
umup
Friedl J.E.Mastering regular expressions.2002
Фридл Дж.Регулярные выражения.Библиотека программиста.2003
Watt A.Beginning regular expressions.2005
Stubblebine T.Regular expression pocket reference.2003
Mertz D.Text processing in Python.2003
shiza
шаблон такой:
“(<a href=”/t/b\d+.torrent“> Bleach \d+ </a>)”
Скобочки означают - выделение группы - все что внутри них - пойдет в результат.
\d - означает цифру.
\d+ - означает - что цифр будет одна или больше.
использовать в питоне так:
result = re.findall(r'(<a href=“/t/b\d+.torrent”> Bleach \d+ </a>)', data)

результатом будет список =)
Ferroman
Да уж, точно, каждому - своё…
aliens
shiza
спасибо. Попонятнее стало.
Ferroman
на интуите я читал, не понял я как составлять шаблон. :(
Ferroman
Да, регулярные выражения такая штука, что нужно обязательно попробовать и тогда все понятно станет. Сходу, без практики, очень трудно въехать.
ZAN
Немного оффтоп, но - в кде есть замечательная программка - kregexpeditor. Отличная софтина, чтобы поиграть с регулярными выражениями.
well
Всем привет, столкнулся с проблемой и не понял в чем прикол. Есть xml-ина, из которой я решил быстро регуляркой удалить ненужное. xml весит 120 кб, вот часть, которая меня интересует:
...
<ZTMC>
...
</ZTMC>
...
мне надо удалить все все от <ZTMC> до </ZTMC>, включая эти теги. Ищу я этот текст следующей регуляркой:
re.compile (r"\<ztmc.*ztmc\>", re.IGNORECASE)
Все находит сходу, но если я делаю так:
re.compile (r"\<ztmc\>.*\<\\ztmc\>", re.IGNORECASE)
то питон зависает эдак минут на 10, съедая все процессорное время и ничего не находит. Можете сказать, что я нетак делаю? Заранее спасибо.
This is a "lo-fi" version of our main content. To view the full version with more information, formatting and images, please click here.
Powered by DjangoBB