Ctrl →

aliens · Ноя. 5, 2007 22:07:04

А не встречал ли никто нормального мануала по работе с регэкспами?
Что то простое представляю как сделать, а вот например,щас задача встала, с помощью регекспов выделять из текста строки типа:
<a href=“/t/b146.torrent”> Bleach 146 </a>
<a href=“/t/b147.torrent”> Bleach 147 </a>

Изменяются только цифры. Как такое реализовать с помощью регекспов? Не понимаю вообще, какого вида шаблон должен быть…

Ferroman · Ноя. 6, 2007 00:43:41

Аяяй :) Ну не давать же вам готовое решение, в самом деле, Вы же так регулярные выражения не разберёте….
Напишите хоть какие пробовали, и где затык…
Тут почитайте, довольно понятно написано, просто попробовать надо…

umup · Ноя. 6, 2007 01:16:53

Friedl J.E.Mastering regular expressions.2002
Фридл Дж.Регулярные выражения.Библиотека программиста.2003
Watt A.Beginning regular expressions.2005
Stubblebine T.Regular expression pocket reference.2003
Mertz D.Text processing in Python.2003

Yurietc · Ноя. 6, 2007 09:58:08

http://www.regular-expressions.info/tutorialcnt.html

http://www.intuit.ru/department/pl/python/6/4.html

shiza · Ноя. 6, 2007 13:10:00

шаблон такой:
“(<a href=”/t/b\d+.torrent“> Bleach \d+ </a>)”
Скобочки означают - выделение группы - все что внутри них - пойдет в результат.
\d - означает цифру.
\d+ - означает - что цифр будет одна или больше.
использовать в питоне так:
result = re.findall(r'(<a href=“/t/b\d+.torrent”> Bleach \d+ </a>)', data)

результатом будет список =)

Ferroman · Ноя. 6, 2007 13:30:47

Да уж, точно, каждому - своё…

aliens · Ноя. 7, 2007 00:41:30

shiza
спасибо. Попонятнее стало.
Ferroman
на интуите я читал, не понял я как составлять шаблон. :(

Ferroman · Ноя. 7, 2007 11:22:59

Да, регулярные выражения такая штука, что нужно обязательно попробовать и тогда все понятно станет. Сходу, без практики, очень трудно въехать.

ZAN · Ноя. 8, 2007 09:52:38

Немного оффтоп, но - в кде есть замечательная программка - kregexpeditor. Отличная софтина, чтобы поиграть с регулярными выражениями.

well · Март 28, 2008 09:37:19

Всем привет, столкнулся с проблемой и не понял в чем прикол. Есть xml-ина, из которой я решил быстро регуляркой удалить ненужное. xml весит 120 кб, вот часть, которая меня интересует:

...
<ZTMC>
...
</ZTMC>
...

мне надо удалить все все от <ZTMC> до </ZTMC>, включая эти теги. Ищу я этот текст следующей регуляркой:

re.compile (r"\<ztmc.*ztmc\>", re.IGNORECASE)

Все находит сходу, но если я делаю так:

re.compile (r"\<ztmc\>.*\<\\ztmc\>", re.IGNORECASE)

то питон зависает эдак минут на 10, съедая все процессорное время и ничего не находит. Можете сказать, что я нетак делаю? Заранее спасибо.

Python-сообщество

Уведомления

#1 Ноя. 5, 2007 22:07:04

регулярные выражения

#2 Ноя. 6, 2007 00:43:41

регулярные выражения

#3 Ноя. 6, 2007 01:16:53

регулярные выражения

#4 Ноя. 6, 2007 09:58:08

регулярные выражения

#5 Ноя. 6, 2007 13:10:00

регулярные выражения

#6 Ноя. 6, 2007 13:30:47

регулярные выражения

#7 Ноя. 7, 2007 00:41:30

регулярные выражения

#8 Ноя. 7, 2007 11:22:59

регулярные выражения

#9 Ноя. 8, 2007 09:52:38

регулярные выражения

#10 Март 28, 2008 09:37:19

регулярные выражения

Board footer