Найти - Пользователи
Полная версия: Пожалуйста, помогите с РегЕкспами
Начало » Центр помощи » Пожалуйста, помогите с РегЕкспами
1
Tapo4e4ek
Имею строки которые нужно парсить. мне надо извлекать из строки все что начинается символом < и заканчивается либо символом ; либо > что раньше встретит. Пожалуйста помогите, с обьяснением. Сколько не читал про рег експы, понимания 0. могу проходится по каждой строке и как встречу символ < начинать собирать новую строку, пока не встречу ; либо > Но очень много ресурсозатрат. Пожалуйста помогите!!!
FishHook
Tapo4e4ek
Имею строки которые нужно парсить. мне надо извлекать из строки все что начинается символом < и заканчивается либо символом ; либо > что раньше встретит. Пожалуйста помогите, с обьяснением. Сколько не читал про рег експы, понимания 0. могу проходится по каждой строке и как встречу символ < начинать собирать новую строку, пока не встречу ; либо > Но очень много ресурсозатрат. Пожалуйста помогите!!!
Ты парсишь HTML/XML?
Тогда не выдумывай велосипед и успользуй специализированные парсеры. Ссылок на этом форуме найдешь кучу. А в гугле гору Арарат.
Tapo4e4ek
Нет, не хтмл. Пишу парсинг конфигурационного файла. С помощью ConfigParser получаю в массив все строки которые мне нужны, теперь мне надо обрабатывать эти строки. Если пробегаться по ним - получу квадратичный рост (чего совсем не хотелось бы). Тут меня спасут только регЕкспы. Но я сколько не пытался их понять, не для моего мозга!

Пример моей строки - ‘to=“200” <sip:200@127.0.0.1:5062;line=8d1cc170abf10f3>’
Мне отсюда желательно получить 200@127.0.0.1 - все!
agalen
Примерно так:
import re
res = re.search( r"<.*?:([^:;>]*)", 'to="200" <sip:200@127.0.0.1:5062;line=8d1cc170abf10f3>' )
print res.group(1)
Поясняю:
  <       - ищем строку
.?*: - съедаем символы до ':'
в скобках - то что мы ищем
[^:;>]* - все символы, кроме : ; >
Tapo4e4ek
agalen
Огромное приогромное спс!
+1
This is a "lo-fi" version of our main content. To view the full version with more information, formatting and images, please click here.
Powered by DjangoBB