Python-сообщество

Tapo4e4ek · Апрель 12, 2012 15:13:41

Имею строки которые нужно парсить. мне надо извлекать из строки все что начинается символом < и заканчивается либо символом ; либо > что раньше встретит. Пожалуйста помогите, с обьяснением. Сколько не читал про рег експы, понимания 0. могу проходится по каждой строке и как встречу символ < начинать собирать новую строку, пока не встречу ; либо > Но очень много ресурсозатрат. Пожалуйста помогите!!!

FishHook · Апрель 12, 2012 15:21:30

Tapo4e4ek
Имею строки которые нужно парсить. мне надо извлекать из строки все что начинается символом < и заканчивается либо символом ; либо > что раньше встретит. Пожалуйста помогите, с обьяснением. Сколько не читал про рег експы, понимания 0. могу проходится по каждой строке и как встречу символ < начинать собирать новую строку, пока не встречу ; либо > Но очень много ресурсозатрат. Пожалуйста помогите!!!

Ты парсишь HTML/XML?
Тогда не выдумывай велосипед и успользуй специализированные парсеры. Ссылок на этом форуме найдешь кучу. А в гугле гору Арарат.

Tapo4e4ek · Апрель 12, 2012 15:29:02

Нет, не хтмл. Пишу парсинг конфигурационного файла. С помощью ConfigParser получаю в массив все строки которые мне нужны, теперь мне надо обрабатывать эти строки. Если пробегаться по ним - получу квадратичный рост (чего совсем не хотелось бы). Тут меня спасут только регЕкспы. Но я сколько не пытался их понять, не для моего мозга!

Пример моей строки - ‘to=“200” <sip:200@127.0.0.1:5062;line=8d1cc170abf10f3>’
Мне отсюда желательно получить 200@127.0.0.1 - все!

agalen · Апрель 12, 2012 15:55:24

Примерно так:

import re
res = re.search( r"<.*?:([^:;>]*)", 'to="200" <sip:200@127.0.0.1:5062;line=8d1cc170abf10f3>' )
print res.group(1)

Поясняю:

  <       - ищем строку
  .?*:    - съедаем символы до ':'
  в скобках - то что мы ищем
  [^:;>]* - все символы, кроме : ; >

Отредактировано agalen (Апрель 12, 2012 15:57:57)

Tapo4e4ek · Апрель 12, 2012 16:10:54

agalen
Огромное приогромное спс!
+1

Python-сообщество

Уведомления

#1 Апрель 12, 2012 15:13:41

Пожалуйста, помогите с РегЕкспами

#2 Апрель 12, 2012 15:21:30

Пожалуйста, помогите с РегЕкспами

#3 Апрель 12, 2012 15:29:02

Пожалуйста, помогите с РегЕкспами

#4 Апрель 12, 2012 15:55:24

Пожалуйста, помогите с РегЕкспами

#5 Апрель 12, 2012 16:10:54

Пожалуйста, помогите с РегЕкспами

Board footer