Tapo4e4ekТы парсишь HTML/XML?
Имею строки которые нужно парсить. мне надо извлекать из строки все что начинается символом < и заканчивается либо символом ; либо > что раньше встретит. Пожалуйста помогите, с обьяснением. Сколько не читал про рег експы, понимания 0. могу проходится по каждой строке и как встречу символ < начинать собирать новую строку, пока не встречу ; либо > Но очень много ресурсозатрат. Пожалуйста помогите!!!
import re res = re.search( r"<.*?:([^:;>]*)", 'to="200" <sip:200@127.0.0.1:5062;line=8d1cc170abf10f3>' ) print res.group(1)
< - ищем строку
.?*: - съедаем символы до ':'
в скобках - то что мы ищем
[^:;>]* - все символы, кроме : ; >