DjangoBB LoFi version

Полная версия: регулярные выражения вопрос

Начало » Python для новичков » регулярные выражения вопрос

dobriy_dada

Янв. 11, 2017 19:51:41

Здравствуйте, подскажите пожалуйста, требуется произвести поиск по различным строкам и выбрать только те, которые начинаются со слова “University”, а потом выбрать ту часть строки, которая идёт после запятой. Например выражение:
University Park, Los Angeles
Вот такой код

 (?<=^University\s).+

выдаёт строку

"Park, Los Angeles"

Как изменить код, чтобы оставался только

 "Los Angeles"

?

Заранее спасибо :-)

Romissevd

Янв. 11, 2017 20:30:09

 (?<=, ).+

py.user.next

Янв. 12, 2017 00:53:02

  
>>> import re
>>> 
>>> text = 'University Park, Los Angeles'
>>> 
>>> match = re.search(r'^University [^,]+, (.*)', text)
>>> if match is not None:
...     match.group(1)
... 
'Los Angeles'
>>>

dobriy_dada

Янв. 12, 2017 03:19:46

py.user.next, спасибо, но здесь другой код, у меня такой (используется pandas):

 df['RegionName1'] = df['Temp'].str.extract('((?<=^University\s[^,]).+(?=\())')

Вообщем строка такая:

 "University Park, Los Angeles (University of Southern California)"

После выполнения кода получается такая строка

 ark, Los Angeles

Если я вставляю + после квадратных скобок - так

 df['RegionName1'] = df['Temp'].str.extract('((?<=^University\s[^,]+).+(?=\())')

То выводится ошибка error: look-behind requires fixed-width pattern

py.user.next

Янв. 12, 2017 04:41:39

  
>>> import re
>>> 
>>> text = 'University Park, Los Angeles (University of Southern California)'
>>> 
>>> match = re.search(r'^University [^,]+, (.*) \(', text)
>>> if match is not None:
...     match.group(1)
... 
'Los Angeles'
>>>

dobriy_dada
После выполнения кода получается такая строка

Ну, всё правильно получается. Скопируй мой шаблон туда.