Есть таблица, я ее отформатировал и получил строку sovlad:
{ <> Иванов Анатолий Афанасьевич <> место <> 9 000 <> 90 <> 23.12.2002 <> Иванова Нина Иосифовна <> <> 1 000 <> 10 <> 23.12.2002 <><>< 0>К содержанию <1 > <> Совладельцы (источник: ГМЦ Росстата) </1> < > <> <> < > <> < “-: -: 10 : 000000 -: ”> Дата обновления в 07.07.2014 < “ ” “:100%-:”> < “ ” > < “:30%”> Наименование < “:30%”> }
Если записать построчно, то:
<> Иванов Анатолий Афанасьевич <> место <>
<> Иванова Нина Иосифовна <> место <>
Таких строк может быть 20, а может не быть ни одной, значит надо циклом пройти, да?
Пробую так:
pattern=r'(<>(?:([А-я\s]*)<>([А-я\s.,]*)<>(?:[\d\s]*)[<>\s]*([\d]+)[<>\s]*[\d.\s]*))' for line in sovlad: FIO, Mesto, Chast=re.search(pattern, sovlad).groups() if line: print('FIO={}, Mesto={}, Chast={}.'.format(FIO, Mesto, Chast)) else: print('Error: ')