Форум сайта python.su
Есть содержимое вида
</td> <td class="oc_7 oc_8"><span class="officers_ban"><em></em></span></td></tr><tr><td class="oc_1"> Значение </td> <td align="center" class="oc_2"><span class="icons_rankgeneral icon_rank_100"></span></td> <td align="center" class="oc_3"><span>Значение</span></td> <td align="center" class="oc_4"><span class="officers_role OFFICER"></span></td> <td align="center" class="oc_5"> Значение </td> <td align="center" class="oc_6"> Значение
Отредактировано gedat (Июль 4, 2022 11:14:20)
Офлайн
Если Значение2 не надо, то можно так
>>> import re >>> >>> text = """\ ... </td> <td class="oc_7 oc_8"><span class="officers_ban"><em></em></span></td></tr><tr><td class="oc_1"> ... Значение1 ... </td> <td align="center" class="oc_2"><span class="icons_rankgeneral icon_rank_100"></span></td> <td align="center" class="oc_3"><span>Значение2</span></td> <td align="center" class="oc_4"><span class="officers_role OFFICER"></span></td> <td align="center" class="oc_5"> ... Значение3 ... </td> <td align="center" class="oc_6"> ... Значение4 ... """ >>> >>> pat = r'class="oc_\d+">\n +(.+?)\n' >>> out = re.findall(pat, text) >>> out ['Значение1', 'Значение3', 'Значение4'] >>>
Офлайн
scripy или чтото на подобе.
погуглите по теме парсинг сайтов на python
Офлайн