html-код немного почищен.Надо дернуть русское скоращенное название компании:
<table>Наименование:</td> <table>ОБЩЕСТВО С ОГРАНИЧЕННОЙ ОТВЕТСТВЕННОСТЬЮ "Рога и копытца"</td> </tr> <table> <table>Сокращенное наименование:</td> <table>ООО "Рога и копытца"</td> </tr> <table> <table>Сокращенное наименование (Eng):</td> <table>OOO "Roga"</td>
Я уже готов монитор разбить! Что ему не нравится?!
CompanyName=re.search(r'Сокращенное наименование:[\<\>\/\stabled]*([А-я\s-\"]*)', full) print(CompanyName.group(1))
Ошибка:
Traceback (most recent call last): File "C:\париснг.py", line 49, in <module> CompanyName=re.search(r'Сокращенное наименование:[\<\>\/\stabled]*([А-я\s-\"]*)', full) File "C:\Program Files\Python 3.5\lib\re.py", line 173, in search return _compile(pattern, flags).search(string) File "C:\Program Files\Python 3.5\lib\re.py", line 293, in _compile p = sre_compile.compile(pattern, flags) File "C:\Program Files\Python 3.5\lib\sre_compile.py", line 536, in compile p = sre_parse.parse(p, flags) File "C:\Program Files\Python 3.5\lib\sre_parse.py", line 783, in parse p = _parse_sub(source, pattern, 0) File "C:\Program Files\Python 3.5\lib\sre_parse.py", line 397, in _parse_sub itemsappend(_parse(source, state)) File "C:\Program Files\Python 3.5\lib\sre_parse.py", line 725, in _parse p = _parse_sub(source, state) File "C:\Program Files\Python 3.5\lib\sre_parse.py", line 397, in _parse_sub itemsappend(_parse(source, state)) File "C:\Program Files\Python 3.5\lib\sre_parse.py", line 530, in _parse raise source.error("bad character range", len(this)) sre_constants.error: bad character range at position 50
50-ый символ это сразу после “наименование”.