Форум сайта python.su
Скинь ссылку на сайт, и напиши что нужно получить
Офлайн
py.user.nextДа, конечно:
Ты преобразовал текст?
found = [] url = f'https://.........' r = work.get(url, headers=headers).text m = re.search('null, null, \"(.+?)\", null', r) if m: found = m.group(1) list = 'div class=\"hook-details1679980270 hook-details\">\n <title>#7159581 Строительная заявка<\/title>\n\n <div class=\"agg-details__header sticky opaque\">\n ' print(found[1:-511368]) print(repr(found[1:-511368])) print(repr(list)) print(list)
Офлайн
KlakkГде?
Да, конечно:
Отредактировано py.user.next (Март 28, 2023 12:32:45)
Офлайн
py.user.nextСделал. все получилось. Спасибо! Только добавил еще пару слешей
Вот это проделай с found
https://python.su/forum/post/227336/
newtext2 = newtext1.replace('\\\\n', '\n')
Офлайн
KlakkНе надо добавлять бэкслеши, ты должен убрать repr(). repr() я сказал тебе сделать, чтобы мне было видно на форуме, какие невидимые символы есть в строке, потому что repr() все невидимые символы делает видимыми.
Только добавил еще пару слешей
Klakkrepr() нужен для анализа строки здесь на форуме, потому что сам ты объяснить не сможешь, какие символы там есть и каких нет, так как ты ничего не знаешь про символы.
Но я так и не понял почему пришлось действовать через repr
KlakkНадо его сделать вот такимfound = [] url = f'https://.........' r = work.get(url, headers=headers).text m = re.search('null, null, \"(.+?)\", null', r) if m: found = m.group(1) list = 'div class=\"hook-details1679980270 hook-details\">\n <title>#7159581 Строительная заявка<\/title>\n\n <div class=\"agg-details__header sticky opaque\">\n ' print(found[1:-511368]) print(repr(found[1:-511368])) print(repr(list)) print(list)
found = [] url = f'https://.........' r = work.get(url, headers=headers).text m = re.search('null, null, \"(.+?)\", null', r) if m: found = m.group(1) text = found[1:-511368]
Отредактировано py.user.next (Март 28, 2023 23:41:31)
Офлайн
py.user.nextСпасибо. Работает.
И к нему добавить замены через .replace() с одним бэкслешем везде, как я писал изначально.
Офлайн