Форум сайта python.su
124
Скинь ссылку на сайт, и напиши что нужно получить
Офлайн
0
py.user.nextДа, конечно:
Ты преобразовал текст?
found = [] url = f'https://.........' r = work.get(url, headers=headers).text m = re.search('null, null, \"(.+?)\", null', r) if m: found = m.group(1) list = 'div class=\"hook-details1679980270 hook-details\">\n <title>#7159581 Строительная заявка<\/title>\n\n <div class=\"agg-details__header sticky opaque\">\n ' print(found[1:-511368]) print(repr(found[1:-511368])) print(repr(list)) print(list)
Офлайн
857
KlakkГде?
Да, конечно:
Отредактировано py.user.next (Март 28, 2023 12:32:45)
Офлайн
0
py.user.nextСделал. все получилось. Спасибо! Только добавил еще пару слешей
Вот это проделай с found
https://python.su/forum/post/227336/
newtext2 = newtext1.replace('\\\\n', '\n')
Офлайн
857
KlakkНе надо добавлять бэкслеши, ты должен убрать repr(). repr() я сказал тебе сделать, чтобы мне было видно на форуме, какие невидимые символы есть в строке, потому что repr() все невидимые символы делает видимыми.
Только добавил еще пару слешей
Klakkrepr() нужен для анализа строки здесь на форуме, потому что сам ты объяснить не сможешь, какие символы там есть и каких нет, так как ты ничего не знаешь про символы.
Но я так и не понял почему пришлось действовать через repr
KlakkНадо его сделать вот такимfound = [] url = f'https://.........' r = work.get(url, headers=headers).text m = re.search('null, null, \"(.+?)\", null', r) if m: found = m.group(1) list = 'div class=\"hook-details1679980270 hook-details\">\n <title>#7159581 Строительная заявка<\/title>\n\n <div class=\"agg-details__header sticky opaque\">\n ' print(found[1:-511368]) print(repr(found[1:-511368])) print(repr(list)) print(list)
found = [] url = f'https://.........' r = work.get(url, headers=headers).text m = re.search('null, null, \"(.+?)\", null', r) if m: found = m.group(1) text = found[1:-511368]
Отредактировано py.user.next (Март 28, 2023 23:41:31)
Офлайн
0
py.user.nextСпасибо. Работает.
И к нему добавить замены через .replace() с одним бэкслешем везде, как я писал изначально.
Офлайн