Форум сайта python.su
IDLE (Python 3.10 64-bit)
Win 10
—————————–
Нужно найти строку в странице: https://zen.yandex.ru/video/watch/62795871aef4a05c45c72ced?t=39
Строка выглядит так:
"https://strm.yandex.ru/vod/zen-vod/vod-content/d65a83bba89b63e61300f9e26da19b2b/a83029a6-d4f73007-dcba481d-d58c2c8f/kaltura/desc_64ff1ce872df6aae37aedc9d2869df09/86534225505746213/ysign1=6d490380c56ba635871b7e42bed944066499bbadc5a2bfa98e61c06c6a5a3925,abcID=967,from=zen,pfx,sfx,ts=628b1555/master.m3u8
import re from urllib.request import urlopen html = urlopen ("https://zen.yandex.ru/video/watch/62795871aef4a05c45c72ced?t=39").read().decode("utf-8") m = ['a-z'] a = re.findall((r'https', '/master.m3u8'), html) print(a)
Офлайн
https://docs.python.org/3/library/re.html
>>> import re >>> >>> text = ('"https://strm.yandex.ru/vod/zen-vod/' ... 'vod-content/d65a83bba89b63e61300f9e2' ... '6da19b2b/a83029a6-d4f73007-dcba481d-' ... 'd58c2c8f/kaltura/desc_64ff1ce872df6a' ... 'ae37aedc9d2869df09/86534225505746213' ... '/ysign1=6d490380c56ba635871b7e42bed9' ... '44066499bbadc5a2bfa98e61c06c6a5a3925' ... ',abcID=967,from=zen,pfx,sfx,ts=628b1' ... '555/master.m3u8') >>> >>> pat = r'https://.+?/master.m3u8' >>> >>> out = re.findall(pat, text) >>> out ['https://strm.yandex.ru/vod/zen-vod/vod-content/d65a83bba89b63e61300f9e26da19b2b/a83029a6-d4f73007-dcba481d-d58c2c8f/kaltura/desc_64ff1ce872df6aae37aedc9d2869df09/86534225505746213/ysign1=6d490380c56ba635871b7e42bed944066499bbadc5a2bfa98e61c06c6a5a3925,abcID=967,from=zen,pfx,sfx,ts=628b1555/master.m3u8'] >>>
Офлайн
Спасибо py.user.next
Мне нужно получить мою ссылку прямо со страницы браузера, не сохраняя эту страницу html, себе на ПК.
Ваш вариант не такой.
——————————-
Я искал ранее так:
1. Сохранял страницу html себе на ПК.
2. Открывал этот html блокнотом Notepad++
3. Поиск m3u8
4. Копирую найденную ссылку.
Без скрипта долго и не удобно.
Отредактировано satfan (Май 14, 2022 18:35:58)
Офлайн
satfan
Мне нужно получить мою ссылку прямо со страницы браузера, не сохраняя эту страницу html, себе на ПК.
Ваш вариант не такой.
satfanНу, я тебе исправил. У тебя в re.findall() подаётся кортеж. А надо подавать регулярное выражение в виде строки либо в виде скомпилированного объекта через re.compile().
Что-то сделал не так. Подскажите как исправить ?
Офлайн
Уважаемый py.user.next
Я только начал с Python.
Подскажи как исправить мой исходный скрипт ?
Офлайн
satfanты его уже четвертый год изучаешь, долбоёб
Уважаемый py.user.nextЯ только начал с Python.Подскажи как исправить мой исходный скрипт ?
Отредактировано FishHook (Май 14, 2022 22:31:27)
Офлайн
тема закрыта ввиду тупости автора
автору рекомендуется не прикасаться трехметровой палкой к компьютеру, а лучше выпить яду
Офлайн