Найти - Пользователи
Полная версия: Помогите решить проблему с парсингом
Начало » Центр помощи » Помогите решить проблему с парсингом
1
mrvlbt
Здравствуйте! Решил спарсить название видео с ютуба но что-то ничего не получается, прочитал кучу информации и никак не выходит, возможно я мыслю не в правильном русле или что-то важное в коде упускаю?

import requests
from bs4 import BeautifulSoup

url = "https://www.youtube.com/"

response = requests.get(url)
html = response.content

soup = BeautifulSoup(html, "html.parser")

video_links = soup.find_all("video-title", {"class": "style-scope ytd-rich-grid-media"})

for link in video_links:
title = link.get("title")
print(title)
xam1816
mrvlbt
возможно я мыслю не в правильном русле или что-то важное в коде упускаю?

открываешь браузер, нужную страницу, нажимаешь f12 и видишь html страницы.

Потом через requests, получаешь html по этому же url. Далее сравниваешь их, например выводишь print(html),потому что html могут приходить разные, в зависимости от заголовков, которые передаешь с запросом. Т.е браузер у тебя передает одни заголовки, а requests другие, из-за этого html разные. А когда пытаешься найти что-то через beautifulsoup, так можешь в полученном html, открыть строку поиска типа ctrl-f, и поискать теги, есть ли они вообще такие, если есть тогда парсишь, иначе, добиваешься нужного html. Это только один из нюансов
This is a "lo-fi" version of our main content. To view the full version with more information, formatting and images, please click here.
Powered by DjangoBB