Ctrl →

satfan · Апрель 16, 2021 10:46:08

Подскажите.
то-то ругается на 38 строку на это “a”
Вся строка: with open(“CUsers/Александр/Desktop/yotube_plist_downloader/out.txt, ”a“, encoding = ”utf-8") as files:
Вот код скрипта:

 # -*- coding: utf-8 -*-
from bs4 import Beautifulsoup
import requests
import re
def scrape_videos(url):
	req = requests.get(url)
	send = Beautifulsoup(req.text, "html.parser")
	search = send.find_all("script")
	key = '"videoId":'
	data = re.findall(key + r"([^*]{11})", str(search))
	
	return data
	
def scrape_lists(url):
	req = requests.get(url)
	send = Beautifulsoup(req.text, "html.parser")
	search = send.find_all("script")
	key = '"playlistId":"'
	data = re.findall(key + r"([^*]{14})", str(search))
	
	return data
	
if _name_ == "_main_":
	url ="https://www.yotube.com/c/HowdyhoNet/playlists"
	data = scrape_lists(url)
	data = data[::3]
	data = data[:-2] 
	
	for i in data:
		output = 'https://www.yotube.com/playlist?list=' + i
		vid = scrape_videos(output)
		vid = vid[::3]
		vid = vid[:-1] 
		
		for i in vid:
			with open("C://Users/Александр/Desktop/yotube_plist_downloader/out.txt," "a", encoding = "utf-8") as files:
				files.write(str('https://www.yotube.com/watch?v=' + i + '\n'))
				print('https://www.yotube.com/watch?v=' + i')

Отредактировано satfan (Апрель 16, 2021 12:03:57)

Прикреплённый файлы:
yotube_plist_downloader.rar (684 байта)

py.user.next · Апрель 16, 2021 11:05:18

Там двойной кавычки не хватает после txt .

satfan · Апрель 16, 2021 11:19:15

Спасибо py.user.next
Эта ошибка ушла. Появилась другая:
Строка 40:

 files.write(str('https://www.yotube.com/watch?v=' + i + '\n'))

Ругается на двоеточие после https

Отредактировано satfan (Апрель 16, 2021 11:20:14)

py.user.next · Апрель 16, 2021 11:32:12

satfan
Эта ошибка ушла. Появилась другая:
Строка 40:

В строке с print поставь одинарную кавычку перез https .

satfan · Апрель 16, 2021 12:17:25

Всё исправил, как Вы сказали.
Ещё ошибка:

Прикреплённый файлы:
Screenshot_1.jpg (102,7 KБ)

py.user.next · Апрель 16, 2021 22:01:51

Я исправил все ошибки, там их куча. Это запускается и всё сохраняет правильно.

#!/usr/bin/env python3

from bs4 import BeautifulSoup
import requests
import re

def scrape_videos(url):
    req = requests.get(url)
    send = BeautifulSoup(req.text, "html.parser")
    search = str(send.find_all("script"))
    key = '"videoId":"'
    data = re.findall(key + r"([^*]{11})", search)
    return data

def scrape_lists(url):
    req = requests.get(url)
    send = BeautifulSoup(req.text, "html.parser")
    search = str(send.find_all("script"))
    key = '"playlistId":"'
    data = re.findall(key + r"([^*]{34})", search)
    return data

if __name__ == "__main__":
    url ="https://www.youtube.com/c/HowdyHoNet/playlists"
    data = scrape_lists(url)
    data = data[::3]
    data = data[:-2]
    for i in data:
        output = 'https://www.youtube.com/playlist?list=' + i
        vid = scrape_videos(output)
        vid = vid[::3]
        vid = vid[:-1]
        for i in vid:
            #ofname = "C:/Users/Александр/Desktop/yotube_plist_downloader/out.txt"
            ofname = 'out.txt'
            with open(ofname, "a", encoding = "utf-8") as files:
                files.write('https://www.youtube.com/watch?v=' + i + '\n')
            print('https://www.youtube.com/watch?v=' + i)

satfan · Апрель 17, 2021 06:49:01

Уважаемый py.user.next огромное спасибо.
Скрипт я писал с видео, потому были ошибки.
Всё отлично работает.
Извините, я только начал учит Питон.
Ваш форум лучший.
———————-
Только не хватает Заголовков видео перед каждой ссылкой и пробела, который их разделяет.
Как сделать так чтобы в out.txt сохранялось так ?
————————————————————————-
КАК УДАЛИТЬ ВИРУСЫ С КОМПЬЮТЕРА? 100% РАБОЧИЙ МЕТОД
https://www.youtube.com/watch?v=J4iMxPNCo9w

Как ускорить ИНТЕРНЕТ до максимума? 100% РАБОЧИЙ МЕТОД
https://www.youtube.com/watch?v=BbXXPlvcwYw

и т.д.

py.user.next · Апрель 17, 2021 08:27:06

satfan
Только не хватает Заголовков видео перед каждой ссылкой и пробела, который их разделяет.
Как сделать так чтобы в out.txt сохранялось так ?

Тут я дописал функцию получения названия видео и поменял вывод немного.

#!/usr/bin/env python3

from bs4 import BeautifulSoup
import requests
import re

def scrape_videos(url):
    req = requests.get(url)
    send = BeautifulSoup(req.text, "html.parser")
    search = str(send.find_all("script"))
    key = '"videoId":"'
    data = re.findall(key + r"([^*]{11})", search)
    return data

def scrape_lists(url):
    req = requests.get(url)
    send = BeautifulSoup(req.text, "html.parser")
    search = str(send.find_all("script"))
    key = '"playlistId":"'
    data = re.findall(key + r"([^*]{34})", search)
    return data

def get_video_title(url):
    req = requests.get(url)
    send = BeautifulSoup(req.text, "html.parser")
    search = send.title.text
    data = search[:-10]
    return data

if __name__ == "__main__":
    url ="https://www.youtube.com/c/HowdyHoNet/playlists"
    data = scrape_lists(url)
    data = data[::3]
    data = data[:-2]
    for i in data:
        output = 'https://www.youtube.com/playlist?list=' + i
        vid = scrape_videos(output)
        vid = vid[::3]
        vid = vid[:-1]
        for i in vid:
            #ofname = "C:/Users/Александр/Desktop/yotube_plist_downloader/out.txt"
            ofname = 'out.txt'
            video_url = 'https://www.youtube.com/watch?v=' + i
            video_title = get_video_title(video_url)
            with open(ofname, "a", encoding = "utf-8") as files:
                print(video_title + '\n' + video_url + '\n', file=files)
            print(video_title + '\n' + video_url + '\n')

satfan · Апрель 17, 2021 09:09:04

Спасибо.
Скрипт сработал. Но сохранилось только 6 ссылок. А далее ошибка:

 Traceback (most recent call last):
  File "C:\Users\Александр\Desktop\yotube_plist_downloader\plist_down.py", line 46, in <module>
    print(video_title + '\n' + video_url + '\n')
UnicodeEncodeError: 'UCS-2' codec can't encode character '\U0001f631' in position 0: Non-BMP character not supported in Tk
>>>

Отредактировано satfan (Апрель 17, 2021 09:12:54)

py.user.next · Апрель 17, 2021 16:30:51

Зайди в директорию через консоль и запускай его в консоли.
Действия

Win + R
cmd.exe
cd C:\Users\Александр\Desktop\yotube_plist_downloader
dir
python plist_down.py

Не надо IDLE использовать.

Python-сообщество

Уведомления

#1 Апрель 16, 2021 10:46:08

Подскажите с парсером плейлистов в youtube

#2 Апрель 16, 2021 11:05:18

Подскажите с парсером плейлистов в youtube

#3 Апрель 16, 2021 11:19:15

Подскажите с парсером плейлистов в youtube

#4 Апрель 16, 2021 11:32:12

Подскажите с парсером плейлистов в youtube

#5 Апрель 16, 2021 12:17:25

Подскажите с парсером плейлистов в youtube

#6 Апрель 16, 2021 22:01:51

Подскажите с парсером плейлистов в youtube

#7 Апрель 17, 2021 06:49:01

Подскажите с парсером плейлистов в youtube

#8 Апрель 17, 2021 08:27:06

Подскажите с парсером плейлистов в youtube

#9 Апрель 17, 2021 09:09:04

Подскажите с парсером плейлистов в youtube

#10 Апрель 17, 2021 16:30:51

Подскажите с парсером плейлистов в youtube

Board footer