Форум сайта python.su
Доброе времени суток! Подскажите пожалуйста начинающему програмисту
Как спарсить гугл выдачу и сохранить результаты в одном ексель фаиле (запрос, ссылка, заголовок, сниппет) и чтобы скрипт брал запросы из *.txt - фаила.
Я сохранил .html страницу на пк для тестирования.
Начал с написания кода сбора инфы (запрос, ссылка, заголовок, сниппет), но со сниппетом не получается
Помогите пожалуйста дописать скрипт!!!
КОД:
from bs4 import BeautifulSoup
html = open('****.html', encoding=“utf8”).read()
soup = BeautifulSoup(html, ‘html.parser’)
h3 = soup.find('div', class_ = ‘srg’).find_all('h3', class_ = ‘r’)
title = soup.find('title').text.split('-').strip()
text = soup.find_all('span', class_ = ‘st’)
for i in h3:
zagolovok = i.text
link = i.find('a')
links = link.get('href')
print(title + ‘;’ + zagolovok + ‘;’ + links)
Прикреплённый файлы:
фото.jpg (274,6 KБ)
Офлайн
В чем именно проблема?
Офлайн
inoksРазобрался, спасибо
В чем именно проблема?
Офлайн
Ребята кто знает можно ли на питоне сделать такое расширение как http://adblockplus.org/ или http://adguard.ideaprog.download/ или они делаются только на JS
Также интересно как работают данные расширения, исходников не нашел. На GitHab лежит единственный README.md
Знаю что лишь для фильтрации рекламы используется блокировка по URL, скрытие с помощью CSS и фильтрация HTML-кода. А можно ли сделать так чтобы баннер заменялся другим баннером. То есть создать такое расширение которое добавляло бы пользовательский класс стиля
background-image: url('http://example.com/banner.img'); cursor: pointer;
onclick='window.open("http://ya.ru");'
Отредактировано Thron (Ноя. 18, 2019 08:57:18)
Офлайн
ThronСкачиваешь расширение и просто распаковываешь его как архив. Там исходники.
Также интересно как работают данные расширения, исходников не нашел.
Офлайн
py.user.nextТак кроме ихнего .exe на сайте и расширения в хром магазине, нету
Отредактировано Thron (Ноя. 18, 2019 08:58:50)
Офлайн
py.user.nextСпасибо нашел расширение.. Оно вроде как в формате .crx
Офлайн