Python-сообщество

philips2009 · Май 9, 2017 22:49:04

Доброе времени суток! Подскажите пожалуйста начинающему програмисту
Как спарсить гугл выдачу и сохранить результаты в одном ексель фаиле (запрос, ссылка, заголовок, сниппет) и чтобы скрипт брал запросы из *.txt - фаила.
Я сохранил .html страницу на пк для тестирования.
Начал с написания кода сбора инфы (запрос, ссылка, заголовок, сниппет), но со сниппетом не получается

Помогите пожалуйста дописать скрипт!!!

КОД:
from bs4 import BeautifulSoup

html = open('****.html', encoding=“utf8”).read()
soup = BeautifulSoup(html, ‘html.parser’)
h3 = soup.find('div', class_ = ‘srg’).find_all('h3', class_ = ‘r’)
title = soup.find('title').text.split('-').strip()
text = soup.find_all('span', class_ = ‘st’)

for i in h3:
zagolovok = i.text
link = i.find('a')
links = link.get('href')
print(title + ‘;’ + zagolovok + ‘;’ + links)

Прикреплённый файлы:
фото.jpg (274,6 KБ)

inoks · Сен. 12, 2017 12:26:07

В чем именно проблема?

—
Ищу Python/Django разработчиков - пишите inoks@mail.ru
Хостинг SSD от 250 р/мес - регистрация по ссылке +2 месяца бесплатно

philips2009 · Ноя. 28, 2017 13:55:57

inoks
В чем именно проблема?

Разобрался, спасибо

Thron · Янв. 9, 2018 04:18:05

Ребята кто знает можно ли на питоне сделать такое расширение как http://adblockplus.org/ или http://adguard.ideaprog.download/ или они делаются только на JS
Также интересно как работают данные расширения, исходников не нашел. На GitHab лежит единственный README.md

Знаю что лишь для фильтрации рекламы используется блокировка по URL, скрытие с помощью CSS и фильтрация HTML-кода. А можно ли сделать так чтобы баннер заменялся другим баннером. То есть создать такое расширение которое добавляло бы пользовательский класс стиля

 background-image: url('http://example.com/banner.img');
 cursor: pointer;

а после еще и добавить в html

 onclick='window.open("http://ya.ru");'

как бы перенаправлять людей на партнерскую ссылку. Кто знает возможно ли это и есть ли смысл в обще думать об этом?

Отредактировано Thron (Ноя. 18, 2019 08:57:18)

py.user.next · Янв. 9, 2018 04:37:50

Thron
Также интересно как работают данные расширения, исходников не нашел.

Скачиваешь расширение и просто распаковываешь его как архив. Там исходники.

Thron · Янв. 9, 2018 05:21:48

py.user.next

Так кроме ихнего .exe на сайте и расширения в хром магазине, нету
Когда в хром сторе захожу просто пишет “добавлено в хром”
Или это нужно искать как то по особенному?

Отредактировано Thron (Ноя. 18, 2019 08:58:50)

Thron · Янв. 9, 2018 05:25:32

py.user.next

Спасибо нашел расширение.. Оно вроде как в формате .crx

Python-сообщество

Уведомления

#1 Май 9, 2017 22:49:04

Как парсить Google

#2 Сен. 12, 2017 12:26:07

Как парсить Google

#3 Ноя. 28, 2017 13:55:57

Как парсить Google

#4 Янв. 9, 2018 04:18:05

Как парсить Google

#5 Янв. 9, 2018 04:37:50

Как парсить Google

#6 Янв. 9, 2018 05:21:48

Как парсить Google

#7 Янв. 9, 2018 05:25:32

Как парсить Google

Board footer