Уведомления

Группа в Telegram: @pythonsu

#1 Май 12, 2016 22:48:25

izuchaju_python
Зарегистрирован: 2016-04-17
Сообщения: 55
Репутация: +  2  -
Профиль   Отправить e-mail  

selenium

написал парсер с использованием селениума веб драйвера фаерфокс…ну очень дщолго так можно парсить…есть ли вариант ускорить это? чтобы не запускался браузер, а неявно это как-то делалось? или код выполнялся б в каком-то облаке?! что посоветуете?!

Офлайн

#2 Май 12, 2016 23:02:54

JOHN_16
От: Россия, Петропавловск-Камчатск
Зарегистрирован: 2010-03-22
Сообщения: 3292
Репутация: +  221  -
Профиль   Отправить e-mail  

selenium

requests + BeautifulSoup/lxml/Grab ?



_________________________________________________________________________________
полезный блог о python john16blog.blogspot.com

Офлайн

#3 Май 12, 2016 23:11:29

izuchaju_python
Зарегистрирован: 2016-04-17
Сообщения: 55
Репутация: +  2  -
Профиль   Отправить e-mail  

selenium

JOHN_16
да там иконка показать телефон, суп не видит номера, номер появляется только после клика…

Офлайн

#4 Июнь 24, 2016 06:56:50

scidam
Зарегистрирован: 2016-06-15
Сообщения: 288
Репутация: +  35  -
Профиль   Отправить e-mail  

selenium

Если номер появляется после клика вполне возможно нужен интерпретатор javascript (т.е. браузер); существует безголовый (headless) браузер - PhantomJS, с ним Selenium вполне может работать.

Офлайн

#5 Авг. 15, 2016 17:57:20

mmm_corp
От: Украина
Зарегистрирован: 2015-08-28
Сообщения: 17
Репутация: +  0  -
Профиль   Отправить e-mail  

selenium

попробуйте фантом

Офлайн

#6 Фев. 16, 2017 14:24:51

nagellack5c
Зарегистрирован: 2017-02-16
Сообщения: 1
Репутация: +  0  -
Профиль   Отправить e-mail  

selenium

Привет, вот тут подробно всё рассказали: http://stackoverflow.com/questions/13287490/is-there-a-way-to-use-phantomjs-in-python
Если коротко - нужно установить Node.js и PhantomJS через его менеджер пакетов, потом скормить путь к PhantomJS селениуму.
Сам недавно сталкивался с такой проблемой, но в итоге обошёлся обычным Chrome Driver.

Офлайн

Board footer

Модераторировать

Powered by DjangoBB

Lo-Fi Version