Форум сайта python.su
написал парсер с использованием селениума веб драйвера фаерфокс…ну очень дщолго так можно парсить…есть ли вариант ускорить это? чтобы не запускался браузер, а неявно это как-то делалось? или код выполнялся б в каком-то облаке?! что посоветуете?!
Офлайн
requests + BeautifulSoup/lxml/Grab ?
Офлайн
JOHN_16
да там иконка показать телефон, суп не видит номера, номер появляется только после клика…
Офлайн
Если номер появляется после клика вполне возможно нужен интерпретатор javascript (т.е. браузер); существует безголовый (headless) браузер - PhantomJS, с ним Selenium вполне может работать.
Офлайн
попробуйте фантом
Офлайн
Привет, вот тут подробно всё рассказали: http://stackoverflow.com/questions/13287490/is-there-a-way-to-use-phantomjs-in-python
Если коротко - нужно установить Node.js и PhantomJS через его менеджер пакетов, потом скормить путь к PhantomJS селениуму.
Сам недавно сталкивался с такой проблемой, но в итоге обошёлся обычным Chrome Driver.
Офлайн