Уведомления

Группа в Telegram: @pythonsu

#1 Фев. 14, 2016 12:42:05

allcaponne
Зарегистрирован: 2016-02-12
Сообщения: 17
Репутация: +  1  -
Профиль   Отправить e-mail  

Как парсить сайт, где основной контент на JS

Подскажите чем парсить сайт, если контент который нужен генерируется JS. Заранее спасибо за ответы.

Офлайн

#2 Фев. 14, 2016 13:30:32

ajib6ept
От: От: От: От: От: От: От: От:
Зарегистрирован: 2013-08-04
Сообщения: 297
Репутация: +  26  -
Профиль   Отправить e-mail  

Как парсить сайт, где основной контент на JS

allcaponne
Подскажите чем парсить сайт, если контент который нужен генерируется JS. Заранее спасибо за ответы.

Через Selenium, или если JS код простой, можно через NodeJS его у себя обрабатывать.



_________________________
Python golden rule: Do not PEP 8 unto others; only PEP 8 thy self.
Don't let PEP 8 make you insanely intolerant of other people's code.

Офлайн

#3 Фев. 14, 2016 14:11:33

ayb
Зарегистрирован: 2014-04-01
Сообщения: 297
Репутация: +  24  -
Профиль   Отправить e-mail  

Как парсить сайт, где основной контент на JS

Что значит генерируется ? Генерируй его на питоне если там несложный алгоритм, а вообще сайт в студию, тогда можно будет о чем то говорить.

Офлайн

#4 Фев. 14, 2016 15:09:40

allcaponne
Зарегистрирован: 2016-02-12
Сообщения: 17
Репутация: +  1  -
Профиль   Отправить e-mail  

Как парсить сайт, где основной контент на JS

сайт myscore.ru

Офлайн

#5 Фев. 14, 2016 15:25:00

allcaponne
Зарегистрирован: 2016-02-12
Сообщения: 17
Репутация: +  1  -
Профиль   Отправить e-mail  

Как парсить сайт, где основной контент на JS

C Selenium есть затык, у меня Python стоит на Debian server, что бы Selenium работал нужна графическая оболочка.

Офлайн

#6 Фев. 14, 2016 17:30:34

ajib6ept
От: От: От: От: От: От: От: От:
Зарегистрирован: 2013-08-04
Сообщения: 297
Репутация: +  26  -
Профиль   Отправить e-mail  

Как парсить сайт, где основной контент на JS

allcaponne
C Selenium есть затык, у меня Python стоит на Debian server, что бы Selenium работал нужна графическая оболочка.

Нет, графическая оболочка не обязательное условие.



_________________________
Python golden rule: Do not PEP 8 unto others; only PEP 8 thy self.
Don't let PEP 8 make you insanely intolerant of other people's code.

Офлайн

#7 Фев. 15, 2016 07:27:55

ayb
Зарегистрирован: 2014-04-01
Сообщения: 297
Репутация: +  24  -
Профиль   Отправить e-mail  

Как парсить сайт, где основной контент на JS

Я советую сделать проще - если нужен только список матчей, парси flashscore.mobi.

Офлайн

#8 Фев. 16, 2016 19:44:34

allcaponne
Зарегистрирован: 2016-02-12
Сообщения: 17
Репутация: +  1  -
Профиль   Отправить e-mail  

Как парсить сайт, где основной контент на JS

ajib6ept
Подскажите как сделать без установки графической оболочки. Поставить virtualmonitor?

Офлайн

#9 Фев. 17, 2016 05:44:04

ajib6ept
От: От: От: От: От: От: От: От:
Зарегистрирован: 2013-08-04
Сообщения: 297
Репутация: +  26  -
Профиль   Отправить e-mail  

Как парсить сайт, где основной контент на JS

Есть два способа, я обычно использую тот, где в качестве драйвера используют PhantomJS.



_________________________
Python golden rule: Do not PEP 8 unto others; only PEP 8 thy self.
Don't let PEP 8 make you insanely intolerant of other people's code.

Офлайн

Board footer

Модераторировать

Powered by DjangoBB

Lo-Fi Version