Уведомления

Группа в Telegram: @pythonsu

#1 Июнь 3, 2014 09:25:30

zalexz94
Зарегистрирован: 2014-06-03
Сообщения: 6
Репутация: +  0  -
Профиль   Отправить e-mail  

Получить информацию из скрипта

Дан такой код

<img alt="тел. " height="15" onclick="acquire_contacts(arguments[0])" src="/assets/tel-85b342a711756e4e17ce0c1f15fc71e6.gif" width="15" />
<span id='pad_contacts_266731'></span>
</span>
при нажатии на картинку выдает некую инфу. Мне нужно его извлечь, ну и в файл сохранить

Офлайн

#2 Июнь 3, 2014 11:15:00

noob_saibot
Зарегистрирован: 2013-09-11
Сообщения: 495
Репутация: +  20  -
Профиль   Отправить e-mail  

Получить информацию из скрипта

zalexz94
Дан такой код
zalexz94
при нажатии на картинку выдает некую инфу
zalexz94
Мне нужно его извлечь
вы сами поняли что написали?

Офлайн

#3 Июнь 3, 2014 11:32:46

zalexz94
Зарегистрирован: 2014-06-03
Сообщения: 6
Репутация: +  0  -
Профиль   Отправить e-mail  

Получить информацию из скрипта

точнее мне нужно извлечь с html страницы информацию, но она появляется только при нажатии на картинку. как мне можно ее извлечь? (p.s я совсем зеленый в этом деле, сильно не ругайте)

Отредактировано zalexz94 (Июнь 3, 2014 11:33:15)

Офлайн

#4 Июнь 3, 2014 11:39:59

noob_saibot
Зарегистрирован: 2013-09-11
Сообщения: 495
Репутация: +  20  -
Профиль   Отправить e-mail  

Получить информацию из скрипта

zalexz94
точнее мне нужно извлечь с html страницы информацию, но она появляется только при нажатии на картинку. как мне можно ее извлечь? (p.s я совсем зеленый в этом деле, сильно не ругайте)
Вам надо программу распознования текста (типа: Антигейт или подобную), туда просто сохраните картинку и все. Код хорошей программы распознования текста вам никто не выложит

Отредактировано noob_saibot (Июнь 3, 2014 11:40:33)

Офлайн

#5 Июнь 3, 2014 12:00:00

zalexz94
Зарегистрирован: 2014-06-03
Сообщения: 6
Репутация: +  0  -
Профиль   Отправить e-mail  

Получить информацию из скрипта

noob_saibot
Вам надо программу распознования текста
вы не поняли меня). Там скрипт, который выдает текст - и вот этот текст мне необходимо извлечь.

Офлайн

#6 Июнь 3, 2014 12:12:49

noob_saibot
Зарегистрирован: 2013-09-11
Сообщения: 495
Репутация: +  20  -
Профиль   Отправить e-mail  

Получить информацию из скрипта

zalexz94
Дайте ссылку на страницу.

Офлайн

#7 Июнь 3, 2014 12:25:31

zalexz94
Зарегистрирован: 2014-06-03
Сообщения: 6
Репутация: +  0  -
Профиль   Отправить e-mail  

Получить информацию из скрипта

noob_saibot
Дайте ссылку на страницу.
http://www.suntimes.ru/o/14?page=2

Офлайн

#8 Июнь 3, 2014 14:54:36

noob_saibot
Зарегистрирован: 2013-09-11
Сообщения: 495
Репутация: +  20  -
Профиль   Отправить e-mail  

Получить информацию из скрипта

from selenium import webdriver
driver = webdriver.Firefox()
driver.get("http://www.suntimes.ru/o/14?page=2")
allnumb=driver.find_elements_by_xpath("//*/img[@onclick='acquire_contacts(arguments[0])']")
for number in allnumb:
    number.click()
elem=driver.find_elements_by_xpath("//*/tr/td[2]/*/span/span")
for text in elem:
    print text.text
Для того чтобы работал быстрее можете воспользоваться HTMLUnit driver (у меня через прокси не заработал).
А чтобы все json отработали (когда вместо телефона написано:“запрос…”), либо sleep выставите, либо с WebDriverWait поиграйте.

PS. Ну и само собой к xpath лучше не привязываться, но там не слишком много атрибутов.

Отредактировано noob_saibot (Июнь 3, 2014 14:56:19)

Офлайн

#9 Июнь 3, 2014 15:44:35

zalexz94
Зарегистрирован: 2014-06-03
Сообщения: 6
Репутация: +  0  -
Профиль   Отправить e-mail  

Получить информацию из скрипта

noob_saibot
благодарю, буду пробовать

Офлайн

#10 Июнь 4, 2014 10:33:37

zalexz94
Зарегистрирован: 2014-06-03
Сообщения: 6
Репутация: +  0  -
Профиль   Отправить e-mail  

Получить информацию из скрипта

noob_saibot
распиши чуть подробней пожалуйста, не выходит у меня

Офлайн

Board footer

Модераторировать

Powered by DjangoBB

Lo-Fi Version