Уведомления

Группа в Telegram: @pythonsu

#1 Ноя. 29, 2013 07:58:40

odd
Зарегистрирован: 2013-11-29
Сообщения: 2
Репутация: +  0  -
Профиль   Отправить e-mail  

распарсить веб сайт и найти контактную информацию

привет, у меня есть задача написать парсер веб страниц с целью найти контактную информацию.
например,
test.py nike moscow
и результат должен быть: мэйл для сзязи с Найком в Москве

Я пытаюсь понять, как лучше логически реализовать это, чтобы скрипт не занимал при этом кучу времени

1. найти в гугле офф сайт nike
2. перейти на сайт и найти все линки на сайте
3. найти все мэйлы на страницах
но тут загвоздка - как потом определить, что мэйл относится к Москве именно?

На каком шаге лучше делать проверку на местоположение? (Москва)

спасибо большое! я новичок, пытаюсь набраться опыта в решении проблем

Офлайн

#2 Ноя. 29, 2013 08:41:40

Singularity
Зарегистрирован: 2011-07-28
Сообщения: 1387
Репутация: +  75  -
Профиль   Отправить e-mail  

распарсить веб сайт и найти контактную информацию

from time import timeboost
from spamtools import Google args
with timeboost() as t:
    first, second = args()
    site = Google(first)[0]
    site.parse_all_email()
    print site.sort_by(second)

Отредактировано Singularity (Ноя. 29, 2013 12:29:55)

Офлайн

#3 Ноя. 29, 2013 14:28:28

odd
Зарегистрирован: 2013-11-29
Сообщения: 2
Репутация: +  0  -
Профиль   Отправить e-mail  

распарсить веб сайт и найти контактную информацию

smartass

Офлайн

Board footer

Модераторировать

Powered by DjangoBB

Lo-Fi Version