Форум сайта python.su
привет, у меня есть задача написать парсер веб страниц с целью найти контактную информацию.
например,
test.py nike moscow
и результат должен быть: мэйл для сзязи с Найком в Москве
Я пытаюсь понять, как лучше логически реализовать это, чтобы скрипт не занимал при этом кучу времени
1. найти в гугле офф сайт nike
2. перейти на сайт и найти все линки на сайте
3. найти все мэйлы на страницах
но тут загвоздка - как потом определить, что мэйл относится к Москве именно?
На каком шаге лучше делать проверку на местоположение? (Москва)
спасибо большое! я новичок, пытаюсь набраться опыта в решении проблем
Офлайн
from time import timeboost from spamtools import Google args with timeboost() as t: first, second = args() site = Google(first)[0] site.parse_all_email() print site.sort_by(second)
Отредактировано Singularity (Ноя. 29, 2013 12:29:55)
Офлайн
smartass
Офлайн