Найти - Пользователи
Полная версия: распарсить веб сайт и найти контактную информацию
Начало » Центр помощи » распарсить веб сайт и найти контактную информацию
1
odd
привет, у меня есть задача написать парсер веб страниц с целью найти контактную информацию.
например,
test.py nike moscow
и результат должен быть: мэйл для сзязи с Найком в Москве

Я пытаюсь понять, как лучше логически реализовать это, чтобы скрипт не занимал при этом кучу времени

1. найти в гугле офф сайт nike
2. перейти на сайт и найти все линки на сайте
3. найти все мэйлы на страницах
но тут загвоздка - как потом определить, что мэйл относится к Москве именно?

На каком шаге лучше делать проверку на местоположение? (Москва)

спасибо большое! я новичок, пытаюсь набраться опыта в решении проблем
Singularity
from time import timeboost
from spamtools import Google args
with timeboost() as t:
    first, second = args()
    site = Google(first)[0]
    site.parse_all_email()
    print site.sort_by(second)
odd
smartass
This is a "lo-fi" version of our main content. To view the full version with more information, formatting and images, please click here.
Powered by DjangoBB