Подскажите пжл, регулярку на поиск ссылки с вхождение - “instagram.com”
Список:
yseasons.ru
be2b.pro
arlekinospb.ru
world-stars.eu
www.Event-ER.ru
ledwed.ru
sunday-agency.ru
www.9540935.ru
panda-project.ru
https://clever-events.ru
https://vk.com/kreo_kuhnya
svyshe.com
www.remar.ru
www.sloko.ru
www.DesignBoutique.ru
yseasons.ru
from grab import Grab, GrabError import pycurl import time import random import re g = Grab() g.setup(connect_timeout=10) g.setup(log_dir='log') #g.setup(redirect_limit=0) #g.setup(reuse_cookies = True) #g.setup(follow_refresh= False) #g.clear_cookies() eventfirm=open('url.txt').read().splitlines() #kbkres= open('eventSPB.txt','w') #print (eventfirm) #g.go('www.terem-prazdnik.ru') #print g.doc.rex_search('[\w\.-]+@[\w\.-]+').group(0) #print g.doc.text_search(u'@') x=0 for x in range(len(eventfirm)): try: g.go(eventfirm[x]) print g.doc.rex_search('[\w\.-]+@[\w\.-]+').group() #emeil except IndexError: print ('Email не найден '+ eventfirm[x]) continue except GrabError: print ('Сайт не работает '+ eventfirm[x]) continue print('Конец цикла')
/ худо-бедно заработало.