Господа, прошу вашей помощи.
Возникла необходимость спарсить словарь с сайта (прошу, дочитайте до конца.)
www.sanskrit-lexicon.uni-koeln.de
В основном задачи такого характера я пытаюсь решать через php + curl но данную задачу я не смог реализовать через него.
я попросил помощи на stackoverflow но …
Я попробовал написать на питоне
import urllib import urllib2 headers = {'User-Agent' : 'Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 6.0)'} #POSTDATA=dictionary=cap&st=ja&prst=exact&en=&pren=exact&maxhits=50 values = {'dictionary' : 'cap' , 'st' : 'ja' , 'prst' : 'exact', 'en' : '', 'pren' : 'exact', 'maxhits' : '50'} dataer = urllib.urlencode(values) req = urllib2.Request('Referer=http://www.sanskrit-lexicon.uni-koeln.de/scans/MWScan/tamil/index.html', dataer, headers) response = urllib2.urlopen(req) print response.read()
Сама суть задачи имея текстовый файл с значениями, подставлять их в параметр st
полученный html записывать в другой файл с дозаписью.
Буду очень благодарен за советы, либо решение.