Форум сайта python.su
0
Привет пытаюсь сделать парсинг, делаю его первый раз.
#!/path/to/python # -*- coding: utf8 -*- from bs4 import BeautifulSoup from urllib2 import urlopen html_doc = urlopen('http://www.meteoservice.ru/weather/long/name/balakovo.html') soup = BeautifulSoup(html_doc) a = soup.body.findNext('td',"time").string b = soup.body.find('div',"value") c = soup.body.find('div',"value").span.string print a,b,c

Отредактировано kazakoff64 (Фев. 13, 2014 14:12:55)
Офлайн
7
Забыл ещё внизу путь замазать синим маркером. Попробуй регекспом выцепить.
Офлайн
0
Master_Sergius
Забыл ещё внизу путь замазать синим маркером. Попробуй регекспом выцепить.
Да я только название хотел замазать, неприличное название)
Офлайн
0
Пошел другим путем.
#!/path/to/python # -*- coding: utf8 -*- from bs4 import BeautifulSoup from urllib2 import urlopen html_doc = urlopen('http://informer.gismeteo.ru/rss/27612.xml') soup = BeautifulSoup(html_doc) print soup('item')[0].title.string print soup('item')[0].description.string print '' print soup('item')[1].title.string print soup('item')[1].description.string print '' print soup('item')[2].title.string print soup('item')[2].description.string print '' print soup('item')[3].title.string print soup('item')[3].description.string
Офлайн
>>> from grab import Grab >>> g = Grab() >>> g.go('http://www.meteoservice.ru/weather/long/name/balakovo.html') <grab.response.Response object at 0x29349f0> >>> print g.doc.select('//td[@class="temperature"]/div[@class="value"]').text() -1...0°
Офлайн