Найти - Пользователи
Полная версия: Web парсинг
Начало » Python для новичков » Web парсинг
1
kazakoff64
Привет пытаюсь сделать парсинг, делаю его первый раз.

#!/path/to/python
# -*- coding: utf8 -*-
from bs4 import BeautifulSoup
from urllib2 import urlopen
html_doc = urlopen('http://www.meteoservice.ru/weather/long/name/balakovo.html')
soup = BeautifulSoup(html_doc)
a = soup.body.findNext('td',"time").string
b = soup.body.find('div',"value")
c = soup.body.find('div',"value").span.string
print a,b,c



Не удается выцепить подчеркнутое значение ну короче температуру)
Master_Sergius
Забыл ещё внизу путь замазать синим маркером. Попробуй регекспом выцепить.
kazakoff64
Master_Sergius
Забыл ещё внизу путь замазать синим маркером. Попробуй регекспом выцепить.

Да я только название хотел замазать, неприличное название)
kazakoff64
Пошел другим путем.

#!/path/to/python
# -*- coding: utf8 -*-
from bs4 import BeautifulSoup
from urllib2 import urlopen
html_doc = urlopen('http://informer.gismeteo.ru/rss/27612.xml')
soup = BeautifulSoup(html_doc)
print soup('item')[0].title.string
print soup('item')[0].description.string
print ''
print soup('item')[1].title.string
print soup('item')[1].description.string
print ''
print soup('item')[2].title.string
print soup('item')[2].description.string
print ''
print soup('item')[3].title.string
print soup('item')[3].description.string
lorien
>>> from grab import Grab
>>> g = Grab()
>>> g.go('http://www.meteoservice.ru/weather/long/name/balakovo.html')
<grab.response.Response object at 0x29349f0>
>>> print g.doc.select('//td[@class="temperature"]/div[@class="value"]').text()
-1...0°
This is a "lo-fi" version of our main content. To view the full version with more information, formatting and images, please click here.
Powered by DjangoBB