Форум сайта python.su
# написал свой первый скрапер from urllib.request import urlopen from bs4 import BeautifulSoup html = urlopen("https://www.wunderground.com/history/airport/UUEE/2015/1/1/DailyHistory.html") soup = BeautifulSoup(html.read(), "html.parser") dayTemp = soup.findAll(attrs={"class":"wx-value"})[1] print (dayTemp) # возвращает <span class="wx-value">1</span> # а как извлечь значение – 1? # попробовал вот так: dayTemp = soup.findAll(attrs={"class":"wx-value"})[1].span.string print (dayTemp) # не работает # подскажите, пожалуйста
Отредактировано s_bag (Май 13, 2016 17:32:53)
Прикреплённый файлы:
v1.py (547 байт)
Офлайн
s_bagЧрезвычайно исчерпывающее объяснение проблемы
Не работает.
Офлайн
s_bagКодировки исправь. Надо сделать utf-8.
Подскажите, пожалуйста, что поправить.
Офлайн
Спасибо за помощь)))
Методом тыка обнаружил, что строчку
dayTemp = soup.findAll(attrs={"class":"wx-value"})[1].span.string
dayTemp = soup.findAll(attrs={"class":"wx-value"})[1].string
Отредактировано s_bag (Май 13, 2016 17:31:44)
Прикреплённый файлы:
v1.py (297 байт)
Офлайн
s_bag
s_bag
s_bagЭто вы некорректно оформляете код, для кода есть теги
некорректно показывает
[code python][/code]
Офлайн
Спасибо за подсказку. Поправил.
Офлайн