Форум сайта python.su
Всем доброго времени суток. С парсингом на питоне, да и просто с парсингом ни разу не сталкивался. Требуется запарсить сайт CS.MONEY, а именно данный div-блок: *скриншот* . Но в связи с моей неопытностью(криворукостью) не обошлось без проблем. Вот собственно и они:
1) Сайт не парсится. При попытке запустить скрипт, вылазит эта ошибка: *скриншот*. Причем не парсится только этот сайт, с остальными все в порядке. Код:
import urllib.request from bs4 import BeautifulSoup def get_html(url): response = urllib.request.urlopen(url) return response.read() def main(): print(get_html('https://cs.money/')) if __name__ == '__main__': main()
Офлайн
Ух. Извини, но я пока могу парсить только текст - это легче чем картинки и другие элементы, типо картинок, различных блоков и т.п. Но ты можешь посмотреть на pythonworld(или .ru или .com или .su - скорее всего .ru). Там ввобще все есть - от изучения синтаксиса до sqlite и т.п.
Отредактировано python335 (Окт. 28, 2017 13:33:11)
Офлайн
Код на коленке:
from bs4 import BeautifulSoup import requests from urllib.parse import urlparse from basket_rest.basket.models import * a = requests.get('http://basket.com.ua') soup = BeautifulSoup(a.content, 'lxml') els_ul_new = soup.find_all('div', {'class': 'ul_new'})
Офлайн