mt = soup.find('div', id='article_full_text') print(mt)
UnicodeEncodeError: 'charmap' codec can't encode character '\xa9' in position 46 4: character maps to <undefined>
mt = soup.find('div', 'article_lead', itemprop = 'description') print(mt)
mt = soup.find('div', id='article_full_text') print(mt)
UnicodeEncodeError: 'charmap' codec can't encode character '\xa9' in position 46 4: character maps to <undefined>
mt = soup.find('div', 'article_lead', itemprop = 'description') print(mt)
import urllib.request import re from bs4 import BeautifulSoup def GetPage(): site = urllib.request.urlopen('http://ria.ru/').read() soup = BeautifulSoup(site) mt = soup.find('div', 'mt-news') link = mt.find('a') url = link.get('href') return url def ParsPage(url): site = urllib.request.urlopen('http://ria.ru' + url).read() soup = BeautifulSoup(site) mt = soup.find('h1', 'article_header_title', itemprop = 'name') p = re.compile(r'<.*?>') p.sub('', mt.string) article_header_title = mt.string + '.' mt = soup.find('div', 'article_lead', itemprop = 'description') article_lead = mt.string mt = soup.find('div', id='article_full_text') article_full_text = mt.string print('article_header_title: ' + article_header_title) print('article_lead: ' + article_lead) print(article_full_text) ParsPage(GetPage()) input('\nDone!')
!!!!!!!!!!!!!
Не выводит:mt = soup.find('div', id='article_full_text') print(mt)
mt = soup.find('div', 'article_lead', itemprop = 'description') print(mt)
IRiotкак сказать
Проблема состоит не в этом. Но, спасибо за поправку
Буду рыть дальше… Я думал у python есть совместимость кода, то что работает на других ос, должно работать и на windows. И еще, python у меня 3.4, а вы как я заметил работаете с 2.7, может ли это влиять?