Найти - Пользователи
Полная версия: soup.find не находит данные. парсинг.
Начало » Python для новичков » soup.find не находит данные. парсинг.
1 2 3
IRiot
Вываливается с ошибкой
    
mt = soup.find('div', id='article_full_text')
print(mt)
UnicodeEncodeError: 'charmap' codec can't encode character '\xa9' in position 46
4: character maps to <undefined>
Отрабатывает отлично:
mt = soup.find('div', 'article_lead', itemprop = 'description')
print(mt)
FishHook
а весь скрипт можешь показать?
IRiot
import urllib.request
import re
from bs4 import BeautifulSoup
def GetPage():
    site = urllib.request.urlopen('http://ria.ru/').read()
    soup = BeautifulSoup(site)
    mt = soup.find('div', 'mt-news')
    link = mt.find('a')
    url = link.get('href')
    return url
def ParsPage(url):
    site = urllib.request.urlopen('http://ria.ru' + url).read()
    soup = BeautifulSoup(site)	
	
    mt = soup.find('h1', 'article_header_title', itemprop = 'name')
    p = re.compile(r'<.*?>')
    p.sub('', mt.string)
    article_header_title = mt.string + '.'
	
    mt = soup.find('div', 'article_lead', itemprop = 'description')
    article_lead = mt.string
    mt = soup.find('div', id='article_full_text')
    article_full_text = mt.string
    print('article_header_title: ' + article_header_title)
    print('article_lead: ' + article_lead)
    print(article_full_text)
ParsPage(GetPage())
input('\nDone!')
FishHook
mt.string - не стринг, а text

!!!!!!!!!!!!!
IRiot
Проблема состоит не в этом. Но, спасибо за поправку Не выводит:
mt = soup.find('div', id='article_full_text')
print(mt)
Выводит:
mt = soup.find('div', 'article_lead', itemprop = 'description')
print(mt)
FishHook
IRiot
Проблема состоит не в этом. Но, спасибо за поправку
как сказать

IRiot
FishHook
Ах тут виндовз! Ну тогда, я не знаю чем помочь.
IRiot
Все равно спасибо большое Буду рыть дальше… Я думал у python есть совместимость кода, то что работает на других ос, должно работать и на windows. И еще, python у меня 3.4, а вы как я заметил работаете с 2.7, может ли это влиять?
sander
IRiot
windows 8.1 python3.4
This is a "lo-fi" version of our main content. To view the full version with more information, formatting and images, please click here.
Powered by DjangoBB