Найти - Пользователи
Полная версия: Проблемы со шрифтами при парсинге сайтов bs4. ascii в utf-8.
Начало » Python для экспертов » Проблемы со шрифтами при парсинге сайтов bs4. ascii в utf-8.
1
Ignat
import requests, bs4

r = requests.get('https://www.newsler.ru')

page_text = r.text.encode('utf-8').decode('ascii','replace')# лучшее что смог найти, не
# помогает.
b=bs4.BeautifulSoup(page_text,“html.parser”)
p3=b.select('.zag')
p1=p3
print p1

Не читает русский текст. Выводит вместо русского текста ромбики. При различных вариантах ругается:
UnicodeEncodeError: ‘ascii’ codec can't encode characters in position 0-1: ordinal not in range(128)
Долго бился над проблемой, решить не смог. Работаю в Android.
Подскажите, что сделать?
Ignat
Всем спасибо за ответы. С проблемой справился. Вопрос закрыт.
This is a "lo-fi" version of our main content. To view the full version with more information, formatting and images, please click here.
Powered by DjangoBB