Уведомления

Группа в Telegram: @pythonsu

#1 Дек. 17, 2018 20:36:52

Ignat
Зарегистрирован: 2018-11-10
Сообщения: 7
Репутация: +  0  -
Профиль   Отправить e-mail  

Проблемы со шрифтами при парсинге сайтов bs4. ascii в utf-8.

import requests, bs4

r = requests.get('https://www.newsler.ru')

page_text = r.text.encode('utf-8').decode('ascii','replace')# лучшее что смог найти, не
# помогает.
b=bs4.BeautifulSoup(page_text,“html.parser”)
p3=b.select('.zag')
p1=p3
print p1

Не читает русский текст. Выводит вместо русского текста ромбики. При различных вариантах ругается:
UnicodeEncodeError: ‘ascii’ codec can't encode characters in position 0-1: ordinal not in range(128)
Долго бился над проблемой, решить не смог. Работаю в Android.
Подскажите, что сделать?

Отредактировано Ignat (Дек. 17, 2018 20:37:35)

Офлайн

#2 Дек. 23, 2018 13:07:28

Ignat
Зарегистрирован: 2018-11-10
Сообщения: 7
Репутация: +  0  -
Профиль   Отправить e-mail  

Проблемы со шрифтами при парсинге сайтов bs4. ascii в utf-8.

Всем спасибо за ответы. С проблемой справился. Вопрос закрыт.

Офлайн

Board footer

Модераторировать

Powered by DjangoBB

Lo-Fi Version