Уведомления

Группа в Telegram: @pythonsu

#1 Сен. 2, 2010 06:10:47

vladseo
От:
Зарегистрирован: 2010-08-31
Сообщения: 3
Репутация: +  0  -
Профиль   Отправить e-mail  

Помогите разобраться с кодировкой

Собственно перепробовал варианты, которые нашел в нете… не помогло

Ситуация такая, я получаю HTML страницу, например методом urllib.urlopen, латинские символы отображаются корректно, кирилица не читается (каракули), из под линукса кирилица заменена вопросиками.

Посоветуйте, как можно сделать вывод с кирилицей, если можно на этом примере

import urllib
doc = urllib.urlopen("http://ya.ru").read()
print doc
Спасибо



Отредактировано (Сен. 2, 2010 06:11:25)

Офлайн

#2 Сен. 2, 2010 09:58:17

alexx11
От:
Зарегистрирован: 2010-05-13
Сообщения: 208
Репутация: +  0  -
Профиль   Отправить e-mail  

Помогите разобраться с кодировкой

vladseo
под линукса кирилица заменена вопросиками
Откуда ж там вопросики могут быть? У меня в консоле, например, этот же код такое выдаёт : “п║пЄп╣п╩п╟я┌я▄ я│я┌п╟я─я┌п╬п╡п╬п╧” и т.д.



Отредактировано (Сен. 2, 2010 10:26:49)

Офлайн

#3 Сен. 2, 2010 10:08:31

regall
От: Киев
Зарегистрирован: 2008-07-17
Сообщения: 1583
Репутация: +  3  -
Профиль   Отправить e-mail  

Помогите разобраться с кодировкой

vladseo, поищите по форуму. Вопрос с кодировкой здесь освещен был уже несколько раз лучше нежели любой другой: http://python.su/forum/search.php?search_id=1213275499



Офлайн

#4 Сен. 2, 2010 19:09:04

dmnBrest
От:
Зарегистрирован: 2010-08-05
Сообщения: 23
Репутация: +  0  -
Профиль   Отправить e-mail  

Помогите разобраться с кодировкой

Вот очень интересная и понятная статья на тему кодировок!!!

http://www.py-my.ru/post/4bfb3c6a1d41c846bc00009b

Все проблемы с кодировками надо искать не в питоне, а в той среде, где вы работаете.
Во-первых надо учитывать кодировку исходного кода python (устанавливается в редакторе кода)
Во-вторых надо знать в какую кодировку понимает система (консоль) куда осуществляется вывод и исходя из этого играться кодировками:
например print doc.encode('windows-1251'), utf-8 или какие там еще кодировки понимают русские символы.

P/S/ Ваш код у меня даже очень прекрасно работает.



Офлайн

Board footer

Модераторировать

Powered by DjangoBB

Lo-Fi Version