Форум сайта python.su
Собственно перепробовал варианты, которые нашел в нете… не помогло
Ситуация такая, я получаю HTML страницу, например методом urllib.urlopen, латинские символы отображаются корректно, кирилица не читается (каракули), из под линукса кирилица заменена вопросиками.
Посоветуйте, как можно сделать вывод с кирилицей, если можно на этом примере
import urllib
doc = urllib.urlopen("http://ya.ru").read()
print doc
Отредактировано (Сен. 2, 2010 06:11:25)
Офлайн
vladseoОткуда ж там вопросики могут быть? У меня в консоле, например, этот же код такое выдаёт : “п║пЄп╣п╩п╟я┌я▄ я│я┌п╟я─я┌п╬п╡п╬п╧” и т.д.
под линукса кирилица заменена вопросиками
Отредактировано (Сен. 2, 2010 10:26:49)
Офлайн
vladseo, поищите по форуму. Вопрос с кодировкой здесь освещен был уже несколько раз лучше нежели любой другой: http://python.su/forum/search.php?search_id=1213275499
Офлайн
Вот очень интересная и понятная статья на тему кодировок!!!
http://www.py-my.ru/post/4bfb3c6a1d41c846bc00009b
Все проблемы с кодировками надо искать не в питоне, а в той среде, где вы работаете.
Во-первых надо учитывать кодировку исходного кода python (устанавливается в редакторе кода)
Во-вторых надо знать в какую кодировку понимает система (консоль) куда осуществляется вывод и исходя из этого играться кодировками:
например print doc.encode('windows-1251'), utf-8 или какие там еще кодировки понимают русские символы.
P/S/ Ваш код у меня даже очень прекрасно работает.
Офлайн