Найти - Пользователи
Полная версия: Помогите разобраться с кодировкой
Начало » Python для новичков » Помогите разобраться с кодировкой
1
vladseo
Собственно перепробовал варианты, которые нашел в нете… не помогло

Ситуация такая, я получаю HTML страницу, например методом urllib.urlopen, латинские символы отображаются корректно, кирилица не читается (каракули), из под линукса кирилица заменена вопросиками.

Посоветуйте, как можно сделать вывод с кирилицей, если можно на этом примере

import urllib
doc = urllib.urlopen("http://ya.ru").read()
print doc
Спасибо
alexx11
vladseo
под линукса кирилица заменена вопросиками
Откуда ж там вопросики могут быть? У меня в консоле, например, этот же код такое выдаёт : “п║пЄп╣п╩п╟я┌я▄ я│я┌п╟я─я┌п╬п╡п╬п╧” и т.д.
regall
vladseo, поищите по форуму. Вопрос с кодировкой здесь освещен был уже несколько раз лучше нежели любой другой: http://python.su/forum/search.php?search_id=1213275499
dmnBrest
Вот очень интересная и понятная статья на тему кодировок!!!

http://www.py-my.ru/post/4bfb3c6a1d41c846bc00009b

Все проблемы с кодировками надо искать не в питоне, а в той среде, где вы работаете.
Во-первых надо учитывать кодировку исходного кода python (устанавливается в редакторе кода)
Во-вторых надо знать в какую кодировку понимает система (консоль) куда осуществляется вывод и исходя из этого играться кодировками:
например print doc.encode('windows-1251'), utf-8 или какие там еще кодировки понимают русские символы.

P/S/ Ваш код у меня даже очень прекрасно работает.
This is a "lo-fi" version of our main content. To view the full version with more information, formatting and images, please click here.
Powered by DjangoBB