Найти - Пользователи
Полная версия: перекодировка, снова
Начало » Python для новичков » перекодировка, снова
1
net_del
вобщем в терминале вот такие иероглифы.
D<�ȸ�D���c���?�__L6,�`?PD�E�`&��Z|��Q��R��,�����ܰ
conn = urllib2.Request(host, post, headers)
data = urllib2.urlopen(conn)
st=data.read()

исходная страница на сервере в cp1251, перепробовал различные варианты и сочетания encode, decode, не понимаю что и откуда мне нужно.
декодер лебедева сказал
7-bit ASCII → MacCyrillic + ISO-8859-5 → KOI8-R
но в читабельный вид так и не привел, получилось:
╘???ƒ???с???З?ООШґР?пЗ–ƒ?≈?п¶??╞?Л??—??“??Р??????

python 2.6.5, ubuntu, помогите.
Piton23
А твой скрипт в 3 строки в какой кодировке?, и главное в начале какой заголовок стоит насчет кодировки?
net_del
в начало пробовал добавлять:
# -*- coding: UTF-8 -*-
не помогает.
johniek_comp
Перекодируй страницу в UTF-8
Piton23
че показывает при
1.
st=data.read()
print st.decode('cp1251')
2.
st=data.read()
print st.decode('cp1251').encode('utf-8')
?

А лучше вставь весь скрипт, с заголовками, с вышеуказанными примерами. И файло перекодировал в utf8?
net_del
import urllib
import urllib2
import re
import sys
import math
import os
import time
mpass = ''
mail = ''
host = 'http://login.vk.com/?act=login'
post = urllib.urlencode({'email': mail, 'expire':'', 'pass': mpass, 'vk': ''})
headers = {'Host' : 'vk.com',
    'User-Agent' : 'Mozilla/5.0 (X11; U; Linux i686; ru; rv:1.9.2.23) Gecko/20110921 Ubuntu/10.04 (lucid) Firefox/3.6.23',
    'Accept' : 'text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8',
    'Accept-Language' : 'ru,en-us;q=0.7,en;q=0.3',
    'Accept-Encoding' : 'gzip,deflate',
    'Accept-Charset' : 'windows-1251,utf-8;q=0.7,*;q=0.7',
    'Keep-Alive' : '115',
    'Connection' : 'keep-alive',
    'Referer' : 'http://vk.com/index.php',
    'Cookie' : 'remixlang=0; remixchk=5; remixflash=11.2.202; remixdt=0',
    'Cache-Control' : 'max-age=0'}
conn = urllib2.Request(host, post, headers)
data = urllib2.urlopen(conn)
st=data.read()
print st[10:40]
#print st.decode('cp1251')[10:40]
#print st.decode('cp1251').encode('utf-8')[10:40]
asilyator
Выкинуть бы urllib
This is a "lo-fi" version of our main content. To view the full version with more information, formatting and images, please click here.
Powered by DjangoBB