Найти - Пользователи
Полная версия: Подвох с кодировкой
Начало » Python для новичков » Подвох с кодировкой
1
CryptSpirit
Пишу программку для опроса данных о герое через получение xml файла но загвоздка в том что я получаю не понятную кодировку. Долго пытал гугл но он ничего внятного не сказал. Прошу помощи. Код в студию:
# -*- coding: UTF-8 -*-
import re, urllib
username = "Аскард"
username=urllib.quote(username)
adr = "http://godville.net/gods/api/"+username+".xml"
def gett(tag,s):
reg = re.search(r"<"+tag+">.*</"+tag+">",s)
reg=reg.group()
reg=reg[len(tag)+2:len(reg)-len(tag)-3]
return reg
Tag_dict=("name","godname","gender","gold_approx","level","health","max_health","inventory_num","inventory_max_num","motto",\
"clan","quest_progress","exp_progress","godpower","alignment","quest","bricks_cnt","diary_last",\
"town_name","arena_fight")
def getd():
s = urllib.urlopen(adr).read()
for i in range(len(Tag_dict)):
print gett(Tag_dict[i],s)
getd()
на выходе веселые символы. Либо я не догоняю суть проблемы либо проблема не вовсе и проблема. Прошу у вас помощи так как за сегодняшнее утро от слова “кодировка” меня уже тошнит.
o7412369815963
это коды символов в html, штатной ф-ии сейчас не вспомню, вот те регекс
         print re.sub(r'&#(\d+);', lambda x:unichr(int(x.groups()[0])), gett(Tag_dict[i],s))
o7412369815963
а вообще можно какой-нибудь xml парсер заюзать
CryptSpirit
o7412369815963
а вообще можно какой-нибудь xml парсер заюзать
Считаю что это слишком жирно для этой задачи
This is a "lo-fi" version of our main content. To view the full version with more information, formatting and images, please click here.
Powered by DjangoBB