Уведомления

Группа в Telegram: @pythonsu

#1 Сен. 24, 2007 20:34:30

well
От:
Зарегистрирован: 2006-11-20
Сообщения: 163
Репутация: +  0  -
Профиль   Отправить e-mail  

ПЕрекодировка.

Всем привет, возникла у меня следующая проблема, даже не знаю из-за чего. Есть bases.txt в кодировке cp1251, в нем строки вида:

Днепр:\\fileserver\СФ Днепр
Есть такой код:
#! -*- coding: cp1251 -*-

import os

class Parser ():
def __init__ (self, linePars):
self.arrPars = linePars.split (“:”)

def nameF (self):
return self.arrPars

def pathF (self):
return self.arrPars

conf = open (“bases.txt”, “r”)
for line in conf:
pars = Parser (line)
folders = os.listdir (pars.pathF ())
получаю такую ошибку:
WindowsError: Синтаксическая ошибка в имени файла,: ‘\\\\fileserver\\\xd1\xd4 \xc4\xed\xe5\xef\xf0 1\n/*.*’
Не знаете чего это оно так имя воспринимает?
Делаю так:folders = os.listdir (“\\fileserver\СФ Днепр”) и все работает :(



Отредактировано (Сен. 24, 2007 20:37:33)

Офлайн

#2 Сен. 24, 2007 21:28:27

well
От:
Зарегистрирован: 2006-11-20
Сообщения: 163
Репутация: +  0  -
Профиль   Отправить e-mail  

ПЕрекодировка.

Заработало :). Эх, не понял я сразу, чего оно от меня хочет!!!! Думал, что в кодировке дело. Спасибо!



Офлайн

#3 Июнь 10, 2010 20:42:21

ypeskov
От:
Зарегистрирован: 2009-07-25
Сообщения: 35
Репутация: +  0  -
Профиль   Отправить e-mail  

ПЕрекодировка.

что бы не плодить тем, а все было в одной. в чем может быть подвох
имеется следующий код:

#!/usr/bin/python
# -*- coding: utf-8 -*-

import urllib2
import sgmllib
import chardet

def reader(url):
source = urllib2.urlopen(url)
content = source.read()
encoding = source.headers["content-type"].split("charset=")[-1]
uni_content = unicode(content, encoding)


def main():
url = "http://www.missfit.ru/diet/table-calory/"
#url = urllib2.urlopen("http://ya.ru")
reader(url)

if __name__ == "__main__":
main()
в ответ я получаю
Traceback (most recent call last):
File “./parser.py”, line 21, in <module>
main()
File “./parser.py”, line 18, in main
reader(url)
File “./parser.py”, line 12, in reader
uni_content = unicode(content, encoding)
File “/usr/lib/python2.6/encodings/cp1251.py”, line 15, in decode
return codecs.charmap_decode(input,errors,decoding_table)
UnicodeDecodeError: ‘charmap’ codec can't decode byte 0x98 in position 969: character maps to <undefined>

подскажите плиз как привести полученный контент страницы в удобочитаемый вид ?



Офлайн

#4 Июнь 11, 2010 12:03:49

Александр Кошелев
От: Москва
Зарегистрирован: 2007-02-03
Сообщения: 1724
Репутация: +  2  -
Профиль   Отправить e-mail  

ПЕрекодировка.

ypeskov
что бы не плодить тем, а все было в одной.
Один вопрос – одна тема! Помойку из темы делать не надо!



Офлайн

#5 Июнь 11, 2010 17:00:50

ypeskov
От:
Зарегистрирован: 2009-07-25
Сообщения: 35
Репутация: +  0  -
Профиль   Отправить e-mail  

ПЕрекодировка.

ну перенесите тогда, хотелось как лучше.



Офлайн

Board footer

Модераторировать

Powered by DjangoBB

Lo-Fi Version