Форум сайта python.su
Хотел бы распарсить файл который создает thunderbird при приеме сообщений, т.е. выцепить оттуда непосредственно тело сообщения.
Но пока не могу сообразить как. Вот фаргмент файла:
–SBD.Boundary.605592468
Content-Type: application/x-zip-compressed; name=“SBMmessage.sbd”
Content-Disposition: attachment; filename=“300224010715200_001453.sbd”
Content-Transfer-Encoding: base64
MjAwOS0xIC0xNCAyIDo1OAlMRU5HCS0zLjIgIAk5OSAgCTk0Ny40ICAJOTQ3LjYgIAk5ODMuMCAg
CTEuNCAgICAJMyAgICAgCTkuNCAgIAkxNDEgIAkxMy41NTIJDQoNCg==
–SBD.Boundary.605592468–
Офлайн
Ну и от нас вы чего ждёте?
Офлайн
FerromanПодсказки как выделить этот кусок)
Ну и от нас вы чего ждёте?
Офлайн
lorienформально файл не имеет расширения и является текстовым.
Ну файл наверное имеет какой-то формат и возможно парсер этого формата есть в стандартной python библиотеке. Нужно определиться, чтто за формат у файла.
Офлайн
Вообще есть email (http://docs.python.org/library/email) для парсинга email-сообщений.
Офлайн
Парсеры-мой конёк.
Пожалуйста:
f = open('filepath')
data = f.readlines().split('\n')
text = data[5]+data[6]
Офлайн
UsCrСпасибо, но выдает такую ошибку:
Парсеры-мой конёк.
Пожалуйста:В переменной text ваше содержимое. С праздничком.f = open('filepath')
data = f.readlines().split('\n')
text = data[5]+data[6]
AttributeError: 'list' object has no attribute 'split'
Офлайн
w0idЕсть, но он тут не отрабатывает.
Вообще есть email (http://docs.python.org/library/email) для парсинга email-сообщений.
payload = m.get_payload(decode=True)
Офлайн
XdenisXА, ну да. Split не нужен.
Спасибо, но выдает такую ошибку:
Офлайн
>>> print 'MjAwOS0xIC0xNCAyIDo1OAlMRU5HCS0zLjIgIAk5OSAgCTk0Ny40ICAJOTQ3LjYgIAk5ODMuMCAgCTEuNCAgICAJMyAgICAgCTkuNCAgIAkxNDEgIAkxMy41NTIJDQoNCg=='.decode('base64')
2009-1 -14 2 :58 LENG -3.2 99 947.4 947.6 983.0 1.4 3 9.4 141 13.552
Отредактировано (Апрель 1, 2010 16:16:37)
Офлайн