Уведомления

Группа в Telegram: @pythonsu

#1 Март 31, 2010 16:07:14

XdenisX
От:
Зарегистрирован: 2009-10-31
Сообщения: 30
Репутация: +  0  -
Профиль   Отправить e-mail  

Парсинг

Хотел бы распарсить файл который создает thunderbird при приеме сообщений, т.е. выцепить оттуда непосредственно тело сообщения.
Но пока не могу сообразить как. Вот фаргмент файла:

–SBD.Boundary.605592468

Content-Type: application/x-zip-compressed; name=“SBMmessage.sbd”

Content-Disposition: attachment; filename=“300224010715200_001453.sbd”

Content-Transfer-Encoding: base64



MjAwOS0xIC0xNCAyIDo1OAlMRU5HCS0zLjIgIAk5OSAgCTk0Ny40ICAJOTQ3LjYgIAk5ODMuMCAg

CTEuNCAgICAJMyAgICAgCTkuNCAgIAkxNDEgIAkxMy41NTIJDQoNCg==

–SBD.Boundary.605592468–



Офлайн

#2 Март 31, 2010 17:16:24

Ferroman
От:
Зарегистрирован: 2006-11-16
Сообщения: 2759
Репутация: +  1  -
Профиль   Отправить e-mail  

Парсинг

Ну и от нас вы чего ждёте?

Офлайн

#3 Март 31, 2010 17:43:30

XdenisX
От:
Зарегистрирован: 2009-10-31
Сообщения: 30
Репутация: +  0  -
Профиль   Отправить e-mail  

Парсинг

Ferroman
Ну и от нас вы чего ждёте?
Подсказки как выделить этот кусок)

MjAwOS0xIC0xNCAyIDo1OAlMRU5HCS0zLjIgIAk5OSAgCTk0Ny40ICAJOTQ3LjYgIAk5ODMuMCAg

CTEuNCAgICAJMyAgICAgCTkuNCAgIAkxNDEgIAkxMy41NTIJDQoNCg



Офлайн

#4 Апрель 1, 2010 10:58:00

XdenisX
От:
Зарегистрирован: 2009-10-31
Сообщения: 30
Репутация: +  0  -
Профиль   Отправить e-mail  

Парсинг

lorien
Ну файл наверное имеет какой-то формат и возможно парсер этого формата есть в стандартной python библиотеке. Нужно определиться, чтто за формат у файла.
формально файл не имеет расширения и является текстовым.



Офлайн

#5 Апрель 1, 2010 11:07:50

w0id
От:
Зарегистрирован: 2010-03-29
Сообщения: 20
Репутация: +  0  -
Профиль   Отправить e-mail  

Парсинг

Вообще есть email (http://docs.python.org/library/email) для парсинга email-сообщений.



Офлайн

#6 Апрель 1, 2010 12:30:49

UsCr
От:
Зарегистрирован: 2009-11-04
Сообщения: 216
Репутация: +  0  -
Профиль   Отправить e-mail  

Парсинг

Парсеры-мой конёк.
Пожалуйста:

f = open('filepath')
data = f.readlines().split('\n')
text = data[5]+data[6]
В переменной text ваше содержимое. С праздничком.



Офлайн

#7 Апрель 1, 2010 13:42:44

XdenisX
От:
Зарегистрирован: 2009-10-31
Сообщения: 30
Репутация: +  0  -
Профиль   Отправить e-mail  

Парсинг

UsCr
Парсеры-мой конёк.
Пожалуйста:
f = open('filepath')
data = f.readlines().split('\n')
text = data[5]+data[6]
В переменной text ваше содержимое. С праздничком.
Спасибо, но выдает такую ошибку:

AttributeError: 'list' object has no attribute 'split'



Офлайн

#8 Апрель 1, 2010 13:45:55

XdenisX
От:
Зарегистрирован: 2009-10-31
Сообщения: 30
Репутация: +  0  -
Профиль   Отправить e-mail  

Парсинг

w0id
Вообще есть email (http://docs.python.org/library/email) для парсинга email-сообщений.
Есть, но он тут не отрабатывает.
содержимое

payload = m.get_payload(decode=True)
выдает None



Офлайн

#9 Апрель 1, 2010 14:38:37

UsCr
От:
Зарегистрирован: 2009-11-04
Сообщения: 216
Репутация: +  0  -
Профиль   Отправить e-mail  

Парсинг

XdenisX
Спасибо, но выдает такую ошибку:
А, ну да. Split не нужен.



Офлайн

#10 Апрель 1, 2010 16:16:17

o7412369815963
От:
Зарегистрирован: 2009-06-17
Сообщения: 1986
Репутация: +  32  -
Профиль   Отправить e-mail  

Парсинг

>>> print 'MjAwOS0xIC0xNCAyIDo1OAlMRU5HCS0zLjIgIAk5OSAgCTk0Ny40ICAJOTQ3LjYgIAk5ODMuMCAgCTEuNCAgICAJMyAgICAgCTkuNCAgIAkxNDEgIAkxMy41NTIJDQoNCg=='.decode('base64')
2009-1 -14 2 :58 LENG -3.2 99 947.4 947.6 983.0 1.4 3 9.4 141 13.552

Отредактировано (Апрель 1, 2010 16:16:37)

Офлайн

Board footer

Модераторировать

Powered by DjangoBB

Lo-Fi Version