Найти - Пользователи
Полная версия: Парсинг "To" и "From"
Начало » Python для новичков » Парсинг "To" и "From"
1 2
fuckinghikky
Есть такой быдлокод:
...
m = imaplib.IMAP4_SSL("imap.gmail.com")
m.login(username, password)
m.select("[Gmail]/Spam")
resp, items = m.search("UTF-8", "ALL")
items = items[0].split()
for emailid in items:
	resp, data = m.fetch(emailid, "(RFC822)")
	email_body = data[0][1]
	mail = email.message_from_string(email_body)
	print mail['To']
        print mail['From']
...
Как правильно спарсить адреса(!нужны только email-ы!) из from && to всех писем на ящике?
fata1ex
import re

1
2
fuckinghikky
fata1ex
а без re никак нельзя ? какими-нибудь надстройками типа email.utils ?
fata1ex
Если честно, я не помню. Наверняка есть. Посмотрите документацию, может в email.parser есть вариант. Или email.utils.parseaddr.
asilyator
А вообще можно только заголовки запрашивать.

imaplib со своими кортежами с кодами возврата и прочие сетевые библиотеки питона - УГ. Я юзал imapclient.
fuckinghikky
asilyator
А вообще можно только заголовки запрашивать.

imaplib со своими кортежами с кодами возврата и прочие сетевые библиотеки питона - УГ. Я юзал imapclient.

а если pop3 используется ?
только заголовки тащить можно через email или imap/poplib ?
asilyator
email - для оффлайнового парсинга мыл.

Только хедеры.
imap=imaplib.IMAP4_SSL(“imap.googlemail.com”)
#…
imap.fetch(“*”, "(BODY)")
В pop3 протоколе такая фича, по-моему, вообще отсутствует.
PooH
asilyator
В pop3 протоколе такая фича, по-моему, вообще отсутствует.
LIST, потом ТОР

TOP
Сервер возвращает заголовки указанного сообщения, пустую строку и указанное количество первых строк тела сообщения.


asilyator
IMAP все равно круче, там и поиск есть. Только родная библиотека - УГ.
PooH
asilyator
IMAP все равно круче, там и поиск есть.
Я с этим и не спорю. Но не везде он есть.

asilyator
Только родная библиотека - УГ.
Вот без обид, мне вспоминается анекдот про вредную слепую девочку и тазик пельменей ;)

This is a "lo-fi" version of our main content. To view the full version with more information, formatting and images, please click here.
Powered by DjangoBB