1. 程式人生 > >python3接收、解析郵件

python3接收、解析郵件

郵件接收

python3可以使用poplib.POP3進行郵件接收,具體如下:

import poplib
from email.parser import Parser

def get_email(email,password,host="mail.djicorp.com"):
    # connect to pop3 server
    server = poplib.POP3(host)
    # open debug
    server.set_debuglevel(1)

    # 身份驗證
    server.user(email)
    server.pass_(password)
    
    # 返回郵件總數目和佔用伺服器的空間大小(位元組數), 通過stat()方法即可
    # print("Mail counts: {0}, Storage Size: {0}".format(server.stat()))

    # 使用list()返回所有郵件的編號,預設為位元組型別的串
    resp, mails, octets = server.list()
    # print("響應資訊: ", resp)
    # print("所有郵件簡要資訊: ", mails)
    # print("list方法返回資料大小(位元組): ", octets)

    # get the latest, index from 1:
    index = len(mails)
    if index < 1:
        return None
    resp, lines, octets = server.retr(index)

    # 可以獲得整個郵件的原始文字:
    msg_content = b'\r\n'.join(lines).decode('utf-8')
    # 解析出郵件:
    msg = Parser().parsestr(msg_content)
    # print(msg)
    # print("解碼後的郵件資訊:\r\n"+str(msg))

    #close
    server.close()
    return msg

def delete_email(email,password,host="mail.djicorp.com"):
    # connect to pop3 server
    server = poplib.POP3(host)
    # open debug
    # server.set_debuglevel(1)

    # 身份驗證
    server.user(email)
    server.pass_(password)

    # 使用list()返回所有郵件的編號,預設為位元組型別的串
    # list()返回tuple
    resp, mails, octets = server.list()
    # print("響應資訊: ", resp)
    # print("所有郵件簡要資訊: ", mails)
    # print("list方法返回資料大小(位元組): ", octets)

    # get the latest, index from 1:
    index = len(mails)

    # 刪除所有郵件
    while index > 0:
        server.dele(index)
        print(index)
        index = index -1 
    
    # commit command and close
    server.quit()

郵件解析


# 解析郵件正文
def get_mail_content(msg):
    if msg == None:
        return None
    for part in msg.walk():
        if not part.is_multipart():
            data = part.get_payload(decode=True)
            # print("emailcontent:\r\n"+data.decode())
    return data.decode()

poplib關鍵函式解析

  • POP3.dele(which)

    標記訊息號 which 以進行刪除。在大多數伺服器上,刪除直到QUIT才被實際執行(主要例外是Eudora QPOP,它通過在任何斷開連線上進行未決刪除而故意違反RFC)。

  • POP3.quit()

    登出:提交更改,解鎖郵箱,刪除連線。

email.message關鍵函式解析

  • walk()

    walk() 方法是一種通用的生成器,可用於以深度優先遍歷順序遍歷訊息物件樹的所有部分和子部分。您通常會在 for 迴圈中使用 walk() 作為迭代器;每次迭代返回下一個子部分。

  • is_multipart()

    is_multipart()
    如果訊息的有效內容是一個子EmailMessage 物件的列表,則返回 True,否則返回 False。當 is_multipart() 返回 False 時,有效負載應為字串物件(可能是CTE編碼的二進位制有效負載)。注意,is_multipart() 返回 True 並不一定意味著“msg.get_content_maintype() == ‘multipart’”將返回 True。例如,當 EmailMessage 型別為 message/rfc822 時,is_multipart 將返回 True。

  • get_content_type()

get_content_type()返回訊息的內容型別,強制為表格 maintype/subtype 的小寫。如果訊息中沒有 Content-Type 頭,則返回 get_default_type() 返回的值。如果 Content-Type 頭無效,則返回 text/plain。
(根據 RFC 2045,訊息總是有一個預設型別,get_content_type() 將總是返回一個值。RFC 2045 定義一個訊息的預設型別為 text/plain,除非它出現在一個 multipart/digest 容器中,在這種情況下,它將是 message/rfc822 如果 Content-Type 頭有一個無效的型別規範,RFC 2045 強制預設型別為 text/plain。)

email.message API文件