在Python中使用poplib模組收取郵件的教程

來源:互聯網
上載者:User
SMTP用於發送郵件,如果要收取郵件呢?

收取郵件就是編寫一個MUA作為用戶端,從MDA把郵件擷取到使用者的電腦或者手機上。收取郵件最常用的協議是POP協議,目前版本號碼是3,俗稱POP3。

Python內建一個poplib模組,實現了POP3協議,可以直接用來收郵件。

注意到POP3協議收取的不是一個已經可以閱讀的郵件本身,而是郵件的原始文本,這和SMTP協議很像,SMTP發送的也是經過編碼後的一大段文本。

要把POP3收取的文本變成可以閱讀的郵件,還需要用email模組提供的各種類來解析原始文本,變成可閱讀的郵件對象。

所以,收取郵件分兩步:

第一步:用poplib把郵件的原始文本下載到本地;

第二部:用email解析原始文本,還原為郵件對象。
通過POP3下載郵件

POP3協議本身很簡單,以下面的代碼為例,我們來擷取最新的一封郵件內容:

import poplib# 輸入郵件地址, 口令和POP3伺服器位址:email = raw_input('Email: ')password = raw_input('Password: ')pop3_server = raw_input('POP3 server: ')# 串連到POP3伺服器:server = poplib.POP3(pop3_server)# 可以開啟或關閉調試資訊:# server.set_debuglevel(1)# 可選:列印POP3伺服器的歡迎文字:print(server.getwelcome())# 身份認證:server.user(email)server.pass_(password)# stat()返回郵件數量和佔用空間:print('Messages: %s. Size: %s' % server.stat())# list()返回所有郵件的編號:resp, mails, octets = server.list()# 可以查看返回的列表類似['1 82923', '2 2184', ...]print(mails)# 擷取最新一封郵件, 注意索引號從1開始:index = len(mails)resp, lines, octets = server.retr(index)# lines儲存了郵件的原始文本的每一行,# 可以獲得整個郵件的原始文本:msg_content = '\r\n'.join(lines)# 稍後解析出郵件:msg = Parser().parsestr(msg_content)# 可以根據郵件索引號直接從伺服器刪除郵件:# server.dele(index)# 關閉串連:server.quit()

用POP3擷取郵件其實很簡單,要擷取所有郵件,只需要迴圈使用retr()把每一封郵件內容拿到即可。真正麻煩的是把郵件的原始內容解析為可以閱讀的郵件對象。
解析郵件

解析郵件的過程和上一節構造郵件正好相反,因此,先匯入必要的模組:

import emailfrom email.parser import Parserfrom email.header import decode_headerfrom email.utils import parseaddr

只需要一行代碼就可以把郵件內容解析為Message對象:

msg = Parser().parsestr(msg_content)

但是這個Message對象本身可能是一個MIMEMultipart對象,即包含嵌套的其他MIMEBase對象,嵌套可能還不止一層。

所以我們要遞迴地列印出Message對象的階層:

# indent用於縮排顯示:def print_info(msg, indent=0):  if indent == 0:    # 郵件的From, To, Subject存在於根對象上:    for header in ['From', 'To', 'Subject']:      value = msg.get(header, '')      if value:        if header=='Subject':          # 需要解碼Subject字串:          value = decode_str(value)        else:          # 需要解碼Email地址:          hdr, addr = parseaddr(value)          name = decode_str(hdr)          value = u'%s <%s>' % (name, addr)      print('%s%s: %s' % (' ' * indent, header, value))  if (msg.is_multipart()):    # 如果郵件對象是一個MIMEMultipart,    # get_payload()返回list,包含所有的子物件:    parts = msg.get_payload()    for n, part in enumerate(parts):      print('%spart %s' % (' ' * indent, n))      print('%s--------------------' % (' ' * indent))      # 遞迴列印每一個子物件:      print_info(part, indent + 1)  else:    # 郵件對象不是一個MIMEMultipart,    # 就根據content_type判斷:    content_type = msg.get_content_type()    if content_type=='text/plain' or content_type=='text/html':      # 純文字或HTML內容:      content = msg.get_payload(decode=True)      # 要檢測文本編碼:      charset = guess_charset(msg)      if charset:        content = content.decode(charset)      print('%sText: %s' % (' ' * indent, content + '...'))    else:      # 不是文本,作為附件處理:      print('%sAttachment: %s' % (' ' * indent, content_type))

郵件的Subject或者Email中包含的名字都是經過編碼後的str,要正常顯示,就必須decode:

def decode_str(s):  value, charset = decode_header(s)[0]  if charset:    value = value.decode(charset)  return value

decode_header()返回一個list,因為像Cc、Bcc這樣的欄位可能包含多個郵件地址,所以解析出來的會有多個元素。上面的代碼我們偷了個懶,只取了第一個元素。

文本郵件的內容也是str,還需要檢測編碼,否則,非UTF-8編碼的郵件都無法正常顯示:

def guess_charset(msg):  # 先從msg對象擷取編碼:  charset = msg.get_charset()  if charset is None:    # 如果擷取不到,再從Content-Type欄位擷取:    content_type = msg.get('Content-Type', '').lower()    pos = content_type.find('charset=')    if pos >= 0:      charset = content_type[pos + 8:].strip()  return charset

把上面的代碼整理好,我們就可以來試試收取一封郵件。先往自己的郵箱發一封郵件,然後用瀏覽器登入郵箱,看看郵件收到沒,如果收到了,我們就來用Python程式把它收到本地:

運行程式,結果如下:

+OK Welcome to coremail Mail Pop3 Server (163coms[...])Messages: 126. Size: 27228317From: Test To: Python愛好者 Subject: 用POP3收取郵件part 0-------------------- part 0 --------------------  Text: Python可以使用POP3收取郵件……... part 1 --------------------  Text: Python可以使用POP3收取郵件……...part 1-------------------- Attachment: application/octet-stream

我們從列印的結構可以看出,這封郵件是一個MIMEMultipart,它包含兩部分:第一部分又是一個MIMEMultipart,第二部分是一個附件。而內嵌的MIMEMultipart是一個alternative類型,它包含一個純文字格式的MIMEText和一個HTML格式的MIMEText。
小結

用Python的poplib模組收取郵件分兩步:第一步是用POP3協議把郵件擷取到本地,第二步是用email模組把原始郵件解析為Message對象,然後,用適當的形式把郵件內容展示給使用者即可。

  • 聯繫我們

    該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

    如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

    A Free Trial That Lets You Build Big!

    Start building with 50+ products and up to 12 months usage for Elastic Compute Service

    • Sales Support

      1 on 1 presale consultation

    • After-Sales Support

      24/7 Technical Support 6 Free Tickets per Quarter Faster Response

    • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.