共计 4289 个字符,预计需要花费 11 分钟才能阅读完成。
“””
function: IMAP 收取邮件
detail: 反对最初一封邮件的文本打印以及所有附件的下载
author: w.royee
date: 2021-08-21
“””
import email
import email.header
import imaplib
from bs4 import BeautifulSoup
class IMAP:
def __init__(self):
# self.user_id = 'XXXX@qq.com' # QQ 邮箱地址
# self.password = 'password' # 邮箱明码(当初根本都是第三方客户端受权码)
# self.imap_server = 'imap.qq.com'
self.user_id = 'XXXX@163.com' # 163 邮箱地址
self.password = 'password'
self.imap_server = 'imap.163.com'
def login(self):
"""
登录邮件服务器
:param
:return: imap 连贯
"""
try:
serv = imaplib.IMAP4_SSL(self.imap_server, 993) # SSL 加密
print('imap4 服务器连贯胜利')
except Exception as e:
print('imap4 服务器连贯失败:', e)
exit(1)
try:
serv.login(self.user_id, self.password)
print('imap4 登录胜利')
return serv
except Exception as e:
print('imap4 登录失败:', e)
exit(1)
def loginout(self, conn):
"""
登出邮件服务器
:param conn: imap 连贯
:return:
"""
conn.close
conn.logout()
def get_content(self, conn):
"""
获取指定邮件,解析内容
:param conn: imap 连贯
:return:
"""# 在连贯服务器后,搜寻之前,须要抉择邮箱,默认 select(mailbox='INBOX', readonly=False)
conn.select()
# 筛选符合条件的邮件,这里不晓得怎么过滤简单条件,只能过滤未读邮件或全副
# ret, data = conn.search(None, 'UNSEEN') # 未读邮件
# ret, data = conn.search(None, '(FROM"qq814701082@163.com")')
ret, data = conn.search(None, 'ALL') # 所有邮件
# 邮件列表
email_list = data[0].split()
if len(email_list) == 0:
print('收件箱为空,已退出')
exit(1)
# 获取最初一封邮件的序号
item = email_list[len(email_list) - 1]
# 获取最初一封邮件内容
ret, data = conn.fetch(item, '(RFC822)')
msg = email.message_from_string(data[0][1].decode('gbk'))
sub = msg.get('subject')
email_from = msg.get('from')
email_to = msg.get('to')
sub_text = email.header.decode_header(sub)
email_from_text = email.header.decode_header(email_from)
email_to_text = email.header.decode_header(email_to)
# 如果是特殊字符,元组的第二位会给出编码格局,须要转码
if sub_text[0]:
sub_detail = self.tuple_to_str(sub_text[0])
email_from_detail = ''
for i in range(len(email_from_text)):
email_from_detail = email_from_detail + self.tuple_to_str(email_from_text[i])
email_to_detail = ''
for i in range(len(email_to_text)):
email_to_detail = email_to_detail + self.tuple_to_str(email_to_text[i])
print('主题:', sub_detail)
print('发件人:', email_from_detail)
print('收件人:', email_to_detail)
# 通过 walk 能够遍历出所有的内容
for part in msg.walk():
# 这里要判断是否是 multipart,如果是,数据没用抛弃
if not part.is_multipart():
# 字符集
# charset = part.get_charset()
# print('charset:', charset)
# 内容类型
content_type = part.get_content_type()
# print('content-type', content_type)
# 如果是附件,这里就会取出附件的文件名,以下两种形式都能够获取
# name = part.get_param("name")
name = part.get_filename()
if name:
# 附件
# 中文名获取到的是 =?GBK?Q?=D6=D0=CE=C4=C3=FB.docx?=(中文名.docx)格局,须要将其解码为 bytes 格局
trans_name = email.header.decode_header(name)
if trans_name[0][1]:
# 将 bytes 格局转为可读格局
file_name = trans_name[0][0].decode(trans_name[0][1])
else:
file_name = trans_name[0][0]
print('开始下载附件:', file_name)
attach_data = part.get_payload(decode=True) # 解码出附件数据,而后存储到文件中
try:
f = open(file_name, 'wb') # 留神肯定要用 wb 来关上文件,因为附件个别都是二进制文件
except Exception as e:
print(e)
f = open('tmp', 'wb')
f.write(attach_data)
f.close()
print('附件下载胜利:', file_name)
else:
# 文本内容
txt = part.get_payload(decode=True) # 解码文本内容
# 别离解释 text/html 和 text/plain 两种类型,纯文本解释起来较简略,两种类型内容统一
if content_type == 'text/html':
print('以下是邮件注释(text/html):')
# 这里笔者不同邮件服务器遇到了不同状况,只解释了 QQ 邮箱,163 的能够批改代码:# QQ 邮箱
# 1、有两层 <div> 标签,格局为 <html><body><div><div> 文本 1 </div><div> 文本 2 </div></div></body></html>
# 2、只有一层 <div> 标签,格局为 <html><body><div><p> 文本 1 </p><p> 文本 2 </p></div></body></html>
# 163 邮箱
# 只有一层 <div> 标签,格局为 <html><head><meta/></head><body><div> 文本 1 </div><div> 文本 2 </div></body></html>
soup = BeautifulSoup(str(txt, 'gbk'), 'lxml')
div_data = soup.find_all('div')
if len(div_data) > 1:
for each in div_data[1:]:
print(each.text)
else:
for each in soup.find_all('p'):
print(each.text)
elif content_type == 'text/plain':
print('以下是邮件注释(text/plain):')
# 纯文本格式为 bytes,不同邮件服务器较对立
print(str(txt, 'gbk'))
def front(self, conn):
"""
应用 163 邮箱,[Skrill 下载](https://www.gendan5.com/wallet/Skrill.html)必须在 select 之前上传客户端身份信息, 否则报错:command SEARCH illegal in state AUTH, only allowed in states SELECTED
:param conn: imap 连贯
:return:
"""imaplib.Commands['ID'] ='AUTH'
# 如果应用 163 邮箱,须要上传客户端身份信息
args = ("name", "XXXX", "contact", "XXXX@163.com", "version", "1.0.0", "vendor", "myclient")
typ, dat = conn._simple_command('ID', '("' + '""'.join(args) + '")')
# print(conn._untagged_response(typ, dat, 'ID'))
def tuple_to_str(self, tuple_):
"""
元组转为字符串输入
:param tuple_: 转换前的元组,QQ 邮箱格局为 (b'\xcd\xf5\xd4\xc6', 'gbk') 或者(b'<XXXX@163.com>', None),163 邮箱格局为('<XXXX@163.com>', None)
:return: 转换后的字符串
"""
if tuple_[1]:
out_str = tuple_[0].decode(tuple_[1])
else:
if isinstance(tuple_[0], bytes):
out_str = tuple_[0].decode('gbk')
else:
out_str = tuple_[0]
return out_str
if name == ‘__main__’:
IMAP = IMAP()
conn = IMAP.login()
IMAP.front(conn)
IMAP.get_content(conn)
IMAP.loginout(conn)
正文完