python 读取邮件乱码 python读取邮件正文

转载

mob6454cc72f29c 2023-06-12 20:20:04

文章标签 python 读取邮件乱码 python接收邮件内容启动程序 Word HTML html 文章分类 Python 后端开发

在多部分电子邮件中，email.message.Message.get_payload()返回一个列表，其中包含每个部分的一个项目。最简单的方法是步行消息并获取每个部分的有效载荷：

import email
msg = email.message_from_string(raw_message)
for part in msg.walk():
# each part is a either non-multipart, or another multipart message
# that contains further parts... Message is organized like a tree
if part.get_content_type() == 'text/plain':
print part.get_payload() # prints the raw text

对于非多部分消息，无需执行所有步骤。你可以直接去get_payload()，不管content_type如何。

msg = email.message_from_string(raw_message)
msg.get_payload()

如果内容被编码，则需要将None作为第一个参数传递给get_payload()，后跟True(解码标志是第二个参数)。例如，假设我的电子邮件包含MS Word文档附件：

msg = email.message_from_string(raw_message)
for part in msg.walk():
if part.get_content_type() == 'application/msword':
name = part.get_param('name') or 'MyDoc.doc'
f = open(name, 'wb')
f.write(part.get_payload(None, True)) # You need None as the first param
# because part.is_multipart()
# is False
f.close()

为了获得HTML部分的合理的纯文本近似值，我发现html2text的工作效果很好。

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。