python 读取xml 输出Excel python如何读取xml文件

转载

互联网小墨风 2023-11-10 10:45:12

XML全称是eXtensible Markup Language(扩展标记语言)。XML文档类似一棵树。读取内容时，首先访问根节点（通常来说，这个节点后面会跟着XML的声明，<?xml version="1.0" encoding="UTF-8"?>;每个文档都要有这样的声明）。文件如下：

python 读取xml 输出Excel python如何读取xml文件_xml

文件首在这个例子中，根节点是。一个...包含了一系列的...。

python 读取xml 输出Excel python如何读取xml文件_数据_02

文件尾

python 读取xml 输出Excel python如何读取xml文件_数据_03

要使用pandas和xml模块。xml.etree.ElementTree模块是一个轻量级XML解析器，用来解析文件的XML结构。然后要定义一些函数如下，后面会详细介绍。

python 读取xml 输出Excel python如何读取xml文件_数据_04

python 读取xml 输出Excel python如何读取xml文件_xml_05

使用函数进行操作，xml_read是DataFrame对象，输出前10行，再将数据读入文件中。

函数介绍：

read_xml()：读取XML数据，返回pd.DataFrame

python 读取xml 输出Excel python如何读取xml文件_XML_06

首先，打开文件，使用.parse()方法，由xml文件创建了一个树状结构并存入tree对象中。接着，在tree对象上用.getroot()方法提取根节点：这是进一步处理数据的前提。最后一行调用iter_records方法（后面定义），传入根节点的引用，进而将返回的信息转换成DataFrame。

iter_records（）:遍历所有记录的生成器。

python 读取xml 输出Excel python如何读取xml文件_数据_07

iter_records方法是生成器，这个方法生成一些值。普通方法结束时一次性返回所有的值；但生成器不同，每次只向主调用方法返回一个值，直到结束。每读一行，iter_records方法就返回一个temp_dict字典对象给read_xml方法。的值可以通过xml节点的.text属性访问。

read_xml方法的return语句从传入的所有字典中创建一个列表，列表中元素为字典，每个字典是一条数据，将列表转换成DataFrame。

python 读取xml 输出Excel python如何读取xml文件_xml_08

write_xml（）：以XML格式写入数据。

打开指定的文件，写xml声明开头，接着写xml的根节点。接下来，写数据。使用DataFrame对象的.apply()方法遍历内部每一行，第一个参数中指定的xml_encode()方法应用到DataFrame每一行上。xml_encode()处理DataFrame的每一行，如下：

python 读取xml 输出Excel python如何读取xml文件_XML_09

代码生成了一个字符串列表xmlItem。列表首元素是，,尾元素是。中间加入数据。解析完所有字段后，使用‘\n’.join()方法，将xmlItem列表中所有项连接成一个长字符串。把字符串返回。

前10行数据如下，

python 读取xml 输出Excel python如何读取xml文件_xml_10

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯

51CTO博客