Python 多层xml解析

原创

mob649e8158a948 2023-07-31 19:51:41 ©著作权

©著作权归作者所有：来自51CTO博客作者mob649e8158a948的原创作品，请联系作者获取转载授权，否则将追究法律责任

Python 多层XML解析

XML（可扩展标记语言）是一种用于存储和传输数据的标记语言，常被用于描述文档的结构和内容。在Python中，我们可以使用各种库来解析XML数据，从而提取出我们所需要的信息。本文将介绍如何使用Python解析多层XML数据，并且提供相应的代码示例。

安装依赖

在使用Python解析XML数据之前，我们需要安装相应的库。常用的XML解析库包括xml.etree.ElementTree和lxml。我们可以使用pip命令来安装它们：

pip install xml.etree.ElementTree

或者

pip install lxml

解析XML

首先，我们需要将XML数据加载到内存中，然后使用相应的库进行解析。以下是一个XML示例：

<root>
    <person>
        <name>John</name>
        <age>30</age>
    </person>
    <person>
        <name>Jane</name>
        <age>25</age>
    </person>
</root>

假设我们想要提取每个人的姓名和年龄。我们可以使用xml.etree.ElementTree库来解析XML数据，并提取所需的信息：

import xml.etree.ElementTree as ET

# 加载XML数据
xml_data = '''
<root>
    <person>
        <name>John</name>
        <age>30</age>
    </person>
    <person>
        <name>Jane</name>
        <age>25</age>
    </person>
</root>
'''

# 解析XML数据
root = ET.fromstring(xml_data)

# 提取信息
for person in root.findall('person'):
    name = person.find('name').text
    age = person.find('age').text
    print(f'Name: {name}, Age: {age}')

代码解析：

首先，我们导入xml.etree.ElementTree库。
然后，我们将XML数据保存在一个字符串变量中。
接下来，我们使用ET.fromstring()函数将字符串解析为XML对象，并将其赋给root变量。
最后，我们使用root.findall()函数找到所有person元素，并使用person.find()函数找到每个person元素下的name和age元素。我们可以使用.text属性获取元素的文本内容。

运行上述代码，我们将获得如下输出：

Name: John, Age: 30
Name: Jane, Age: 25

解析多层XML

有时候，XML数据可能存在多个层级。在这种情况下，我们需要使用递归的方式来解析XML数据。以下是一个多层XML示例：

<root>
    <person>
        <name>John</name>
        <age>30</age>
        <address>
            <city>New York</city>
            <state>NY</state>
        </address>
    </person>
    <person>
        <name>Jane</name>
        <age>25</age>
        <address>
            <city>Los Angeles</city>
            <state>CA</state>
        </address>
    </person>
</root>

假设我们想要提取每个人的姓名、年龄和地址信息。我们可以使用递归的方式解析XML数据：

import xml.etree.ElementTree as ET

# 加载XML数据
xml_data = '''
<root>
    <person>
        <name>John</name>
        <age>30</age>
        <address>
            <city>New York</city>
            <state>NY</state>
        </address>
    </person>
    <person>
        <name>Jane</name>
        <age>25</age>
        <address>
            <city>Los Angeles</city>
            <state>CA</state>
        </address>
    </person>
</root>
'''

# 解析XML数据
root = ET.fromstring(xml_data)

# 提取信息
def parse_person(person):
    name = person.find('name').text
    age = person.find('age').text
    address = person.find('address')
    city = address.find('city').text
    state = address.find('state').text
    print(f'Name: {name}, Age: {age}, City: {city}, State: {state}')

for person in root.findall('person'):
    parse_person(person)

代码解析： 1.