【转载】在Java中使用xpath对xml解析

转载

JavaPub 2022-04-02 11:35:19 博主文章分类：爬虫

文章标签 xpath 子节点 java xml 文章分类 代码人生

想绕过xpath，其实很简单，看下面

下面是一个小demo入门很详细（下面解析的是我用jsoup抓取的html页面）

//首先在dom4j中如何使用xpath技术导入xPath支持的jar包。jaxen-1.1-beta-6.jar

//(首先要先导dom4j包，dom4j下载地址：http://www.dom4j.org/dom4j-1.6.1/)。

运行截图：

【转载】在Java中使用xpath对xml解析_xml

源码：

package xpath;

import java.io.File;
import java.util.Iterator;
import java.util.List;

import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.Element;
import org.dom4j.Node;
import org.dom4j.io.SAXReader;

/**
 * 读取下xml文档,获得document对象。 本文为xml连载第一篇，以下代码可以直接运行，结尾附上源码下载地址。
 */
class exmple {
  public static void main(String[] args) throws DocumentException {
    SAXReader reader = new SAXReader();
    Document document = reader.read(new File("./hh6.xml"));

    /**
     * 节点对象的操作方法
     */

    // 获取文档根节点
    Element root = document.getRootElement();
    // 输出根标签的名字
    System.out.println(root.getName());

    // 获取根节点下面的所有子节点（不包过子节点的子节点）
    List<Element> list = root.elements();
    // 遍历List的方法
    for (Element e : list) {
      System.out.println(e.getName());
    }

    // 获得指定节点下面的子节点
    Element contactElem = root.element("head");// 首先要知道自己要操作的节点。
    List<Element> contactList = contactElem.elements();
    for (Element e : contactList) {
      System.out.println("999" + e.getName());
    }

    // 调用下面获取子节点的递归函数。
    getChildNodes(root);
    System.out.println("子节点输出完毕");
    // 获得当前标签下指定名称的第一个子标签
    Element conElem = root.element("head");
    System.out.println(conElem.getName());

    // 获得更深层次的标签（一层一层的获取）
    Element nameElem = root.element("head").element("style");
    System.out.println(nameElem.getName());
  }

  // 递归查询节点函数,输出节点名称
  private static void getChildNodes(Element elem) {
    System.out.println(elem.getName()+elem.getPath());//重点：：：并输出dom路径！！！
    Iterator<Node> it = elem.nodeIterator();
    while (it.hasNext()) {
      Node node = it.next();
      if (node instanceof Element) {
        Element e1 = (Element) node;
        getChildNodes(e1);
      }

    }
  }

}