栏目分类:
子分类:
返回
终身学习网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
终身学习网 > IT > 前沿技术 > 人工智能 > NLP

XPath技术

NLP 更新时间:发布时间: 百科书网 趣学号

XPath技术

基本概述


XPath即为XML路径语言,它是一种用来确定XML(标准通用标记语言的子集)文档中某部分位置的语言。XPath基于XML的树状结构,提供在数据结构树中找寻节点的能力。起初 XPath 的提出的初衷是将其作为一个通用的、介于XPointer与XSLT间的语法模型。但是 XPath 很快的被开发者采用来当作小型查询语言。

PS:其配合DOM4J解析技术,弥补了DOM4J不能跨层取元素的缺点。需要引入jaxen-1.1-beta-6.jar包。

XPath原理

XPath就好比SQL查询语句,能够对DOM树进行查询操作,并获取相应结果。

XPath案例

XML9.xml

Hello World B1Hello World B2Hello World B3Hello World B4


package com.pc;import java.io.File;import java.io.FileNotFoundException;import java.io.FileOutputStream;import java.io.FileWriter;import java.io.IOException;import java.io.UnsupportedEncodingException;import java.util.Iterator;import java.util.List;import org.dom4j.Attribute;import org.dom4j.document;import org.dom4j.documentException;import org.dom4j.documentHelper;import org.dom4j.Element;import org.dom4j.io.OutputFormat;import org.dom4j.io.SAXReader;import org.dom4j.io.XMLWriter;public class XML9 {public static void main(String[] args) throws Exception {// 1.得到SAXReader解析器SAXReader saxReader = new SAXReader();// 2.指定解析哪个文件document document = saxReader.read("src/com/pc/XML9.xml");// 3.使用XPath随意读取任何一层的元素// document.selectNodes(); //返回多个元素// document.selectSingleNode(); // 返回一个元素// 取出AAA下面的所有BBB 3个// List nodeList = document.selectNodes("/AAA/BBB");// 取出所有的BBB 6个// List nodeList = document.selectNodes("//BBB");// System.out.println(nodeList.size());// 取出AAA下面的DDD下面的最后一个BBB元素的内容 Hello World B4// List nodeList = document.selectNodes("/AAA/DDD//BBB[last()]");// System.out.println(((Element)nodeList.get(0)).getTextTrim());// 取出AAA下面的CCC下面的DDD下面的所有元素 2个// List nodeList = document.selectNodes("/AAA/CCC/DDD*/*/BBB");// System.out.println(nodeList.size());// 取出AAA下面的第一个BBB元素的内容 Hello World B1// List nodeList = document.selectNodes("/AAA/BBB[1]");// System.out.println(((Element)nodeList.get(0)).getTextTrim());// Element element = (Element) document.selectSingleNode("/AAA/BBB[1]");// System.out.println(element.getTextTrim());// 取出所有有id属性的元素的id属性 5个// List nodeList = document.selectNodes("//@id");// System.out.println(nodeList.size());// 取出第一个有id属性的元素的id属性的值 b1// System.out.println(((Attribute)nodeList.get(0)).getText());// 取出所有有id属性的CCC元素// List nodeList = document.selectNodes("//CCC[@id]");// System.out.println(nodeList.size());// "//BBB[@*]" 选择有任意属性的BBB元素// "//BBB[not(@*)]" 选择没有属性的BBB元素// "//BBB[@id='b1']" 选择含有属性id且其值为'b1'的BBB元素// 选择含有属性id且其值(在用normalize-space函数去掉前后空格后)为'b2'的BBB元素// "//BBB[normalize-space(@id)='b2']"// "//*[count(BBB)=2]" 选择含有2个BBB子元素的元素// "//*[name()='BBB']" 选择所有名称为BBB的元素(这里等价于//BBB)// "//*[starts-with(name(),'B')]" 选择所有名称以"B"起始的元素// "//*[contains(name(),'C')]" 选择所有名称包含"C"的元素// "//*[string-length(name()) = 3]" 选择名字长度为3的元素// "//*[string-length(name()) < 4]" 选择名字长度小于3的元素// 同样的将<替换成大于号则是大于// 11个// List nodeList = document.selectNodes("//*[string-length(name()) < 4]");// System.out.println(nodeList.size());// "//CCC | //BBB" 选择所有的CCC和BBB元素}}


PS:通过上述案例中的XPath语句,基本的XML查询,使用是没问题的。

以上就是XPath技术 的内容,更多相关内容请关注PHP中文网(www.iotsi.net)!

转载请注明:文章转载自 www.051e.com
本文地址:http://www.051e.com/it/794833.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 ©2023-2025 051e.com

ICP备案号:京ICP备12030808号