XML——使用 XPath来定位信息+使用命名空间
【0】README
0.1)本文文字描述轉自 core java volume 2 , 旨在理解 XML——使用 XPath來定位信息+使用命名空間 的基礎知識 ;
0.2) for detailed XPath info : please visit ( http://www.ruanyifeng.com/blog/2009/07/xpath_path_expressions.html + http://www.w3schools.com/xsl/xpath_syntax.asp)
0.3) for source code about XPath, please visit https://github.com/pacosonTang/core-java-volume/tree/master/coreJavaAdvanced/chapter2/XPath
【1】XPath 相關
1)problem+solution (干貨——XPath引入的原因)
- 1.1)problem: 如果要定位某個 XML 文檔中的一段特定信息, 那么,通過遍歷DOM 樹的眾多節點來進行查找顯得有些麻煩;
- 1.2)solution: XPath 語言使得 訪問樹節點變得很容易;
2)看個荔枝:有下面的XML文檔
<configuration><database><username>dbuser</username><password>dbuser</password>.....</database> </configuration>- 2.1)可以通過 讀 XPath 表達式 /configuration/database/username 求值得到 database 中 的username;
- 2.2)使用 XPath 執行以下操作比普通的DOM 方式要簡單得多:
- 2.2.1)獲得文檔節點;
- 2.2.2)枚舉它的子元素;
- 2.2.3)定位 database 元素;
- 2.2.4)獲取 database 元素的第一個子元素, 即 username 元素;
- 2.2.5)獲取 username 元素的第一個子元素, 即 text 節點;
- 2.2.6)獲取 text 節點中的數據;
2.3)XPath 可以描述 XML 文檔中的一個節點集: 如 /a/b ;
- 2.3.1)我們可以用[] 操作符來選擇特定元素:/a/b[1];
- 2.3.2)使用 @ 操作符可以得到屬性值, /a/b/c@anchor
2.4)XPath有很多有用的函數: count 函數:count(/a/b), 返回 a根元素的b子元素的數量。
3)Java SE 5 增加了一個API來計算XPath表達式, 需要先從 XPathFactory 創建一個 XPath對象:
XPathFactory xpf = XPathFactory.newInstance(); path = xpf.newXPath();- 3.1)然后調用 evaluate 方法來計算 XPath 表達式:
String username = path.evaluate("/a/b/c",doc);
- 3.2)可以用同樣的 XPath 對象來計算多個表達式: 這種形式的 evaluate 返回一個字符串, 這很適合用來獲取文本,比如前面 的例子中的 username 節點中的文本;
- 3.3)如果XPath 表達式產生了一組節點, 請做如下調用:
NodeList nodes = (NodeList) path.evaluate("/a/b", doc, XpathConstants.NODESET); - 3.4)如果結果只有一個節點, 則以 XPathConstants.NODE 代替:
Node node = (Node) path.evaluate("/a/b[1]", doc, XPathConstants.NODE); - 3.5)如果結果是一個數字, 則使用 XPathConstants.NUMBER:
int count = (Number) path.evaluate("count(/a/b)", doc, XPathConstants.NUMBER.intValue()); - 3.6)不必從文檔的根節點開始搜索, 可以從任意一個節點或節點列表開始。
【2】使用命名空間
1)java用包來避免名字沖突,XML 也有類似的命名空間機制,可以用于元素名和屬性名; (干貨——XML的命名空間機制等同于java中的package)
- 1.1)名字空間:是由統一資源標識符(Uniform Resource Identifier, URI)來標識的;
- 1.2)HTTP的URL格式是最常用的: 注意 URL 只用作標識符字符串,而不是一個文件的定位符; (干貨——HTTP的URL格式是最常用作為命名空間的,僅僅在于標識,而不是定位某個文件) 如, 名字空間標識符:
2)人們習慣于將解釋該命名空間的文檔放在 URL位置上。如,如果你把瀏覽器指向 XML Schema 的命名空間URL, 你就會發現一個描述XML Schema 標準的文檔;
- 2.1)為什么要用URL 作為命名空間的標識符呢? 這是因為這樣容易確保它們是獨一無二 的。
3)java中,使用import來指定很長的包名, 然后只需要使用較短類名;
- 3.1)在XML中,有類似機制, 如 (干貨——如何在xml中引入 命名空間)
- 3.2)現在, 該元素和他的子元素都是給定命名空間的一部分了, 子元素可以提供自己的命名空間, 如: (干貨——父元素和子元素可以有自己不同的命名空間)
- 3.3)你也可以用一個前綴來表示命名空間, 即為特定文檔選取的一個短的標識符。下面是一個典型的荔枝: (干貨——用一個前綴來表示命名空間)
3.4)下面的屬性: xmlns :prefix = “namespaceURI” , 用于定義命名空間和前綴。 在我們的例子中, 前綴是xsd。 這樣, xsd:schema 實際上指的是 命名空間 http://www.w3.org/2001/XMLSchema 中的schema;
Attention)
- A1) 只有子元素繼承了它們父元素的命名空間, 而不帶顯示前綴的屬性不是命名空間的一部分;
4)默認情況下, DOM 解析器并非“命名空間感知的”, 要打開命名空間處理特性:
請調用 DocumentBuilderFactory 類的 setNamespace Aware 方法: factory.setNamespaceAware(true);(干貨——開命名空間處理特性,factory.setNamespaceAware(true))
- 4.1)這樣,工廠產生的所有生成器便都支持命名空間了。每個節點有3個屬性(Properties):
- P1)帶有前綴的限定名, 由 getNodeName 和 getTagName 等方法返回;
- P2)命名空間 URI ,由 getNamespaceURI 方法返回;
- P3)不帶前綴和命名空間的本地名, 由getLocalName 方法返回;
4)看個荔枝:
- 4.1)下面是一個荔枝, 假設解析器看到了以下元素:
- 4.2) 它會報告:
- Attention) 如果對命名空間的感知特性被關閉, getLocalName 和 getNamespaceURI 方法將返回 null;
總結
以上是生活随笔為你收集整理的XML——使用 XPath来定位信息+使用命名空间的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: XML——XML Schema
- 下一篇: asp.net ajax控件工具集 Au