XML解析器

介紹

所有現代瀏覽器都內建了供讀取和操作 XML 的 XML 解析器。解析器把 XML 轉換為 XML DOM 對象 - 可通過 JavaScript 操作的對象。

DOM、SAX都是一組解析XML文檔的規範，其實就是接口，這說明需要有實現者能使用，而解析器就是對DOM、SAX的實現。一般解析器都會實現DOM、SAX兩個規範。

Crimson(sun)：JDK1.4之前，Java使用的解析器。性能效差。
Xerces(IBM)：IBM開發的DOM、SAX解析器，現在已經由Apache基金會維護，是當前最為流行的解析器之一。在1.5之後，已經添加到JDK之中，也是JAXP的默認使用解析器，但不過在JDK中的包名與Xerces不太一樣。例如：org.apache.xerces包名改為了com.sun.org.apache.xerces.internal包名，也就是說JDK1.5中的Xerces是被包裝後的XML解析器，但二者區別很小。
Aelfred2(dom4j)：DOM4J默認解析器，當DOM4J找不到解析器時會使用他自己的解析器。

XML文檔也是數據的一種，對數據的操作也不外乎是“增刪改查”，也被大家稱之為“CRUD”。

XML解析方式分為兩種：DOM（Document Object Model）和SAX（Simple API for XML）。這兩種方式不是針對Java語言來解析XML的技術，而是跨語言的解析方式。例如DOM還在JavaScript中存在。

DOM是W3C組織提供的解析XML文檔的標準接口，而SAX是社區討論的產物，是一種事實上的標準。

DOM和SAX只是定義了一些接口，以及某些接口的預設實現，而這個預設實現只是用空方法來實現接口。一個應用程式如果需要DOM或SAX來訪問XML文檔，還需要一個實現了DOM或SAX的解析器，也就是說這個解析器需要實現DOM或SAX中定義的接口。提供DOM或SAX中定義的功能。

使用DOM要求解析器把整個XML文檔裝載到一個Document對象中。Document對象包含文檔元素，即根元素，根元素包含N個子元素。

一個XML文檔解析後對應一個Document對象，這說明使用DOM解析XML文檔方便使用，因為元素與元素之間還保存著結構關係。

優先：使用DOM，XML文檔的結構在記憶體中依然清晰。

缺點：如果XML文檔過大，那么把整個XML文檔裝載進記憶體，可能會出現記憶體溢出的現象。

DOM會一行一行的讀取XML文檔，最終會把XML文檔所有數據存放到Document對象中。SAX也是一行一行的讀取XML文檔，但是當XML文檔讀取結束後，SAX不會保存任何數據，同時整個解析XML文檔的工作也就結束了。