关于xml:XML数据如何进行解析呢方式有哪些

上回咱们说到 JSON 解析的四种形式，那么这次咱们来看看 XML 的四种解析形式。

DOM 解析
SAX 解析
JDOM 解析
DOM4J 解析

DOM（Document Object Model，文档对象模型），在应用程序中，基于 DOM 的 XML 分析器将一个 XML 文档转换成一个对象模型的汇合（通常称为 DOM 树），应用程序正是通过对这个对象模型的操作，来实现对 XML 文档数据的操作。XML 自身是以树状的模式呈现的，所以 DOM 操作的时候，也将按章树的模式进行转换。在整个 DOM 树中，最大的中央指的是 Document，示意一个文档，在这个文档中只存在一个根节点。

留神：在应用 DOM 操作的时候，每一个文字的区域也是一个节点，称为文本节点。

外围操作接口

在 DOM 解析中有以下四个外围的操作接口：

Document：此接口代表了整个 XML 文档，示意的是整棵 DOM 树的根，提供了对文档中的数据进行拜访和操作的入口，通过 Document 节点能够拜访 XML 文件中所有的元素内容。

Node：此接口在整个 DOM 树中具备无足轻重的位置，DOM 操作的外围接口中有很大一部分接口是从 Node 接口继承过去的。例如：Document、Element 等接口，在 DOM 树中，每一个 Node 接口代表了 DOM 树中的一个节点。

NodeList：此接口示意的是一个节点的汇合，个别用于示意有程序关系的一组节点，例如：一个节点的子节点，当文档扭转的时候会间接影响到 NodeList 汇合。

NamedNodeMap：此接口示意的是一组节点和其惟一名字对应的一一对应关系，本接口次要用于属性节点的示意上。

DOM 解析过程

如果一个程序须要进行 DOM 解析读取操作的话，也须要依照如下的步骤进行：

① 建设 DocumentBuilderFactory : DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
② 建设 DocumentBuilder: DocumentBuilder builder = factory.newDocumentBuilder();
③ 建设 Document : Document doc = builder.parse(“要解析的文件门路”);
④ 建设 NodeList : NodeList nl = doc.getElementsByTagName(“读取节点”);
⑤ 进行 XML 信息读取

SAX（Simple API for XML）解析是依照 xml 文件的程序一步一步的来解析。SAX 没有官网的规范机构，它不属于任何规范组织或个人，也不属于任何公司或集体，而是提供任何人应用的一种计算机技术。

SAX（Simple API for XML，操作 XML 的简略接口），与 DOM 操作不同的是，SAX 采纳的是一种程序的模式进行拜访，是一种疾速读取 XML 数据的形式。当应用 SAX 解析器进行操作的时候会触发一系列的事件，当扫描到文档（document）开始与完结、元素（element）开始与完结时都会调用相干的解决办法，并由这些操作方法作出相应的操作，直至整个文档扫描完结。

如果要想实现这种 SAX 解析，则必定首先建设一个 SAX 的解析器。

// 1、创立解析器工厂
SAXParserFactory factory = SAXParserFactory.newInstance();
// 2、取得解析器
SAXParser parser = factory.newSAXParser();
// SAX 解析器，继承 DefaultHandler
String path = new File(“resource/demo01.xml”).getAbsolutePath();
// 解析
parser.parse(path, new MySaxHandler());

在 W3C 自身提供的 XML 操作规范，DOM 和 SAX，然而从开发角度上看，DOM 和 SAX 自身是各有特点的，DOM 能够批改，但不适宜读取大文件，而 SAX 能够读取大文件，然而自身不能批改。所谓的 JDOM = DOM 的可批改 + SAX 的读取大文件，JDOM 自身是一个收费的开源组件，间接从 www.jdom.org 上下载。

JDOM 操作 xml 罕用类：

Document：示意整个 xml 文档，是一个树形构造

Eelment：示意一个 xml 的元素，提供办法操作其子元素，如文本，属性和名称空间等

Attribute：示意元素蕴含的属性

Text：示意 xml 文本信息

XMLOutputter：xml 输入流，底层是通过 JDK 中流实现

Format：提供 xml 文件输入的编码、款式和排版等设置

咱们发现 JDOM 的输入操作要比传统的 DOM 不便得多，而且也更加直观，包含在输入的时候都很容易了。此时察看到的是 JDOM 对于 DOM 解析的反对，然而也说，JDOM 自身也反对了 SAX 的特点；所以，能够应用 SAX 进行解析操作。

// 获取 SAX 解析器
SAXBuilder builder = new SAXBuilder();
File file = new File(“resource/demo01.xml”);
// 获取文档
Document doc = builder.build(new File(file.getAbsolutePath()));
// 获取根节点
Element root = doc.getRootElement();
System.out.println(root.getName());
// 获取根节点下所有的子节点，也能够依据标签名称获取指定的间接点
List<Element> list = root.getChildren();
System.out.println(list.size());
for(int x = 0; x<list.size(); x++){
Element e = list.get(x);
// 获取元素的名称和外面的文本
String name = e.getName();
System.out.println(name + “=” + e.getText());
System.out.println(“==================”);
}

dom4j 是一个简略的开源库，用于解决 XML、XPath 和 XSLT，它基于 Java 平台，应用 Java 的汇合框架，全面集成了 DOM，SAX 和 JAXP。下载门路：

http://www.dom4j.org/dom4j-1.6.1/

http://sourceforge.net/projects/dom4j

DOM4J 与 JDOM 一样都属于一个收费的 XML 开源组件，然而因为当初的开发框架中应用该技术较多，比方 Hibernate、Spring 等都应用 DOM4J 这个性能，所以作为介绍，大家能够对该组件有一个理解。并没有谁好谁坏，个别框架应用 DOM4J 较多，而咱们平时如果要用则 JDOM 较常见。能够发现 DOM4J 施展了很多新个性，比方输入格局就能够很好。

File file = new File(“resource/outputdom4j.xml”);
SAXReader reader = new SAXReader();
// 读取文件作为文档
Document doc = reader.read(file);
// 获取文档的根元素
Element root = doc.getRootElement();
// 依据跟元素找到全副的子节点
Iterator<Element> iter = root.elementIterator();
while(iter.hasNext()){
Element name = iter.next();
System.out.println(“value = ” + name.getText());
}

如果想要生成 XML 文件，则在创立文档的时候，就应该应用 newDocument() 办法

如果要将 DOM 的文档输入，自身是比拟麻烦的。一次编写屡次 copy

public static void createXml() throws Exception{
// 获取解析器工厂
DocumentBuilderFactory factory=DocumentBuilderFactory.newInstance();
// 获取解析器
DocumentBuilder builder=factory.newDocumentBuilder();
// 创立文档
Document doc=builder.newDocument();
// 创立元素、设置关系
Element root=doc.createElement(“people”);
Element person=doc.createElement(“person”);
Element name=doc.createElement(“name”);
Element age=doc.createElement(“age”);
name.appendChild(doc.createTextNode(“lebyte”));
age.appendChild(doc.createTextNode(“10”));
doc.appendChild(root);
root.appendChild(person);
person.appendChild(name);
person.appendChild(age);
// 写出去
// 取得变压器工厂
TransformerFactory tsf=TransformerFactory.newInstance();
Transformer ts=tsf.newTransformer();
// 设置编码
ts.setOutputProperty(OutputKeys.ENCODING, “UTF-8”);
// 创立带有 DOM 节点的新输出源，充当转换 Source 树的持有者
DOMSource source=new DOMSource(doc);
// 充当转换后果的持有者
File file=new File(“src/output.xml”);
StreamResult result=new StreamResult(file);
ts.transform(source, result);
}

// 创立一个 SAXtransformerfactory 对象
SAXTransformerFactory stf = (SAXTransformerFactory) SAXTransformerFactory.newInstance();
try {
// 通过 SAXTransformerFactory 对象创立一个 TransfomerHandler 对象
TransformerHandler handler = stf.newTransformerHandler();
// 通过 transformerHandler 对象创立一个 transformer 对象
Transformer tf = handler.getTransformer();
// 设置 Transfomer 对象的属性
tf.setOutputProperty(OutputKeys.ENCODING, “UTF-8”);
tf.setOutputProperty(OutputKeys.INDENT, “yes”);
// 创立一个 Result 的对象，将其与 handler 关联
File file = new File(“src/output.xml”);
if(!file.exists()){
file.createNewFile();
}
Result result = new StreamResult(new FileOutputStream(file));
handler.setResult(result);
// 通过 Handler 编写 XML 的内容
// 关上 Document
handler.startDocument();
AttributesImpl attr = new AttributesImpl();
// 创立根节点 bookstore
handler.startElement(“”, “”, “bookstore”, attr);
attr.clear();
attr.addAttribute(“”, “”, “id”, “”, “1”);
handler.startElement(“”, “”, “book”, attr);
attr.clear();
handler.startElement(“”, “”, “name”, attr);
handler.characters(“ 颈椎病痊愈指南 ”.toCharArray(), 0, “ 颈椎病痊愈指南 ”.length());
handler.endElement(“”,””,”name”);
// 敞开各节点
handler.endElement(“”, “”, “book”);
handler.endElement(“”, “”, “bookstore”);
handler.endDocument();
} catch (SAXException e) {
// TODO Auto-generated catch block
e.printStackTrace();
} catch (FileNotFoundException e) {
// TODO Auto-generated catch block
e.printStackTrace();
} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
} catch (TransformerConfigurationException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}

// 创立节点
Element person = new Element(“person”);
Element name = new Element(“name”);
Element age = new Element(“age”);
// 创立属性
Attribute id = new Attribute(“id”,”1″);
// 设置文本
name.setText(“lebyte”);
age.setText(“10”);
// 设置关系
Document doc = new Document(person);
person.addContent(name);
name.setAttribute(id);
person.addContent(age);
XMLOutputter out = new XMLOutputter();
File file = new File(“resource/outputjdom.xml”);
out.output(doc, new FileOutputStream(file.getAbsoluteFile()));

// 应用 DocumentHelper 来创立 Document 对象
Document document = DocumentHelper.createDocument();
// 创立元素并设置关系
Element person = document.addElement(“person”);
Element name = person.addElement(“name”);
Element age = person.addElement(“age”);
// 设置文本 name.setText(“lebyte”);
age.setText(“10”);
// 创立格式化输入器
OutputFormat of = OutputFormat.createPrettyPrint();
of.setEncoding(“utf-8”);
// 输入到文件
File file = new File(“resource/outputdom4j.xml”);
XMLWriter writer = new XMLWriter(new FileOutputStream(new File(file.getAbsolutePath())),of);
// 写出
writer.write(document);
writer.flush();

关于xml:XML数据如何进行解析呢方式有哪些

上回咱们说到 JSON 解析的四种形式，那么这次咱们来看看 XML 的四种解析形式。

解析的四种形式

案例实操

DOM 解析

SAX 解析

JDOM 解析

DOM4J 解析

扩大~XML 的创立

DOM 创立

SAX 创立

JDOM 创立

DOM4J 创立