2011年用PHP和AJAX的XML编程的教程
在 SOA 架构中,程序员经常使用 XML 在应用程序之间交换结构化和半结构化的数据。XML 及其相关技术 — 文档对象模型(Document Object Model,DOM)、XPath、HTTP、XQuery 和可扩展样式表语言转换(Extensible Stylesheet Language Transformations,XSLT) — 为快速应用程序开发提供了一个强大的环境。构建在这些技术之上的应用程序将占用更小的内存空间,需要更低的维护成本,同时又拥有更高的品质和灵活性。
DB2 和其他关系数据库的 XML 方面的特性已经相当成熟,因此除了存储和管理关系数据之外,它们还是存储和管理 XML 数据的理想选择。DB2 9 XML 支持(称为 pureXML)提供了以纯 XML 的形式(换句话说,就是带注释的、树型的分层存储)存储 XML 的能力。在 DB2 9 中,XML 数据可以用 XML 模式索引,可以从关系数据组合而成,可以分解为关系数据,可以查询和转换,可以独立发布,或者通过混合使用 SQL/XML 和 XQuery 与关系数据组合起来。
Web 浏览器也正在为客户机脚本提供更多的功能来有效地处理 XML。通过使用异步 JavaScript 和 XML(Asynchronous JavaScript and XML,Ajax),Web 页面现在可以直接对应用服务器进行远程过程调用,并且可以在任何返回的 XML 数据上使用 DOM API。
本文将展示如何利用 DB2 XML、Ajax 和 PHP Hypertext Preprocessor (PHP) 提供的功能来编写简单的基于 XML 的应用程序。通过示例场景的帮助,您将学习如何在 JavaScript 中调用 PHP 应用程序;如何使用 DOM 和 SimpleXML API 修改 XML 数据;如何将 XML 从客户机传送到应用程序再到数据库;以及如何创建 PHP Web 服务来使用 SQL/XML 和 XQuery 发布关于 XML 数据的报告。
XML 优点
大多数应用程序都用于创建、存储、操纵和呈现业务数据。对象包装是指将业务数据绑在一起,使业务逻辑更容易处理它们。这些包装器对象的很多功能都是根据关系和格式化规则来提供业务数据的结构,并使业务逻辑能够操纵、发布和串行化封装的数据。
图 1. 基于对象包装器的应用程序
图 1 阐释了使用对象包装器的一个示例人寿保险应用程序。每个方框表示一个对象,每个对象至少有:
·一个构造函数
·Getter 和 Setter 方法
·验证代码
·内部对象层次的串行化
这些对象与实际的业务逻辑没有关系。对象包装是为了使业务逻辑更容易管理业务数据。包装数据所需的代码比业务逻辑要多得多。更多的代码将导致更多的 bug、更大的固定性、更多的维护和更高的成本。
如果对象中的数据变量可以格式化为 XML 结构,并且对象的主要作用是将这些数据暴露给业务逻辑并让业务逻辑操纵它们,那么可以用 DOM 代替对象。
图 2. 基于 XML 的应用程序
图 2 展示了一个使用 XML 和 DOM 包装器的示例保险应用程序。图 1 中的所有数据包装器对象都用一个 DOM 对象代替。业务数据是用 XML 建模的,DOM 提供了必要的 API 来:
·创建新的 XML 对象。
·更新 XML 对象的值。
·导航 XML 对象。
·使用 XPath 在对象层次中搜索。
·串行化和反串行化 XML 对象层次(换句话说,就是内建持久性)。
通过使用 XML,可以避免使用大多数用于管理业务数据的包装器对象。应用程序将变得更加简洁,并且更多地将重点放在业务逻辑上,而不是数据管理上。
XML 和架构
将 XML 引入架构中可以为表示业务数据带来一种标准化的方式。XML 可以提供数据的结构;XML 模式施加结构和格式化规则;DOM API 和 XQuery、XPath 及 XSLT 之类的语言使业务逻辑可以有效地操纵、发布和串行化数据。由于业务数据的 XML 表示在客户机、中间层和数据库中都是一致的,因此操纵这些对象的代码也是类似的。
我将展示如何在三层环境中构建基于 XML 的应用程序,这个三层环境由以下几个部分组成:
·Web 客户机:Asynchronous JavaScript and XML (Ajax),DOM
·应用服务器:PHP 和 SimpleXML
·数据库: DB2 9 和 SQL/XML,XQuery
基于 ACORD 人寿数据模型的场景
我们来考虑一个简单的人寿保险场景,在这个场景中,首先创建一个表示新保单的 XML 文档,然后查询和操纵这个文档,另外还将这个文档从一层移动到另一层。这个文档基于合作运营研究与发展协会(Association for Cooperative Operations Research & Development,ACORD)用于人寿保险规范的 XML,它定义了健康保险和年金保险需要交换的数据。
为了申请一个新的保险,客户需要提供一些基本信息。部分信息是在一个 PHP 应用程序中填写的,还有一部分是在客户机浏览器中填写的。然后,保单存储在一个 DB2 XML 列中。在 DB2 9 中,XML 类型的列在内部将 XML 数据存储为一棵解析后的树,与关系数据存储在不同的地方。这种方法是 DB2 9 特有的,更早的 DB2 版本则使用关系存储基础设施来存储 XML。
下面是保单 XML 文档在客户机与应用程序之间的流程:
·在 Web 客户机中,客户更新页面并单击 Submit。
·Web 客户机向 PHP 发出一个 XMLHTTP 请求,以获得新的空白保单文档。
·PHP 应用程序打开一个空白的保单文档,用一个全局惟一标识符(GUID)更新它,然后将该文档返回给 Web 客户机。
·Web 客户机使用 Ajax 捕捉返回的事件,并检索 XML DOM,然后用 Web 页面中输入的信息填充该文档。
·Web 客户机使用 XMLHTTP 将更新后的 XML 发送给 PHP 应用程序。
图 3. 创建新的保单请求的 Web 站点。
图 3 展示了用于创建新的保单请求的 Web 页面。当用户单击 Submit 按钮后,JavaScript 函数 submitPolicy() 被调用(见清单 1)。该函数向 PHP 应用程序 createNewPolicy.php 发出一个 HTTP 请求,以获得一个空白的保单。它还设置一个回调函数 fillPolicy(),用于捕捉从 HTTP 请求返回的事件。
当第一个请求到达中间层的 PHP 应用服务器时,一个新的 XML 保单文档被装载到 SimpleXML 对象中。通过使用 SimpleXML API,用 PHP 应用程序中创建的 GUID 更新 TransRefGUID 元素。
header('Content-type: text/xml');
$fileContents = file_get_contents("$basedir/acord.xml");
$dom = simplexml_load_string($fileContents);
$dom->TXLifeRequest->TransRefGUID=$guid;
echo $dom->asXML();
然后,这个文档被发送到客户机。
对于本文,我们假设 GUID 是通过某种机制(例如时间和随机数的组合)创建的。更重要的是理解如何将表示保单的 XML 文档视作内存中的业务对象层次结构,以及如何使用 SimpleXML API (或 DOM/XPath)来导航和更新这个对象。
填充基本客户信息
在 Web 客户机中,fillPolicy() 函数读取返回的值。现在,包含返回 XML 的内存中表示的 DOM 对象可用于操纵保单文档。客户在 Web 页面上输入的信息被直接用于更新 DOM。当使用客户信息更新了保单之后,使用 XMLHTTP 将修改后的 DOM 对象提交回 PHP 应用程序(见清单 2)。即使是 HTML 组件值也是用 DHTMLDocument Object Model (DOM) 读取的。
将保单存储在 DB2 中
PHP 应用程序将传入的 XML 文档直接存储在数据库中,而不需要解析它(见清单 3)。DB2 的 pureXML 支持将隐式地解析传入的 XML,并将其存储在一个类 DOM 的分层结构中。现在,可以在 XQuery 语句中使用 XPath 之类的 XML 导航技术(就像在 DOM 中使用的那样)来查询 XML。DB2 9 还提供了在该层次结构中的任何节点上索引的能力。
公开 XML 文档上的服务
新的保单存储在 DB2 9 中以后,保险代理可以查询该保单,以决定是否接受这个保险。用于获得关于新保单报告的查询通过 Web 服务公开给客户机应用程序。
这个例子中的 Web 服务是用 PHP 编写的,它为调用实现服务的业务和转换逻辑的 DB2 存储过程提供了一个简洁的接口。每个 DB2 存储过程由一个 SQL/XML 查询组成,它过滤和转换存储在数据库中的 XML 保单,以创建一个输出 XML 文档。然后,该 PHP Web 服务将 XML 文档返回给客户机。
我们来分析每个存储过程,看看那些有效地组成 Web 服务实现的查询。
列出所有新客户保险的 DB2 查询。包含该查询的存储过程是listAllNewCustomers(见清单 4)。该查询搜索 ACORD 表的 INFO 列中的所有保单文档。在每个 XML 文档中,DB2 进一步向下分析,以便只返回 PolicyStatus/@tc 属性的代码值被设为 12(也就是建议的值)的那些文档。查询输出是一个 XML 文档,它有一个根节点 newpolicylist,该节点包含一系列的用于每个新保单的 TXLife 子节点(见图 4)。
图 4. 返回新保单列表的 SQL/XML 查询
注意这个查询第一次如何使用 DB2 XQuery 函数 db2-fn:xmlcolumn 来导航关系模式,以定位到 XML 列 DB2ADMIN.ACORD.INFO。当它到达 XML 列时,它进一步使用 XPath 在 XML 模式中导航到适当的节点(类似于使用 PHP、JavaScript 或其他语言导航 DOM)。
列出有风险客户的提议保险的 DB2 查询。该查询只列出有风险的新客户(也就是说,他们对于某个医疗问题的回答是 yes)。该查询包含在一个名为 listAtRiskNewCustomers 的存储过程中(见清单 5)。 注意:WHERE 子句同时检查答案和保单状态。
评估有风险新客户的风险度的 DB2 查询。对于以上列表中的每个保单,在保单的健康风险区域只能列出回答为 yes 的问题。该查询还返回 policytype,以显示该保单值多少钱,以便评估风险。包含该查询的存储过程(见清单 6)是 getRiskQuestions(guid)。 注意:您需要一个支持 XML 类型的 DB2 驱动程序版本。否则,在每个存储过程中都需要使用 XMLSerialize 来从 XMLQuery 中串行化 XML 值。请参阅 developerWorks 文章 “结合使用 DB2 原生 XML 与 PHP” 以获得更详细的信息。
创建 Web 服务
用于 getnewpolicyinfo Web 服务的 PHP 代码是一个瘦包装器,它检查所需保单报告的类型,并调用适当的存储过程。然后,将存储过程所返回的值发送回客户机(见清单 7)。注意用 PHP 创建 Web 服务是多么简单。最后三行将该功能公开为一个 Web 服务。在任何客户机中,包括在 PHP 应用程序中,都可以调用 Web 服务,如清单 8 所示。
结束语
在过去几年中,各应用程序层的 XML 支持都已成熟,这导致一种强大的开发环境的出现,这种开发环境可以改变企业应用的设计方式。XML 使开发人员可以为业务文档定义规则和结构,还可以在内存中将文档实例化为分层对象,开发人员可以在任何层使用标准 API 对这种对象进行导航、修改和串行化。Ajax 使基于 Web 的客户机脚本可以调用 DOM API,还可以对中间层进行远程过程调用。PHP 为处理 XML 和 Web 服务提供了最简单的方法之一,因此非常适合基于 XML 的应用程序开发。XML 演变的最后一链是数据库层。DB2 9 使数据库层能操纵 XML。因此这个演变周期宣告结束。
PHP