简述XML文档和HTML文档,Schema文档之间的关系

简述XML文档和HTML文档,Schema文档之间的关系,第1张

所谓的xml,就是eXtensible Markup Language, 翻译成中文就是“可扩展标识语言“,在国内很多人理解xml为html的简单扩展,这实际上是一种误解。尽管xml同html关系非常密切。

XML与SGML、HTML的关系。

SGML、HTML是XML的先驱。SGML是指“通用标识语言标准”(Standard Generalized Markup Language), 它是国际上定义电子文件结构和内容描述的标准,是一种非常复杂的文档的结构,主要用于大量高度结构化数据的防卫区和其他各种工业领域,利于分类和索引。同XML相比,定义的功能很强大,缺点是它不适用于Web数据描述,而且SGML软件价格非常价格昂贵。 HTML相信大家都比较熟悉,即“HyperText Markup Language” (超文本标识语言),它的优点是比较适合web 页面的开发。但它有一个缺点是标记相对少,只有固定的标记集如<p>.<strong>等。缺少sgml 的柔性和适应性。不能支持特定领域的标记语言,如对数学、化学、音乐等领域的表示支持较少。举个例子来说,开发者很难在web pape 上表示数学公式、化学分子式和乐谱。

Xml 结合了sgml 和html的优点并消除其缺点。Xml 仍然被认为是一种sgml语言。比sgml要简单,但能实现sgml的大部分的功能。1996年的夏天,Sun Microssystem的John Bosak开始开发W3C SGML工作组(现在称为xml工作组)。他们的目标是创建一种sgml,使其在Web中,既能利用Sgml的长处,又保留html的简单性。现在目标基本达到。

二、Xml 的发展。

在专业领域中,出现了Web标记语言的许多项目,著名的有CML—化学标记语言,由Peter Murray_Rust 开发,同时开发了第一个通用xml 浏览器Jumbo . 在数学方面,包括IBM公司再内都在致力开发MathML 1997年四月,出版了xll的第一个版本。当xll完整实现时,将比html 和当前浏览器所达到的链接水平更复杂,更强大。1997年8月,Microsoft公司和Inso公司引入xsl.由于xml是纯结构和语义的,需要描述单个元素格式方法。可以使用html的CSS;另一种方案是xsl. 1998年1月,microsoft 公司出版发行了msxsl程序。可以利用xsl表和xml文档创建能被IE4 识别的html页面。1998年2月,W3C发布了xml1.0的正式版本。最近一年多来,由于网络应用的飞速发展,xml的发展非常迅猛。出现了DOM(Document Object Model),XSLT(XSL Transformation)等新名词,xml的应用软件也有了飞速的发展,Microsoft、IBM、Breeze、Stilo等公司纷纷推出了自己的或解析器,或开发平台。在MicrosoftIBM、HP等大公司的推动下,目前有两个著名的xml的研究组织,分别是biztalk.com和oasis.org,由他们向W3C提出标准的建议。其中biztalk是有Microsoft牵头组织的,有趣的是Microsoft公司同时参加了oaisis,不过不同于IBM、HP等著名大公司,他的年费只交10万美元,用Microsoft发言人的话就是“一切视oasis的发展而定!“,言下之意就是如果oasis制定的标准抵触Microsoft的应用,一场标准大战不可避免。

什么是XML

首先XML是一种元标记语言,所谓“元标记”就是开发者可以根据自己的需要定义自己的标记,比如开发者可以定义如下标记<book><name>,任何满足xml命名规则的名称都可以标记,这就为不同的应用程序打开了的大门。HTML是一种预定义标记语言,它只认识诸如<html>,<p>等已经定义的标记,对于用户自己定义的标记是不认识的。 第二xml是一种语义/结构化语言。它描述了文档的结构和语义。举个例子,在和html中,要描述一本书,可以如下表示:

<dt>book name

<dd>author_name <ul><li>publisher_name <li>isbn_number <ul>在xml中,同样的数据表示为 <book><title>book name</title><author>author name</author) <publisher>publisher name</publisher><isbn>isbn_number</isbn></book>从上面的对比,可以看出,xml的文档是有明确语义并且是结构化的。 XML是一种通用的数据格式从低级的角度看,xml是一种简单的数据格式,是纯100%的ASCII文本,而ASCII的抗破坏能力是很强的。不象压缩数据和java对象,只要破坏一个数据文件数据就不可阅读。 从高级的角度看,是一种自描述语言。

XML可利用于数据交换 主要是因为XML表示的信息独立于平台的,这里的平台即可以理解为不同的应用程序也可以理解为不同的 *** 作系统;它描述了一种规范,利用它Microsoft的word文档可以和Adobe 的Acrobat交换信息,可以和数据库交换信息。

XML表示的结构化数据。

对于大型复杂的文档,xml 是一种理想语言,不仅允许指定文档中的词汇,还允许指定元素之间的关系。比如可以规定一个author元素必须有一个name子元素。可以规定企业的业务必须有包括什么子业务。

XML文档。 XML文档有DTD和XML文本组成,所谓DTD(Document Type Definition ),简单的说就是一组标记符的语法规则.,表明XML文本是怎么样组织的,比如DTD可以表示一个<book>必须有一个子标记<author>, 可以有或者没有子标记<pages>等等。当然一个简单的XML文本可以没有DTD。下面是一个简单的xml文本。 <? Xml version=”1.0” standalone=”yes”><book>haha </book>其中以?开始并结尾的是进程说明。Standalone表示外围设备。这里外围设备可以理解为该XML文本没有应用其他的文件。因为XML文件可以外部应用DTD等外部数据。

XML 涉及的一些技术。

XSL和CSS。

通过前面的介绍可以知道,XML可以定义信息的内容,却没有定义信息该如何表达,这实际上就是XML的长处,它把内容和形式分离了,这样同一个内容可以有不同的表达,相信随着XML应用的提高,那种“建议你使用800x600分辨率“的会消失。而XML内容的表达就是通过XSL(XML Style Language)和CSS(Cascading Style Sheets 层叠样式表)来实现。拿前一个例子来说,可以为该xml文档定义的样式表(XSL)如下: <xsl><rule><root/><H1><children/></H1></rule><xsl>这就是一个简单的 XSL文件,利用msxsl可以生成html文件。如下 <h1>haha </hi>至于CSS,在HTML文件中就已经有它的影子了,例如 H1 { font-size: 12ptfont-weight: bold} 这就是一段简单的CSS的文本。

XML Schema 尽管DTD给标记的使用加了限制,但是对于XML的自动处理却还需要更加严格更全面的工具。比如DTD不能保证一个标记的某个属性的值必须不为负值,于是出现了XML Schema,由于XML Schema(不同于DTD)本身也是一个正规的XML文档,因此开发者可以使用相同的工具处理其同其他的XML的信息交换。最初XML Schema由Microsoft提出,W3C 的专家们经过充分讨论和论证,在1999年的2月,发布了一个需求定义,说明Schema必须符合的要求,5月,W3C完成并发布了Schema的定义。目前,IE5中的XML解析器能够根据文档类型定义(DTD)或XML Schema解析XML

关于DOM DOM即Document Object Model, 它把XML文档的内容实现为一个对象模型,简单的说就是应用程序如何访问XML文档,W3C的DOM Level 1 定义了如何实现属性、方法、事件等。

关于XSLT XSLT即XML Stylesheet Language Transformation. 在写本文时正式标准还没有正式形成,在1999年的11月通过了《XSLT》。XSLT是一种用来进行XML文档间相互转化的语言。简单的说,我们知道不同的开发者对于各自的应用会用不同的XML文档,利用XSLT我们可以从一个已经定义的XML文档抽取我们需要的数据,组成不同的形式,可以是XML, HTML和各种不同的SCRIPT。

关于Xpointer和Xlinks

类似于HTML中的Hyper Link. Xpointer 和Xlink用于联结其他的XML文档和其他XML文档中的部分,其中Xpointer相当于HTML中用于定位HTML文档子内容的锚!不过其联结水平更强大。比如,在bookstore中,可以定位到有一个作者叫金庸,书中有四大恶人的那本书,在HTML中,这是不可能实现的。

当然,XML的发展促使了许多的新技术的出现,其他的还有RDF、Xfrom等等,其中的大部分W3C只是给出了建议,还没有形成正式的标准,有些内容甚至还处于讨论阶段。我们将密切注视着方面内容的变化。

XML 框架

所谓框架即Framework。XML是一个通用的标准。它不属于个人,认证它的也不是一家公司,而是W3C。那么为什么那么多的大公司纷纷趋指如鹜呢?各家公司互相竞争的是它的framework, 是它的Schema. XML framework是驾驭XML文件的结构,是一种高层次的结构控制。利用XML framework,可以把商业逻辑(business logic)分离出来,实现数据与计算的分离。目前著名的framework有Microsoft的Biztalk 以及联合国(UN/CEFACT)和OASIS联合于99年底推出了EBXML动议。相信在不久的将来会有许多的Framwork. 其中的一个问题就是在W3C中关于XML的很多东西还处于建议的时候,就推出framework,是不是一种冒险。不过,互联网的发展似乎就是这样,关于framwwork的发展,我们将拭目以待

需要你针对特定的XML的编写XSL样式表。

在Eclipse中:

在XSL上右键 ->Run As ->XSL Transformation

在d出的窗口中选择 你要通过 XSL 样式表转换的 XML,最终会得到HTML格式的输出结果(文件扩展名是.xml)。

在JAVA中编写代码,会用到以下几个API,请参考。

TransformerFactory tFactory = TransformerFactory.newInstance()

Transformer transformer = tFactory.newTransformer(xslSource))

transformer.transform(xmlSource, result)

相关资料

http://www.w3school.com.cn/xsl/xsl_templates.asp

使用一个简单的 XSL 样式表就可以将 XML 数据转换成 HTML。随着 XML 规范的不断演进,在新的版本中满足每个人的需要似乎已经成为必要;不幸的是,进行简单的转换一直都困扰着规范。

假设我有一个表示一个页面内容的 XML 数据,现在我想将其内容转换成布局。下面是我想要转换的 XML:

<?xml version='1.0'?><?xml-stylesheet type="text/xsl" href="article.xsl"?><xml><folders><folder><text>Folder 1</text><files><file><text>File 1</text><fields><field><data><type>string</type><length>50</length><value>some data</value></data></field></fields></file></files></folder></folders></xml>

这个内容表示一组文件夹、文件和域。每个文件夹包含文件,每个文件包含用于输入数据的域。文件夹组中的每个文件夹都将表现为一个 TABLE 的第一行的一个 TR 元素和一个 TD 元素。文件组中的每个文件都将表示为嵌套在文件夹 TR 元素中的一个 TABLE 元素的第一行的一个 TR 元素和一个 TD 元素。域组中的每个域都将在相关的文件中表现为一个 INPUT。

为了实现这一想法,我们需要将遍历 XML 然后根据XSL 构建一个表。

下面是用于这个转换的 XSL:

<?xml version="1.0"?><xsl:stylesheet xmlns:xsl=" http://www.w3.org/1999/XSL/Transform" version="1.0" xmlns:msxsl="urn:schemas-microsoft-com:xslt" xmlns:fn=" http://www.mycompany.com/mynamespace"><xsl:output method="html"/><msxsl:script language="JScript" implements-prefix="fn">function getElementCount(nodelist, what) { var rtrn = 0rtrn = nodelist[0].parentNode.selectNodes(what).lengthreturn (rtrn + 1)//1 is added for filler TD } </msxsl:script><xsl:template match="/"><TABLE CELLSPACING="0" CELLPADDING="0" WIDTH="100%" BORDER="0" ID="tblRoot" NAME="tblRoot" style="table-layout:fixed"><TR><xsl:for-each select="xml/folders/folder"><xsl:element name="TD"><xsl:attribute name="style">width:55px</xsl:attribute><xsl:value-of select="text"/></xsl:element></xsl:for-each><TD></TD></TR><xsl:for-each select="xml/folders/folder"><TR><xsl:element name="TD"><xsl:attribute name="colspan"><xsl:value-of select="fn:getElementCount(., 'folder')"/></xsl:attribute><TABLE CELLSPACING="0" CELLPADDING="0" WIDTH="100%" BORDER="0" style="table-layout:fixed"><TR><xsl:for-each select="files/file"><xsl:element name="TD"><xsl:attribute name="style">width:55px</xsl:attribute><xsl:value-of select="text"/></xsl:element></xsl:for-each><TD></TD></TR><xsl:for-each select="files/file"><TR><xsl:element name="TD"><xsl:attribute name="colspan"><xsl:value-of select="fn:getElementCount(., 'file')"/></xsl:attribute><xsl:for-each select="fields/field"><xsl:element name="INPUT"><xsl:attribute name="type">text</xsl:attribute><xsl:attribute name="maxlength"><xsl:value-of select="data/length"/></xsl:attribute><xsl:attribute name="value"><xsl:value-of select="data/value"/></xsl:attribute></xsl:element><BR/></xsl:for-each></xsl:element></TR></xsl:for-each></TABLE></xsl:element></TR></xsl:for-each></TABLE></xsl:template></xsl:stylesheet>

在 stylesheet 标记中,我们设置了几个命名空间,包括定义所有 xsl 转换标记的 xsl 命名空间。能够让我们创建可以在样式表中使用的用户函数的msxml 命名空间。我使用它得到所有的子元素,以便得到一个 TD 标记的一个 COLSPAN 属性集。用于加入一组用户定义的函数的fn 命名空间,该命名空间由msxml:script element 创建。然后,我们创建外部 TABLE 和第一个 TR。在 TR 中,我为 XML 中指定的每个文件夹创建一个 TD。我使用了 xsl:element 标记,因为它允许我添加自定义属性或者执行一个函数来为另一个 TD 元素中的 COLSPAN 属性设置一个属性。

在为每个文件夹创建了所需的 TD 之后,我开始为每个文件夹创建 TR。我只向这个 TR 添加一个 TD,但是我将它的 COLSPAN 属性设为等于文件夹组中文件夹标记的数量再加一。多出的一是用来在一个固定布局样式的 TABLE 中填充空格用的。为了得到 COLSPAN,我传入当前的上下文(在这里由“.”指定)和我想计算的节点的名字。在我的函数中,我得到当前的上下文,paraentNode,和 XPath 查询中指定的节点的数量。然后函数返回这个数量加上一以填充 TD。

有了这个 TD,我在其中嵌入另外一个 TABLE,该 TABLE 包含文件组中的每个文件。从这一点开始,其过程就与外部 TABLE 转换一样。最后的步骤是添加每个文件中的域。这次我没有再创建嵌入的 TABLE,只是把这些域添加到当前的 TD 中。一旦我完成了通用布局,我就可以开始添加用户界面功能了,比如说隐藏掉其它的文件夹和文件行,直到用户点击了相关的选项卡。这一功能可以通过编写支持这一功能的脚本来实现,添加一个 onclick xsl:attribute 元素到文件夹和文件 TD 元素,然后将它的值设置为脚本函数的名字。

最后,在通用功能完成之后,你可以添加class xsl:attributes 并在 STYLE 或 CSS 中添加相关的classNames 得到你想要的外观。这个例子为在部署 Web 数据解决方案中用到的 File-Folder-Field 视图创建了一个基础。访问 MSDN 找到更多有关Microsoft 的 XML 规范的信息。


欢迎分享,转载请注明来源:内存溢出

原文地址: https://outofmemory.cn/zaji/6103984.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-03-14
下一篇 2023-03-14

发表评论

登录后才能评论

评论列表(0条)

保存