频道栏目
首页 > 资讯 > XML教程 > 正文

XML轻松学习手册(4)XML语法

16-01-12        来源:[db:作者]  
收藏   我要投稿

通过前面三章的学习,我们已经对什么是XML,它的实现原理以及相干的术语有所懂得。接下来我们就开端学习XML的语法规范,动手写自己的XML文档。

一、XML语法规矩

XML的文档和HTML的原代码类似,也是用标识来标识内容。创立XML文档必需遵照下列重要规矩:

规矩1:必需有XML声明语句

这一点我们在上一章学习时已经提到过。声明是XML文档的第一句,其格局如下:

<?xml version="1.0" standalone="yes/no" encoding="UTF-8"?>

声明的作用是告诉浏览器或者其它处理程序:这个文档是XML文档。声明语句中的version表现文档遵照的XML规范的版本;standalone表现文档是否附带DTD文件,假如有,参数为no;encoding表现文档所用的语言编码,默认是UTF-8。

规矩2:是否有DTD文件

假如文档是一个“有效的XML文档”,那么文档必定要有相应DTD文件,并且严格遵照DTD文件制定的规范。DTD文件的声明语句紧跟在XML声明语句后面,格局如下:

<!DOCTYPE type-of-doc SYSTEM/PUBLIC "dtd-name">

其中:

"!DOCTYPE"是指你要定义一个DOCTYPE;

"type-of-doc"是文档类型的名称,由你自己定义,通常于DTD文件名雷同;

"SYSTEM/PUBLIC"这两个参数只用其一。SYSTEM是指文档应用的私有DTD文件的网址,而PUBLIC则指文档调用一个公用的DTD文件的网址。

"dtd-name" 就是DTD文件的网址和名称。所有DTD文件的后缀名为".dtd"。

我们还是用上面的例子,应当写成这样:

<?xml version="1.0" standalone="no" encode="UTF-8"?>

<!DOCTYPE filelist SYSTEM "filelist.dtd">

规矩3:留心你的大小写

在XML文档中,大小写是有差别的。<P>和<p>是不同的标识。留心在写元素时,前后标识大小写要保持一样。例如:<Author>ajie</Author>,写成<Author>ajie</author>是错误的。

你最好养成一种习惯,或者全部大写,或者全部小写,或者大写第一个字母。这样可以减少由于大小写不匹配产生的文档错误。

规矩4:给属性值加引号

在HTML代码里面,属性值可以加引号,也可以不加。例如:<font color=red>word</font>和<font color="red">word</font>都可以被浏览器准确说明。

但是在XML中则规定,所有属性值必需加引号(可以是单引号,也可以是双引号),否则将被视为错误。

规矩5:所有的标识必需有相应的结束标识

在HTML中,标识可能不是成对呈现的,比?lt;br>。而在XML中规定,所有标识必需成对呈现,有一个开端标识,就必需有一个结束标识。否则将被视为错误。

规矩6:所有的空标识也必需被封闭

空标识就是标识对之间没有内容的标识。比如<br>,<img>等标识。在XML中,规定所有的标识必需有结束标识,针对这样的空标识,XML中处理的方法是在原标识最后加/,就可以了。例如:

以下为引用的内容:
<br>应写为<br />;
<META name="keywords" content="XML, SGML, HTML">应写为<META name="keywords" content="XML, SGML, HTML" />;
<IMG src= "cool.gif">应写为<IMG src= "cool.gif" />

二、元素的语法

元素由一对标识以及其中的内容组成。就象这样:ajie。元素的名称和标识的名称是一样的。标识可以用属性来进一步描写。

在XML中,没有任何保留字,所以你可认为所欲为的用任何词语来作为元素名称。但是也必需遵照下列规范:

1.名称中可以包含字母、数字以及其它字母;

2.名称不能以数字或"_" (下划线)开头;

3.名称不能以字母 xml(或 XML 或 Xml ..)开头

4.名称中不能包含空格

5.名称中间不能包含":"(冒号)

为了使元素更轻易浏览懂得和把持,我们还有一些建议:

1.名称中不要应用"."。由于在很多程序语言中,"."是作为对象的属性,例如:font.color。同样的原因"-"也最好不要用,必需应用的,以"_"代替;

2.名称尽量简短。

3.名称的大小写尽量采用同一尺度。

4.名称可以应用非英文字符,比如用中文。但是有些软件可能不支撑。(IE5目前是支撑中文元素的。)

另外,补充一点关于属性的阐明。在HTML中,属性可以用来定义元素的显示格局,比如:<font color="red">word</font>将把word显示为红色。而在XML中,属性只是对标识的描写,与元素内容的显示无关。例如同样一句:<font color="red">word</font>,并不会将word显示为红色。(那么,有网友会问:如何在XML中将文字显示为红色呢?这就需要应用CSS或者XSL,我们在下面具体讲述。)

三、注释的语法

注释是为了便于浏览和懂得,在XML文档添加的附加信息,将不会被程序说明或则浏览器显示。

注释的语法如下:

<!-- 这里是注释信息 -->

可以看到,它和HTML中的注释语法是一样的,非常轻易。养成良好的注释习惯将使你的文档更加便于保护,共享,看起来也更专业。

四、CDATA的语法

CDATA全称character data,翻译为字符数据。我们在写XML文档时,有时需要显示字母,数字和其它的符号本身,比如"<",而在XML中,这些字符已经有特别的含义,我们怎么办呢?这就需要用到CDATA语法。语法格局如下:

<![CDATA[这里放置需要显示的字符]]>

例如:

<![CDATA[<AUTHOR ***="female">ajie</AUTHOR>]]>

在页面上显示的内容将是"<AUTHOR ***="female">ajie</AUTHOR>"

五、Namespaces的语法

Namespaces翻译为名字空间。名字空间有什么作用呢?当我们在一个XML文档中应用他人的或者多个DTD文件,就会呈现这样的抵触:由于XML中标识都是自己创立的,在不同的DTD文件中,标识名可能雷同但表现的含义不同,这就可能引起数据混乱。

比如在一个文档<table>wood table</table>中<table>表现桌子,而在另一个文档<table>namelist</table>中<table>表现表格。假如我需要同时处理这两个文档,就会产生名字冲突。

懂得决这个标题,我们引进了namespaces这个概念。namespaces通过给标识名称加一个网址(URL)定位的方法来差别这些名称雷同的标识。

Namespaces同样需要在XML文档的开头部分声明,声明的语法如下:

<document xmlns:yourname='URL'>

其中yourname是由你定义的namespaces的名称,URL就是名字空间的网址。

假设上面的"桌子<table>"文档来自http://www.zhuozi.com,我们就可以声明为

<document xmlns:zhuozi='http://www.zhuozi.com'>

然后在后面的标识中应用定义好的名字空间:

<zhuozi:table>wood table</table>

这样就将这两个<table>区离开来。留心的是:设置URL并不是说这个标识真的要到那个网址往读取,仅仅作为一种差别的标记而已。

六、entity的语法

entity翻译为"实体"。它的作用类似word中的"宏",也可以懂得为DW中的摸板,你可以预先定义一个entity,然后在一个文档中多次调用,或者在多个文档中调用同一个entity。

 

相关TAG标签
上一篇:一个简单的php图片采集程序
下一篇:Javascript XML实现分页的实例
相关文章
图文推荐

关于我们 | 联系我们 | 广告服务 | 投资合作 | 版权申明 | 在线帮助 | 网站地图 | 作品发布 | Vip技术培训 | 举报中心

版权所有: 红黑联盟--致力于做实用的IT技术学习网站