ppt課件 面向1.NET的Web應(yīng)用程序設(shè)計(jì)課件4章_第1頁
ppt課件 面向1.NET的Web應(yīng)用程序設(shè)計(jì)課件4章_第2頁
ppt課件 面向1.NET的Web應(yīng)用程序設(shè)計(jì)課件4章_第3頁
ppt課件 面向1.NET的Web應(yīng)用程序設(shè)計(jì)課件4章_第4頁
ppt課件 面向1.NET的Web應(yīng)用程序設(shè)計(jì)課件4章_第5頁
已閱讀5頁,還剩38頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

面向.NET的Web應(yīng)用程序設(shè)計(jì)梁輝2023/2/10第4章XML學(xué)習(xí)

4.1XML快速入門

4.2XML的概念

4.3XML的術(shù)語

4.4XML的實(shí)現(xiàn)

4.5XML的實(shí)例分析2023/2/102/2054.1XML快速入門

4.1.1什么是XMLXML是ExtensibleMarkupLanguage的簡寫,一種擴(kuò)展性標(biāo)識(shí)語言HTML里面有很多標(biāo)簽,類似<head>,<table>等,都是在HTML4.0里規(guī)范和定義,而XML里允許你自己創(chuàng)建這樣的標(biāo)簽,所以叫做可擴(kuò)展性。

幾個(gè)容易混淆的概念1.XML并不是標(biāo)記語言。2.XML并不是HTML的替代產(chǎn)品。3.不能用XML來直接寫網(wǎng)頁。2023/2/103/2054.1XML快速入門4.1.2使用XML有什么好處

XML使得在網(wǎng)絡(luò)上使用SGMLStandardGeneralizedMarkupLanguage語言更加"簡單和直接":簡化了定義文件類型的過程,簡化了編程和處理SGML文件的過程,簡化了在Web上的傳送和共享。

1.XML可以廣泛的運(yùn)用于web的任何地方;

2.XML可以滿足網(wǎng)絡(luò)應(yīng)用的需求;

3.使用XML將使編程更加簡單;

4.XML便于學(xué)習(xí)和創(chuàng)建;

5.XML代碼將清晰和便于閱讀理解。2023/2/104/2054.1XML快速入門示例文檔<?xmlversion="1.0"?>

<myfile>

<title>XMLQuickStart</title>

<author>ajie</author>

<email>ajie@</email>

<date>20010115</date>

</myfile>

第一行<?xmlversion="1.0"?>是一個(gè)XML聲明,表示文檔遵循的是XML的1.0版的規(guī)范。

第二行定義了文檔里面的第一個(gè)元素(element),也稱為根元素:<myfile>。這個(gè)就類似HTML里的<HTML>開頭標(biāo)記。注意,這個(gè)名稱是自己隨便定義的。

再下面定義了四個(gè)子元素:title,author,email,和date。分別說明文章的標(biāo)題,作者,郵箱和日期。當(dāng)然,你可以用中文來定義這些標(biāo)簽,看上去更便于理解:

<?xmlversion="1.0"encoding="GB2312"?>

<文章>

<標(biāo)題>XML輕松學(xué)習(xí)手冊(cè)</標(biāo)題>

<作者>ajie</作者>

<信箱>ajie@</信箱>

<日期>20010115</日期>

</文章>2023/2/105/2054.1XML快速入門學(xué)習(xí)XML還必須掌握一種頁面腳本語言,常見的就是javascript和VBscript。因?yàn)閄ML數(shù)據(jù)是使用script實(shí)現(xiàn)HTML中調(diào)用和交互的。我們看一個(gè)最簡單的例子:實(shí)例4.1.html

2023/2/106/2054.1XML快速入門4.1.3XML和HTML的區(qū)別 XML和HTML都來自于SGML,它們都含有標(biāo)記,有著相似的語法,HTML和XML的最大區(qū)別在于:HTML是一個(gè)定型的標(biāo)記語言,它用固有的標(biāo)記來描述,顯示網(wǎng)頁內(nèi)容。比如<H1>表示首行標(biāo)題,有固定的尺寸。相對(duì)的,XML則沒有固定的標(biāo)記,XML不能描述網(wǎng)頁具體的外觀,內(nèi)容,它只是描述內(nèi)容的數(shù)據(jù)形式和結(jié)構(gòu)。

一個(gè)質(zhì)的區(qū)別:網(wǎng)頁將數(shù)據(jù)和顯示混在一起,而XML則將數(shù)據(jù)和顯示分開來。

在上面的例子4.1.htm中,我們只關(guān)心頁面的顯示方式,我們可以設(shè)計(jì)不同的界面,用不同的方式來排版頁面,但數(shù)據(jù)是儲(chǔ)存在myfile.xml中,不需要任何改變。

(如果你是程序員,你會(huì)驚訝的發(fā)現(xiàn),這與模塊化面向?qū)ο缶幊痰乃枷霕O其相似!其實(shí)網(wǎng)頁何嘗不是一種程序呢?)

正是這種區(qū)別使得XML在網(wǎng)絡(luò)應(yīng)用和信息共享上方便,高效,可擴(kuò)展。所以我們相信,XML做為一種先進(jìn)的數(shù)據(jù)處理方法,將使網(wǎng)絡(luò)跨越到一個(gè)新的境界。2023/2/107/2054.1XML快速入門4.1.4XML的嚴(yán)格格式

吸取HTML松散格式帶來的經(jīng)驗(yàn)教訓(xùn),XML一開始就堅(jiān)持實(shí)行"良好的格式"。

我們先看HTML的一些語句,這些語句在HTML中隨處可見:

1.<p>sample

2.<b><i>sample</b></i>

3.<td>sample</TD>

4.<fontcolor=red>samplar</font>

在XML文檔中,上述幾種語句的語法都是錯(cuò)誤的。因?yàn)?

1.所有的標(biāo)記都必須要有一個(gè)相應(yīng)的結(jié)束標(biāo)記;

2.所有的XML標(biāo)記都必須合理嵌套;

3.所有XML標(biāo)記都區(qū)分大小寫;

4.所有標(biāo)記的屬性必須用""括起來;2023/2/108/2054.1XML快速入門所以上列語句在XML中正確的寫法是

1.<p>sample</p>

2.<b><i>sample</i></b>

3.<td>sample</td>

4.<fontcolor="red">samplar</font>

另外,XML標(biāo)記必須遵循下面的命名規(guī)則:

1.名字中可以包含字母、數(shù)字以及其它字母;

2.名字不能以數(shù)字或"_"(下劃線)開頭;

3.名字不能以字母xml(或XML或Xml..)開頭;

4.名字中不能包含空格。

在XML文檔中任何的差錯(cuò),都會(huì)得到同一個(gè)結(jié)果:網(wǎng)頁不能被顯示。各瀏覽器開發(fā)商已經(jīng)達(dá)成協(xié)議,對(duì)XML實(shí)行嚴(yán)格而挑剔的解析,任何細(xì)小的錯(cuò)誤都會(huì)被報(bào)告。你可以將上面的myfile.xml修改一下,比如將<email>改為<Email>,會(huì)得到一個(gè)出錯(cuò)信息頁面2023/2/109/2054.2XML概念XML(ExtensibleMarkupLanguage)4.2.1擴(kuò)展性---可以為自己的文檔建立自己的標(biāo)記(tags)。 在HTML里,有許多固定的標(biāo)記,我們必須記住然后使用它們,你不能使用HTML規(guī)范里沒有的標(biāo)記。而在XML中,你能建立任何你需要的標(biāo)記。你可以充分發(fā)揮你的想象力,給你的文檔起一些好記的標(biāo)記名稱。比如,你的文檔里包含一些游戲的攻略,你可以建立一個(gè)名為<game>的標(biāo)記,然后在<game>下再根據(jù)游戲類別建立<RPG>,<SLG>等標(biāo)記。只要清晰,易于理解你可以建立任何數(shù)量的標(biāo)記。擴(kuò)展性使你有更多的選擇和強(qiáng)大的能力,但同時(shí)也產(chǎn)生一個(gè)問題就是你必須學(xué)會(huì)規(guī)劃。你自己要理解自己的文檔,知道它由哪幾部分組成,相互之間的關(guān)系和如何識(shí)別它們。

關(guān)于建立標(biāo)識(shí)還需要說明一點(diǎn):標(biāo)識(shí)是描述數(shù)據(jù)的類型或特性,比如寬<width>,年齡<age>,姓名<name>等,而不是數(shù)據(jù)的內(nèi)容,比如:<10pxl>,<18>,<張三>,這些都是無用的標(biāo)記。如果你學(xué)過數(shù)據(jù)庫,你可以這樣理解,標(biāo)識(shí)就是一種字段名。2023/2/1010/2054.2XML概念4.2.2標(biāo)識(shí)---使用XML你可以識(shí)別文檔中的元素不論你是HTML,還是XML,標(biāo)識(shí)的本質(zhì)在于便于理解,如果沒有標(biāo)識(shí),你的文檔在計(jì)算機(jī)看來只是一個(gè)很長的字符串,每個(gè)字看起來都一樣,沒有重點(diǎn)之分。

通過標(biāo)識(shí),你的文檔才便于閱讀和理解,你可以劃分段落,列明標(biāo)題。XML中,你更可以利用其擴(kuò)展性來為文檔建立更合適的標(biāo)識(shí)。

不過,有一點(diǎn)要提醒大家注意:標(biāo)識(shí)僅僅是用來識(shí)別信息,它本身并不傳達(dá)信息。例如這樣的HTML代碼:

<b>friststep<b>

這里<b>表示粗體,只用來說明是用粗體來顯示"friststep"字符,<b>本身并不包含任何實(shí)際的信息,在頁面上你看不到<b>,真正傳達(dá)信息的是"friststep"。2023/2/1011/2054.2XML概念4.2.3語言---使用XML你要遵循特定的語法來標(biāo)識(shí)你的文檔 XML第三個(gè)詞是"語言"。這表明了作為一種語言XML必須遵循一定的規(guī)則。雖然XML的擴(kuò)展性允許你創(chuàng)建新標(biāo)識(shí),但它仍然必須遵循特定的結(jié)構(gòu),語法和明確的定義。

在計(jì)算機(jī)領(lǐng)域,語言常常表示一種"程序語言",用來編程實(shí)現(xiàn)一些功能和應(yīng)用,但不是所有的"語言"都是用來編程的,XML就只是一種用來定義標(biāo)識(shí)和描述信息的語言。

2023/2/1012/2054.2XML概念4.2.4結(jié)構(gòu)化---XML促使文檔結(jié)構(gòu)化,所有的信息按某種關(guān)系排列。

"結(jié)構(gòu)化"聽起來太抽象了,我們這樣理解,結(jié)構(gòu)化就是為你的文檔建立一個(gè)框架,就象寫文章先寫一個(gè)提綱。結(jié)構(gòu)化使你的文檔看起來不會(huì)雜亂無章,每一部分都緊密聯(lián)系,形成一個(gè)整體。

結(jié)構(gòu)化有兩個(gè)原則:

1.每一部分(每一個(gè)元素)都和其他元素有關(guān)聯(lián)。關(guān)聯(lián)的級(jí)數(shù)就形成了結(jié)構(gòu)。

2.標(biāo)識(shí)本身的含義與它描述的信息相分離。

我們來看一個(gè)簡單的例子幫助理解:

<?xmlversion="1.0"encoding="GB2312"?>

<myfile>

<title>XML輕松學(xué)習(xí)手冊(cè)</title>

<chapter>XML快速入門

<para>什么是XML</para>

<para>使用XML的好處</para>

</chapter>

<chapter>XML的概念

<para>擴(kuò)展性</para>

<para>標(biāo)識(shí)</para>

</chapter>

</myfile>2023/2/1013/2054.2XML概念這是本文的XML描述文檔,可以看到標(biāo)識(shí)分三級(jí)關(guān)聯(lián),非常清晰:

<myfile>

<chapter>

<para>

...

</para>

</chapter>

</myfile>

上面這樣的文檔結(jié)構(gòu),我們又稱之為"文檔樹",主干是父元素,如<myfile>,分支和頁是子元素,如<chapter>和<para>2023/2/1014/2054.2XML概念4.2.5Meta數(shù)據(jù)(Metadata)-專業(yè)的XML使用者會(huì)使用meta數(shù)據(jù)來工作

在HTML中我們知道可以使用meta標(biāo)識(shí)來定義網(wǎng)頁的關(guān)鍵字,簡介等,這些標(biāo)識(shí)不會(huì)顯示在網(wǎng)頁中,但可以被搜索引擎搜索到,并影響搜索結(jié)果的排列順序。

XML對(duì)這一原理進(jìn)行了深化和擴(kuò)展,用XML,你可以描述你的信息在哪里,你可以通過meta來驗(yàn)證信息,執(zhí)行搜索,強(qiáng)制顯示,或者處理其他的數(shù)據(jù)。

下面是一些XMLmetadata在實(shí)際應(yīng)用中的用途:

1.可以驗(yàn)證數(shù)字簽名,使在線商務(wù)的提交動(dòng)作(submission)有效。

2.可以被方便的建立索引和進(jìn)行更有效搜索。

3.可以在不同語言之間傳輸數(shù)據(jù)。

2023/2/1015/2054.2XML概念4.2.6顯示單獨(dú)用XML不能顯示頁面,我們使用格式化技術(shù),比如CSS或者XSL,才能顯示XML標(biāo)記創(chuàng)建的文檔。

我們?cè)谇懊嬷v到XML是將數(shù)據(jù)和格式分離的。XML文檔本身不知道如何來顯示,必須有輔助文件來幫助實(shí)現(xiàn)。(XML取消了所有標(biāo)識(shí),包括font,color,p等風(fēng)格樣式定義標(biāo)識(shí),因此XML全部是采用類似DHTML中CSS的方法來定義文檔風(fēng)格樣式。),XML中用來設(shè)定顯示風(fēng)格樣式的文件類型有:

1.XSL

XSL全稱是ExtensibleStylesheetLanguage(可擴(kuò)展樣式語言),是將來設(shè)計(jì)XML文檔顯示樣式的主要文件類型。它本身也是基于XML語言的。使用XSL,你可以靈活的設(shè)置文檔顯示樣式,文檔將自動(dòng)適應(yīng)任何瀏覽器和PDA(掌上電腦)。

XSL也可以將XML轉(zhuǎn)化為HTML,那樣,老的瀏覽器也可以瀏覽XML文檔了。

2.CSS

CSS大家很熟悉了,全稱是CascadingStyleSheets(層疊樣式表),是目前用來在瀏覽器上顯示XML文檔的主要方法。

3.Behaviors

Behaviors現(xiàn)在還沒有成為標(biāo)準(zhǔn)。它是微軟的IE瀏覽器特有的功能,用它可以對(duì)XML標(biāo)識(shí)設(shè)定一些有趣動(dòng)作。2023/2/1016/2054.2XML概念4.2.7DOM

DOM全稱是documentobjectmodel(文檔對(duì)象模型),DOM是用來干什么的呢?假設(shè)把你的文檔看成一個(gè)單獨(dú)的對(duì)象,DOM就是如何用HTML或者XML對(duì)這個(gè)對(duì)象進(jìn)行操作和控制的標(biāo)準(zhǔn)。

面向?qū)ο蟮乃枷敕椒ㄒ呀?jīng)非常流行了,在編程語言(例如java,js)中,都運(yùn)用面向?qū)ο蟮木幊趟枷搿T赬ML中,就是要將網(wǎng)頁也作為一個(gè)對(duì)象來操作和控制,我們可以建立自己的對(duì)象和模板。與對(duì)象進(jìn)行交流,如何命令對(duì)象,就要用到API。API全稱ApplicationProgrammingInterface,它是訪問和操作對(duì)象的規(guī)則。而DOM就是一種詳細(xì)描述HTML/XML文檔對(duì)象規(guī)則的API。它規(guī)定了HTML/XML文檔對(duì)象的命名協(xié)定,程序模型,溝通規(guī)則等。在XML文檔中,我們可以將每一個(gè)標(biāo)識(shí)元素看作一個(gè)對(duì)象---它有自己的名稱和屬性。

XML創(chuàng)建了標(biāo)識(shí),而DOM的作用就是告訴script如何在瀏覽器窗口中操作和顯示這些標(biāo)識(shí)2023/2/1017/2054.2XML概念

1.XML描述數(shù)據(jù)類型。例如:"Kinglear"是一個(gè)標(biāo)題元素;

2.CSS儲(chǔ)存并控制元素的顯示樣式。例如:標(biāo)題將被以18pt字體顯示

3.script腳本控制元素如何動(dòng)作。例如:當(dāng)一個(gè)title元素"outofstock",將被用紅色顯示。

4.DOM則為腳本和對(duì)象的交流提供一個(gè)公共平臺(tái),并將結(jié)果顯示在瀏覽器窗口。

如果任何一個(gè)部分發(fā)生錯(cuò)誤,都不會(huì)得到正確結(jié)果。2023/2/1018/2054.3XML的術(shù)語4.3.1XML文檔的有關(guān)術(shù)語

什么是XML文檔?知道HTML原代碼文件吧,XML文檔就是用XML標(biāo)識(shí)寫的XML原代碼文件。XML文檔也是ASCII的純文本文件,你可以用Notepad創(chuàng)建和修改。XML文檔的后綴名為.XML,例如myfile.xml。用IE5.0以上瀏覽器也可以直接打開.xml文件,但你看到的就是"XML原代碼",而不會(huì)顯示頁面內(nèi)容。你可以將下面代碼存為myfile.xml試試:

<?xmlversion="1.0"encoding="GB2312"?>

<myfile>

<title>XML輕松學(xué)習(xí)手冊(cè)</title>

<author>ajie</author>

<email>ajie@</email>

<date>20010115</date>

</myfile>

XML文檔包含三個(gè)部分:

1.一個(gè)XML文檔聲明;

2.一個(gè)關(guān)于文檔類型的定義;

3.用XML標(biāo)識(shí)創(chuàng)建的內(nèi)容2023/2/1019/2054.3XML的術(shù)語1.Element(元素):

元素在HTML我們已經(jīng)有所了解,它是組成HTML文檔的最小單位,在XML中也一樣。一個(gè)元素由一個(gè)標(biāo)識(shí)來定義,包括開始和結(jié)束標(biāo)識(shí)以及其中的內(nèi)容,就象這樣:<author>ajie</author>

唯一不同的就是:在HTML中,標(biāo)識(shí)是固定的,而在XML中,標(biāo)識(shí)需要你自己創(chuàng)建。2.Tag(標(biāo)識(shí))

標(biāo)識(shí)是用來定義元素的。在XML中,標(biāo)識(shí)必須成對(duì)出現(xiàn),將數(shù)據(jù)包圍在中間。標(biāo)識(shí)的名稱和元素的名稱是一樣的。例如這樣一個(gè)元素:

<author>ajie</author>

其中<author>就是標(biāo)識(shí)。

3.Attribute(屬性):

什么是屬性?看這段HTML代碼:<fontcolor="red">word</font>。其中color就是font的屬性之一。

屬性是對(duì)標(biāo)識(shí)進(jìn)一步的描述和說明,一個(gè)標(biāo)識(shí)可以有多個(gè)屬性,例如font的屬性還有size。XML中的屬性與HTML中的屬性是一樣的,每個(gè)屬性都有它自己的名字和數(shù)值,屬性是標(biāo)識(shí)的一部分。舉例:

<authorsex="female">ajie</author>

XML中屬性也是自己定義的,我們建議你盡量不使用屬性,而將屬性改成子元素,例如上面的代碼可以改成這樣:

<author>ajie

<sex>female</sex>

</author>

原因是屬性不易擴(kuò)充和被程序操作。2023/2/1020/2054.3XML的術(shù)語4.Declaration(聲明)

在所有XML文檔的第一行都有一個(gè)XML聲明。這個(gè)聲明表示這個(gè)文檔是一個(gè)XML文檔,它遵循的是哪個(gè)XML版本的規(guī)范。一個(gè)XML的聲明語句就象這樣:

<?xmlversion=“1.0”?>5.DTD(文件類型定義)

DTD是用來定義XML文檔中元素,屬性以及元素之間關(guān)系的。

通過DTD文件可以檢測XML文檔的結(jié)構(gòu)是否正確。但建立XML文檔并不一定需要DTD文件。關(guān)于DTD文件的詳細(xì)說明我們將在下面單獨(dú)列項(xiàng)。

2023/2/1021/2054.3XML的術(shù)語6.Well-formedXML(良好格式的XML)

一個(gè)遵守XML語法規(guī)則,并遵守XML規(guī)范的文檔稱之為“良好格式”。如果你所有的標(biāo)識(shí)都嚴(yán)格遵守XML規(guī)范,那么你的XML文檔就不一定需要DTD文件來定義它。

良好格式的文檔必須以一個(gè)XML聲明開始,例如:

<?xmlversion=“1.0”standalone=“yes”encoding=“UTF-8”?>

其中你必須說明文檔遵守的XML版本,目前是1.0;其次說明文檔是“獨(dú)立的”,它不需要DTD文件來驗(yàn)證其中的標(biāo)識(shí)是否有效;第三,要說明文檔所使用的語言編碼。默認(rèn)的是UTF-8,如果使用中文,你需要設(shè)置為GB2312。

良好格式的XML文檔必須有一個(gè)根元素,就是緊接著聲明后面建立的第一個(gè)元素,其它元素都是這個(gè)根元素的子元素,屬于根元素一組。

良好格式的XML文檔的內(nèi)容書寫時(shí)必須遵守XML語法。(有關(guān)XML語法我們將在下一節(jié)仔細(xì)講解)

2023/2/1022/2054.3XML的術(shù)語7.ValidXML(有效的XML)

一個(gè)遵守XML語法規(guī)則,并遵守相應(yīng)DTD文件規(guī)范的XML文檔稱為有效的XML文檔。注意我們比較"Well-formedXML"和"ValidXML",它們最大的差別在于一個(gè)完全遵守XML規(guī)范,一個(gè)則有自己的"文件類型定義(DTD)"。

將XML文檔和它的DTD文件進(jìn)行比較分析,看是否符合DTD規(guī)則的過程叫validation(確認(rèn))。這樣的過程通常我們是通過一個(gè)名為parser的軟件來處理的。

有效的XML文檔也必須以一個(gè)XML聲明開始,例如:

<?xmlversion="1.0"standalone="no"encode="UTF-8"?>

和上面例子不同的,在standalone(獨(dú)立)屬性中,這里設(shè)置的是"no",因?yàn)樗仨毢拖鄳?yīng)的DTD一起使用,DTD文件的定義方法如下:

<!DOCTYPEtype-of-docSYSTEM/PUBLIC"dtd-name">

其中:

"!DOCTYPE"是指你要定義一個(gè)DOCTYPE;

"type-of-doc"是文檔類型的名稱,由你自己定義,通常與DTD文件名相同;

"SYSTEM/PUBLIC"這兩個(gè)參數(shù)只用其一。SYSTEM是指文檔使用的私有DTD文件的網(wǎng)址,而PUBLIC則指文檔調(diào)用一個(gè)公用的DTD文件的網(wǎng)址。

"dtd-name"就是DTD文件的網(wǎng)址和名稱。所有DTD文件的后綴名為".dtd"。

我們還是用上面的例子,應(yīng)該寫成這樣:

<?xmlversion="1.0"standalone="no"encode="UTF-8"?>

<!DOCTYPEfilelistSYSTEM"filelist.dtd">

2023/2/1023/2054.3XML的術(shù)語4.3.2DTD的有關(guān)術(shù)語什么是DTD,文檔類型定義(DocumentTypeDefinition)我們上面已經(jīng)簡略提到。DTD是一種保證XML文檔格式正確的有效方法,可以比較XML文檔和DTD文件來看文檔是否符合規(guī)范,元素和標(biāo)簽使用是否正確。一個(gè)DTD文檔包含:元素的定義規(guī)則,元素間關(guān)系的定義規(guī)則,元素可使用的屬性,可使用的實(shí)體或符號(hào)規(guī)則。 DTD文件也是一個(gè)ASCII的文本文件,后綴名為.dtd。 例如:myfile.dtd。

為什么要用DTD文件呢?它滿足了網(wǎng)絡(luò)共享和數(shù)據(jù)交互,使用DTD最大的好處在于DTD文件的共享。(就是上文DTD說明語句中的PUBLIC屬性)。比如,兩個(gè)相同行業(yè)不同地區(qū)的人使用同一個(gè)DTD文件來作為文檔創(chuàng)建規(guī)范,那么他們的數(shù)據(jù)就很容易交換和共享。網(wǎng)上有其他人想補(bǔ)充數(shù)據(jù),也只需要根據(jù)公用的DTD規(guī)范來建立文檔,就立刻可以加入。

第4章目錄2023/2/1024/2054.3XML的術(shù)語目前,已經(jīng)有數(shù)量眾多的寫好的DTD文件可以利用。針對(duì)不同的行業(yè)和應(yīng)用,這些DTD文件已經(jīng)建立了通用的元素和標(biāo)簽規(guī)則。你不需要自己重新創(chuàng)建,只要在他們的基礎(chǔ)上加入你需要的新標(biāo)識(shí)。

當(dāng)然,如果愿意,你可以創(chuàng)建自己的DTD,它可能和你的文檔配合的更加完美。建立自己的DTD也是很簡單的一件事,一般只需要定義4-5個(gè)元素就可以了。

第4章目錄2023/2/1025/2054.3XML的術(shù)語調(diào)用DTD文件的方法有兩種:1.直接包含在XML文檔內(nèi)的DTD

你只要在DOCTYPE聲明中插入一些特別的說明就可以了,象這樣:

我們有一個(gè)XML文檔:

<?xmlversion="1.0"encoding="GB2312"?>

<myfile>

<title>XML輕松學(xué)習(xí)手冊(cè)</title>

<author>ajie</author>

</myfile>

我們?cè)诘谝恍泻竺娌迦胂旅娲a就可以:

<!DOCTYPEmyfile[

<!ELEMENTtitle(#PCDATA)>

<!ELEMENTauthor(#PCDATA)>

<!ENTITYcopyright"Copyright2001,Ajie.">

]>

第4章目錄2023/2/1026/2054.3XML的術(shù)語2.調(diào)用獨(dú)立的DTD文件

將DTD文檔存為.dtd的文件,然后在DOCTYPE聲明行中調(diào)用,例如,將下面的代碼存為myfile.dtd

<!ELEMENTmyfile(title,author)>

<!ELEMENTtitle(#PCDATA)>

<!ELEMENTauthor(#PCDATA)>

然后在XML文檔中調(diào)用,在第一行后插入:

<!DOCTYPEmyfileSYSTEM"myfile.dtd">

第4章目錄2023/2/1027/2054.3XML的術(shù)語DTD有關(guān)的術(shù)語:1.Schema(規(guī)劃)

schema是數(shù)據(jù)規(guī)則的描述。schema做兩件事:

a.它定義元素?cái)?shù)據(jù)類型和元素之間的關(guān)系;

b.它定義元素所能包含的內(nèi)容類型。

DTD就是關(guān)于XML文檔的一個(gè)schema。2.DocumentTree(文檔樹)

“文檔樹”在前面第二章我們已經(jīng)提到過,它是文檔元素分級(jí)結(jié)構(gòu)的形象表示。一個(gè)文檔結(jié)構(gòu)樹包含根元素,根元素是最頂級(jí)的元素,(就是緊接著XML聲明語句后的第一個(gè)元素)??蠢樱?/p>

<?xmlversion=“1.0”?>

<filelist>

<myfile>

<title>...</title>

<author>...</author>

</myfile>

</filelist>

上面的例子分三級(jí)結(jié)構(gòu)排列成"樹"狀,其中的<filelist>就是根元素。在XML和DTD文件中,第一個(gè)定義的都是根元素。第4章目錄2023/2/1028/2054.3XML的術(shù)語3.ParentElement(父元素)/ChildElement(子元素)

父元素是指包含有其它元素的元素,被包含的元素稱為它的子元素??瓷厦娴摹敖Y(jié)構(gòu)樹”,其中<myfile>是父元素,<title>,<author>是它的子元素,而<myfile>又是<filelist>的子元素。象<title>這樣沒有包含任何子元素的最后一級(jí)元素我們也稱之為“頁元素”。4.Parser(解析軟件)

Parser是一種檢查XML文檔是否遵循DTD規(guī)范的工具軟件。

XML的parser發(fā)展為兩類:一種是"非確認(rèn)類parser",只檢測文檔是否遵守XML語法規(guī)則,是否用元素標(biāo)識(shí)建立了文檔樹。另一種是"確認(rèn)類parser",它不但檢測文檔語法,結(jié)構(gòu)樹,而且比較解析你使用的元素標(biāo)識(shí)是否遵守了相應(yīng)DTD文件的規(guī)范。

Parser能獨(dú)立使用,也可以成為編輯軟件或?yàn)g覽器的一部分。http://validator./

W3C組織提供的一個(gè)在線parser。可以根據(jù)你在線提交的XML文檔URL,進(jìn)行驗(yàn)證和解吸。

有很多可以下載到本機(jī)上運(yùn)行的parser,下面列出一些主要的:

/xml/expat.html

JamesClark是在SGML/XML領(lǐng)域的元老,他寫的parser被廣泛的運(yùn)用。

/tech/xml

一個(gè)以Java語言編寫的Parser,來自IBM。

/xml/parser/cparser.asp

微軟的XMLParser,用C++寫成。第4章目錄2023/2/1029/2054.4XML語法4.4.1XML語法規(guī)則

XML的文檔和HTML的原代碼類似,也是用標(biāo)識(shí)來標(biāo)識(shí)內(nèi)容。創(chuàng)建XML文檔必須遵守下列重要規(guī)則:

規(guī)則1:必須有XML聲明語句 聲明是XML文檔的第一句,其格式如下:

<?xmlversion="1.0"standalone="yes/no"encoding="UTF-8"?>

聲明的作用是告訴瀏覽器或者其它處理程序:這個(gè)文檔是XML文檔。聲明語句中的version表示文檔遵守的XML規(guī)范的版本;standalone表示文檔是否附帶DTD文件,如果有,參數(shù)為no;encoding表示文檔所用的語言編碼,默認(rèn)是UTF-8。第4章目錄2023/2/1030/2054.4XML語法規(guī)則2:是否有DTD文件

如果文檔是一個(gè)“有效的XML文檔”(見上一章),那么文檔一定要有相應(yīng)DTD文件,并且嚴(yán)格遵守DTD文件制定的規(guī)范。DTD文件的聲明語句緊跟在XML聲明語句后面,格式如下:

<!DOCTYPEtype-of-docSYSTEM/PUBLIC“dtd-name”>

其中:

“!DOCTYPE”是指你要定義一個(gè)DOCTYPE;

“type-of-doc”是文檔類型的名稱,由你自己定義,通常于DTD文件名相同;

“SYSTEM/PUBLIC”這兩個(gè)參數(shù)只用其一。SYSTEM是指文檔使用的私有DTD文件的網(wǎng)址,而PUBLIC則指文檔調(diào)用一個(gè)公用的DTD文件的網(wǎng)址。

“dtd-name”就是DTD文件的網(wǎng)址和名稱。所有DTD文件的后綴名為“.dtd”。應(yīng)該寫成這樣:

<?xmlversion="1.0"standalone="no"encode="UTF-8"?>

<!DOCTYPEfilelistSYSTEM"filelist.dtd">

第4章目錄2023/2/1031/2054.4XML語法規(guī)則3:注意你的大小寫

在XML文檔中,大小寫是有區(qū)別的。<P>和<p>是不同的標(biāo)識(shí)。注意在寫元素時(shí),前后標(biāo)識(shí)大小寫要保持一樣。例如:<Author>ajie</Author>,寫成<Author>ajie</author>是錯(cuò)誤的。

你最好養(yǎng)成一種習(xí)慣,或者全部大寫,或者全部小寫,或者大寫第一個(gè)字母。這樣可以減少因?yàn)榇笮懖黄ヅ洚a(chǎn)生的文檔錯(cuò)誤。規(guī)則4:給屬性值加引號(hào)

在HTML代碼里面,屬性值可以加引號(hào),也可以不加。例如:<fontcolor=red>word</font>和<fontcolor="red">word</font>都可以被瀏覽器正確解釋。

但是在XML中則規(guī)定,所有屬性值必須加引號(hào),否則將被視為錯(cuò)誤。

第4章目錄2023/2/1032/2054.4XML語法規(guī)則5:所有的標(biāo)識(shí)必須有相應(yīng)的結(jié)束標(biāo)識(shí)

在HTML中,標(biāo)識(shí)可能不是成對(duì)出現(xiàn)的,比如<br>。而在XML中規(guī)定,所有標(biāo)識(shí)必須成對(duì)出現(xiàn),有一個(gè)開始標(biāo)識(shí),就必須有一個(gè)結(jié)束標(biāo)識(shí)。否則將被視為錯(cuò)誤。規(guī)則6:所有的空標(biāo)識(shí)也必須被關(guān)閉

空標(biāo)識(shí)就是標(biāo)識(shí)對(duì)之間沒有內(nèi)容的標(biāo)識(shí)。比如<br>,<img>等標(biāo)識(shí)。在XML中,規(guī)定所有的標(biāo)識(shí)必須有結(jié)束標(biāo)識(shí),針對(duì)這樣的空標(biāo)識(shí),XML中處理的方法是在原標(biāo)識(shí)最后加/,就可以了。例如:

<br>應(yīng)寫為<br/>;

<METAname="keywords"content="XML,SGML,HTML">應(yīng)寫為<METAname="keywords"content="XML,SGML,HTML"/>;

<IMGsrc="/project/cool.gif">應(yīng)寫為<IMGsrc="/project/cool.gif"/>第4章目錄2023/2/1033/2054.4XML語法4.4.2元素的語法

元素由一對(duì)標(biāo)識(shí)以及其中的內(nèi)容組成元素的名稱和標(biāo)識(shí)的名稱是一樣的。標(biāo)識(shí)可以用屬性來進(jìn)一步描述。

在XML中,沒有任何保留字,所以你可以隨心所欲的用任何詞語來作為元素名稱。但是也必須遵守下列規(guī)范:

1.名稱中可以包含字母、數(shù)字以及其它字母;

2.名稱不能以數(shù)字或"_"(下劃線)開頭;

3.名稱不能以字母xml(或XML或Xml..)開頭

4.名稱中不能包含空格

5.名稱中間不能包含":"(冒號(hào))

第4章目錄2023/2/1034/2054.4XML語法為了使元素更容易閱讀理解和操作,我們還有一些建議:

1.名稱中不要使用"."。因?yàn)樵诤芏喑绦蛘Z言中,"."是作為對(duì)象的屬性,例如:font.color。同樣的原因"-"也最好不要用,必須使用的,以"_"代替;

2.名稱盡量簡短。

3.名稱的大小寫盡量采用同一標(biāo)準(zhǔn)。

4.名稱可以使用非英文字符,比如用中文。但是有些軟件可能不支持。(IE5目前是支持中文元素的。)

另外,補(bǔ)充一點(diǎn)關(guān)于屬性的說明。在HTML中,屬性可以用來定義元素的顯示格式,比如:<fontcolor="red">word</font>將把word顯示為紅色。而在XML中,屬性只是對(duì)標(biāo)識(shí)的描述,與元素內(nèi)容的顯示無關(guān)。例如同樣一句:<fontcolor="red">word</font>,并不會(huì)將word顯示為紅色。第4章目錄2023/2/1035/2054.4XML語法4.4.3注釋的語法

注釋是為了便于閱讀和理解,在XML文檔添加的附加信息,將不會(huì)被程序解釋或則瀏覽器顯示。

注釋的語法如下:

<!--這里是注釋信息-->

可以看到,它和HTML中的注釋語法是一樣的,非常容易。養(yǎng)成良好的注釋習(xí)慣將使你的文檔更加便于維護(hù),共享,看起來也更專業(yè)。

第4章目錄2023/2/1036/2054.4XML語法4.4.4CDATA的語法

CDATA全稱characterdata,翻譯為字符數(shù)據(jù)。我們?cè)趯慩ML文檔時(shí),有時(shí)需要顯示字母,數(shù)字和其它的符號(hào)本身,比如“<”,而在XML中,這些字符已經(jīng)有特殊的含義,我們?cè)趺崔k呢?這就需要用到CDATA語法。語法格式如下:

<![CDATA[這里放置需要顯示的字符]]>

例如:

<![CDATA[<AUTHORsex=“female”>ajie</AUTHOR>]]>

在頁面上顯示的內(nèi)容將是"<AUTHORsex="female">ajie</AUTHOR>"第4章目錄2023/2/1037/2054.4XML語法4.4.5Namespaces的語法當(dāng)我們?cè)谝粋€(gè)XML文檔中使用他人的或者多個(gè)DTD文件,就會(huì)出現(xiàn)這樣的矛盾:

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論