數(shù)據(jù)管理之web數(shù)據(jù)管理-PPT精選課件_第1頁(yè)
數(shù)據(jù)管理之web數(shù)據(jù)管理-PPT精選課件_第2頁(yè)
數(shù)據(jù)管理之web數(shù)據(jù)管理-PPT精選課件_第3頁(yè)
數(shù)據(jù)管理之web數(shù)據(jù)管理-PPT精選課件_第4頁(yè)
數(shù)據(jù)管理之web數(shù)據(jù)管理-PPT精選課件_第5頁(yè)
已閱讀5頁(yè),還剩16頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、數(shù)據(jù)管理之web數(shù)據(jù)管理什么是數(shù)據(jù)管理?數(shù)據(jù)管理是利用計(jì)算機(jī)硬件和軟件技術(shù)對(duì)數(shù)據(jù)進(jìn)行有效的收集、存儲(chǔ)、處理和應(yīng)用的過(guò)程。什么是web數(shù)據(jù)管理?Web是數(shù)據(jù)庫(kù)嗎?結(jié)構(gòu)化數(shù)據(jù):傳統(tǒng)的關(guān)系數(shù)據(jù)模型、行數(shù)據(jù),存儲(chǔ)于數(shù)據(jù)庫(kù),可用二維表結(jié)構(gòu)表示。數(shù)據(jù)模型:二維表半結(jié)構(gòu)化數(shù)據(jù):類(lèi)似XML、HTML之類(lèi),自描述,數(shù)據(jù)結(jié)構(gòu)和內(nèi)容混雜在一起。數(shù)據(jù)模型:樹(shù)、圖非結(jié)構(gòu)化數(shù)據(jù):各種文檔、圖片、視頻/音頻等。數(shù)據(jù)模型:無(wú)數(shù)據(jù)種類(lèi)Web數(shù)據(jù)管理的內(nèi)容主要包括:1.Web數(shù)據(jù)管理中的數(shù)據(jù)組織2.Web上的信息集成3.Web查詢(xún)4.Web信息發(fā)布5.Web數(shù)據(jù)挖掘如果說(shuō)web是一個(gè)巨大的數(shù)據(jù)庫(kù),那么xml與半結(jié)構(gòu)化數(shù)據(jù)的結(jié)合為

2、web數(shù)據(jù)管理和應(yīng)用提供了一種新的解決方案。認(rèn)識(shí)XMLXML(Extensible Markup Language)可擴(kuò)展標(biāo)記語(yǔ)言,標(biāo)準(zhǔn)通用標(biāo)記語(yǔ)言(SGML)的子集,是一種用于標(biāo)記電子文件使其具有結(jié)構(gòu)性的標(biāo)記語(yǔ)言。它可以用來(lái)標(biāo)記數(shù)據(jù)、定義數(shù)據(jù)類(lèi)型,是一種允許用戶(hù)對(duì)自己的標(biāo)記語(yǔ)言進(jìn)行定義的源語(yǔ)言。 它非常適合萬(wàn)維網(wǎng)傳輸,提供統(tǒng)一的方法來(lái)描述和交換獨(dú)立于應(yīng)用程序或供應(yīng)商的結(jié)構(gòu)化數(shù)據(jù)。實(shí)例1:認(rèn)識(shí)XML文檔Xml文檔必須遵守的10條重要規(guī)則:1.必須有xml聲明語(yǔ)句2.是否有dtd或schemal文件3.注意大小寫(xiě)4.給屬性值加引號(hào)5.所有的標(biāo)記必須有相應(yīng)的結(jié)束標(biāo)記6.所有的空標(biāo)記必須被關(guān)閉7.必

3、須有且只有一個(gè)根元素8.標(biāo)記必須正確嵌套9.處理空白字符10.處理特殊字符XML的產(chǎn)生背景近年來(lái),隨著 Web的應(yīng)用越來(lái)越廣泛和深入,人們漸漸覺(jué)得HTML不夠用了,HTML過(guò)于簡(jiǎn)單的語(yǔ)法嚴(yán)重地阻礙了用它來(lái)表現(xiàn)復(fù)雜的形式。盡管HTML推出了一個(gè)又一個(gè)新版本,已經(jīng)有了腳本、表格、幀等表達(dá)功能,但始終滿(mǎn)足不了不斷增長(zhǎng)的需求。另一方面,這幾年來(lái)計(jì)算機(jī)技術(shù)的發(fā)展也十分迅速,已經(jīng)可以實(shí)現(xiàn)比當(dāng)初發(fā)明創(chuàng)造HTML時(shí)復(fù)雜得多的Web瀏覽器,所以開(kāi)發(fā)一種新的Web頁(yè)面語(yǔ)言既是必要的,也是可能的。有人建議直接使用SGML (Standard Generalized Markup Language)作為Web語(yǔ)言,這

4、固然能解決HTML遇到的困難。但是SGML太龐大了,用戶(hù)學(xué)習(xí)和使用不方便尚且不說(shuō),要全面實(shí)現(xiàn)SGML的瀏覽器就非常困難,于是自然會(huì)想到僅使用SGML的子集,使新的語(yǔ)言既方便使用又實(shí)現(xiàn)容易。正是在這種形勢(shì)下,Web標(biāo)準(zhǔn)化組織W3C建議使用一種精簡(jiǎn)的SGML版本-XML應(yīng)運(yùn)而生了。XML的優(yōu)勢(shì)便于信息的檢索支持不同文字語(yǔ)種間的信息交互良好的可讀性方便的可擴(kuò)展性數(shù)據(jù)內(nèi)容與其形式的分離可以輕松的跨平臺(tái)應(yīng)用大大改善網(wǎng)頁(yè)的超鏈接功能適合面向?qū)ο蟮某绦蜷_(kāi)發(fā)便于信息的長(zhǎng)期保存為科學(xué)實(shí)踐和交流提供捷徑XML的缺陷樹(shù)狀存儲(chǔ)雖然搜索效率極高,但是插入和修改比較困難。大數(shù)據(jù)量低效率XML的文本表現(xiàn)手法、標(biāo)記的符號(hào)化會(huì)

5、導(dǎo)致XML數(shù)據(jù)比二進(jìn)制表現(xiàn)數(shù)據(jù)量增加,尤其當(dāng)數(shù)據(jù)量很大的時(shí)候,效率就成為很大的問(wèn)題。管理功能不完善XML文檔做為數(shù)據(jù)提供著使用,沒(méi)有數(shù)據(jù)庫(kù)系統(tǒng)那樣完善的管理功能?;靵y與沖突由于XML是元置標(biāo)語(yǔ)言,任何人、公司和組織都可以利用它定義新的標(biāo)準(zhǔn),這些標(biāo)準(zhǔn)間的通信就成了巨大的問(wèn)題。XML的應(yīng)用數(shù)據(jù)交換Web集成數(shù)據(jù)庫(kù)應(yīng)用特定文檔的組織Web服務(wù)電子商務(wù)網(wǎng)絡(luò)出版系統(tǒng)配置文件XML的相關(guān)標(biāo)準(zhǔn)Xml模式定義:XML Schema什么是xml schema?可擴(kuò)展標(biāo)記語(yǔ)言架構(gòu)(XML Schema)是以可擴(kuò)展標(biāo)記語(yǔ)言(XML)為基礎(chǔ)的,它用于可替代文檔類(lèi)型定義(DTD);一份XML schema文件描述了可擴(kuò)

6、展標(biāo)記語(yǔ)言文檔的結(jié)構(gòu)。Xml schema定義和描述了xml文檔的結(jié)構(gòu)、內(nèi)容和語(yǔ)義,具體規(guī)定了一個(gè)xml文檔中可以包含哪些元素,這些元素又可以具有哪些子元素,并規(guī)定這些子元素出現(xiàn)的次數(shù)和順序等。另外,xml schema還具體規(guī)定了xml文檔中每個(gè)元素和屬性的數(shù)據(jù)類(lèi)型。 實(shí)例二:有效的XML文檔XML的相關(guān)標(biāo)準(zhǔn)Xml可擴(kuò)展樣式表:XSLXSL(Extensible Stylesheet Language)是一種標(biāo)記語(yǔ)言,表示如何將XML文檔的內(nèi)容轉(zhuǎn)換成另一種形式的文檔。通過(guò)為XML寫(xiě)XSL來(lái)使得XML顯示成不同的格式。XSL 包括三部分:XSLT - 一種用于轉(zhuǎn)換 XML 文檔的語(yǔ)言。XPat

7、h - 一種用于在 XML 文檔中導(dǎo)航的語(yǔ)言。XSL-FO - 一種用于格式化 XML 文檔的語(yǔ)言。 XML的相關(guān)標(biāo)準(zhǔn)什么是 XPath?XPath 使用路徑表達(dá)式在 XML 文檔中進(jìn)行導(dǎo)航XPath 包含一個(gè)標(biāo)準(zhǔn)函數(shù)庫(kù)XPath 是 XSLT 中的主要元素XPath 是一個(gè) W3C 標(biāo)準(zhǔn)XPath的路徑表達(dá)式無(wú)論是采用絕對(duì)路徑還是相對(duì)路徑,都包含一個(gè)或多個(gè)位置步,每個(gè)位置步都用斜杠分隔。XML的相關(guān)標(biāo)準(zhǔn)每個(gè)位置步包括三個(gè)部分:(1)軸:軸用來(lái)定義所選節(jié)點(diǎn)與當(dāng)前節(jié)點(diǎn)之間的樹(shù)關(guān)系。(2)節(jié)點(diǎn)測(cè)試:節(jié)點(diǎn)測(cè)試識(shí)別某個(gè)軸內(nèi)部的節(jié)點(diǎn)。(3)零個(gè)或者多個(gè)謂詞:謂詞更深入地提煉所選的節(jié)點(diǎn)集,謂詞可以沒(méi)有也可

8、以有多個(gè)。位置步的語(yǔ)法:軸名稱(chēng):節(jié)點(diǎn)測(cè)試謂詞位置路徑的一個(gè)縮寫(xiě):nodename 原語(yǔ)法:child:nodename 表示選取此節(jié)點(diǎn)的所有子節(jié)點(diǎn) 實(shí)例三:XML網(wǎng)頁(yè)顯示 XML的相關(guān)標(biāo)準(zhǔn)Xml鏈接:XLink語(yǔ)言和XPointer語(yǔ)言什么是 XLink?XLink 是 XML 鏈接語(yǔ)言(XML Linking Language)的縮寫(xiě)XLink 是用于在 XML 文檔中創(chuàng)建超級(jí)鏈接的語(yǔ)言XLink 類(lèi)似于 HTML 鏈接 - 但是更為強(qiáng)大XML 文檔中的任何元素均可成為 XLinkXLink 支持簡(jiǎn)易鏈接,也支持可將多重資源鏈接在一起的擴(kuò)展鏈接通過(guò) XLink,鏈接可在被鏈接文件外進(jìn)行定義

9、實(shí)例四:XLink的使用什么是 XPointer?XPointer 是 XML 指針文件(XML Pointer Language)的縮寫(xiě)XPointer 使超級(jí)鏈接可以指向 XML 文檔中更多具體的部分(片斷)XPointer 使用 XPath 表達(dá)式在 XML 文檔中進(jìn)行定位XPointer 是 W3C 推薦標(biāo)準(zhǔn)在2019年6月27日,XLink 被確立為 W3C 推薦標(biāo)準(zhǔn)。XPointer 于2019年3月25日成為 W3C 推薦標(biāo)準(zhǔn)。 實(shí)例五:XPointer的使用 XML的相關(guān)標(biāo)準(zhǔn)XML的相關(guān)標(biāo)準(zhǔn)Xml文檔對(duì)象模型:DOM和SAXXML的處理都是從解析開(kāi)始的,一個(gè)xml解析器是一段可

10、以讀入文檔并解析其結(jié)構(gòu)的代碼。xml解析器的主要功能就是檢查xml文件是否有結(jié)構(gòu)上的錯(cuò)誤,剝離xml文件中的標(biāo)記,讀出正確的內(nèi)容,并交給下一步應(yīng)用程序處理。在解析xml時(shí)(如瀏覽器解析html標(biāo)簽),主要存在兩種方式:SAX模式和DOM模式DOM和SAX是兩種常用的解析器接口,也就是API集合。幾乎所有商用的xml解析器都同時(shí)實(shí)現(xiàn)了這兩個(gè)接口。XML的相關(guān)標(biāo)準(zhǔn)實(shí)例六:用JAXP提供的類(lèi)和方法操作文本節(jié)點(diǎn)JAXP(Java API for XMLParsing)包括了標(biāo)準(zhǔn)SAX和DOMDOM和SAX的區(qū)別XML的相關(guān)標(biāo)準(zhǔn)XML的其他相關(guān)標(biāo)準(zhǔn):DTD(Document Type Definitio

11、n,文檔類(lèi)型定義)規(guī)范實(shí)際是XML規(guī)范的一部分,同時(shí)又是可選的:另外還有一個(gè)更加靈活的Schema可以替代它。RDF (Resource Description Framework)RDF一種用于描述Web資源的標(biāo)記語(yǔ)言。RDF使用XML語(yǔ)法和RDF Schema(RDFS)來(lái)將元數(shù)據(jù)描述成為數(shù)據(jù)模型。XQuery (XML Query)XQuery 被設(shè)計(jì)用來(lái)查詢(xún) XML 。XQuery 相對(duì)于 XML 的關(guān)系,等同于 SQL 相對(duì)于數(shù)據(jù)庫(kù)表的關(guān)系。總結(jié)XML逐漸成為因特網(wǎng)上數(shù)據(jù)表示和數(shù)據(jù)交換的新標(biāo)準(zhǔn)。XML用標(biāo)記表示數(shù)據(jù)的意義和數(shù)據(jù)實(shí)體之間的復(fù)雜嵌套關(guān)系,而不像HTML那樣,僅僅用來(lái)規(guī)定數(shù)據(jù)的顯示方式。所以,xml既可以表示結(jié)構(gòu)化的數(shù)據(jù),如關(guān)系和對(duì)象數(shù)據(jù),也能夠表示半結(jié)構(gòu)化的數(shù)據(jù),如web數(shù)據(jù)。XML將內(nèi)容和形式分離,使得那些將數(shù)據(jù)以xml格

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論