數(shù)據(jù)的分析與建模_第1頁
數(shù)據(jù)的分析與建模_第2頁
數(shù)據(jù)的分析與建模_第3頁
數(shù)據(jù)的分析與建模_第4頁
數(shù)據(jù)的分析與建模_第5頁
已閱讀5頁,還剩12頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

數(shù)據(jù)的分析與建模1數(shù)據(jù)的收集與分類1.數(shù)據(jù)的收集在數(shù)據(jù)庫設(shè)計中,數(shù)據(jù)收集最重要的方法是對現(xiàn)實系統(tǒng)進(jìn)行實地調(diào)查與分析,如走訪有關(guān)人員,了解現(xiàn)實系統(tǒng)的運(yùn)作過程,收集各種原始憑證,并弄清數(shù)據(jù)的來龍去脈等。例如,在“中小學(xué)信息技術(shù)大賽”中,報名表和作品是重要的數(shù)據(jù)來源,因此,應(yīng)將這些數(shù)據(jù)資料收集起來。實踐(1)假如你是這次“中小學(xué)信患技術(shù)大賽”數(shù)據(jù)庫的設(shè)計者,根據(jù)我們的任務(wù)和目的,思考系統(tǒng)的需求是什么,需要收集什么樣的數(shù)據(jù)信息,把你認(rèn)為需要的信息列舉出來。(2)以小組為單位,每個小組用主辦單位的名義,設(shè)計一張參賽選手的報名表。2.數(shù)據(jù)的分類為了管理的方便,防止選手重名和作品重名帶來的混淆,我們?yōu)閰①愡x手設(shè)計了“選手編號”;為參賽作品設(shè)計了“作品編號”。另外,信息技術(shù)大賽中的作品很多都是多媒體作品,多媒體作品通常容量很大,在數(shù)據(jù)庫中如何管理它們呢?用數(shù)據(jù)庫管理多媒體信息,通常有兩種方法:一種是在數(shù)據(jù)庫中只記錄這些作品的屬性和引用位置,多媒體作品本身還是以文件的方式管理;另外一種是將多媒體數(shù)據(jù)也保存到數(shù)據(jù)庫中。在本書“中小學(xué)信息技術(shù)大賽”數(shù)據(jù)庫中,我們采取前一種方法,在數(shù)據(jù)庫中只記錄作品的屬性和引用位置,而作品本身還是以文件的方式保存。因此,在參賽作品的信息中,我們添加上“作品鏈接地址”的信息。經(jīng)過分析,最后,我們可以將構(gòu)建“中小學(xué)信息技術(shù)大賽”數(shù)據(jù)庫所需的基本數(shù)據(jù)分為三類。(1)有關(guān)參賽選手的信息,如:選手編號、姓名、性別、學(xué)段、電子郵箱。(2)有關(guān)參賽作品的信息,如:作品編號、作品名稱、作品類別、作品鏈接、作品大小。(3)有關(guān)參賽學(xué)校的信息,如:學(xué)校名稱、地址、聯(lián)系電話、電子郵箱。實踐為了系統(tǒng)地歸納同學(xué)們已經(jīng)學(xué)過的歷史知識,方便今后的復(fù)習(xí)和查找資料,我們準(zhǔn)備創(chuàng)建一個“歷史知識”數(shù)據(jù)庫。要求能夠按歷史人物查找與之相關(guān)的事件,以及事件發(fā)生的時間、地點(diǎn)和事件介紹;按事件名稱查找相關(guān)的人物和事件介紹;按時間、地點(diǎn)查找當(dāng)時相關(guān)的人物、事件等等。根據(jù)以上要求,請列舉出你需要哪些信息,并對數(shù)據(jù)進(jìn)行分類。2數(shù)據(jù)的抽象描述1.現(xiàn)實世界客觀存在的世界就是現(xiàn)實世界,它獨(dú)立于人們的思想之外?,F(xiàn)實世界存在著無數(shù)事物,每一個客觀存在的事物都可以看作是一個對象,而對象又有許多特征。比如,學(xué)生有姓名、年齡、愛好等特征。2.信息世界信息世界是現(xiàn)實世界在人們頭腦中的反映,人的思維將現(xiàn)實世界的數(shù)據(jù)抽象化和概念化,并用文字符號表示出來,就形成了信息世界。下面是人們在研究信息世界過程中常常用到的術(shù)語:(1)實體。(2)屬性。(3)鍵。(4)聯(lián)系。實體集之間的聯(lián)系有三種:一對一聯(lián)系,一對多聯(lián)系,多對多聯(lián)系。3.機(jī)器世界機(jī)器世界又稱數(shù)據(jù)世界,信息世界中的信息經(jīng)過抽象和組織,以數(shù)據(jù)形式存儲在計算機(jī)中,就稱為機(jī)器世界。與信息世界一樣,機(jī)器世界也有其用來描述數(shù)椐的習(xí)慣術(shù)語,這些術(shù)語與信息世界中的術(shù)語有著對應(yīng)的關(guān)系。(1)字段。(2)記錄。(3)文件。(4)關(guān)鍵字。4.三個世界的術(shù)語對照現(xiàn)實世界中,個體與個體之間總是存在著某些聯(lián)系。反映到信息世界中,是實體與實體之間的聯(lián)系,由此構(gòu)成概念模型。反映到機(jī)器世界中,是記錄與記錄之間的聯(lián)系。而概念模型在機(jī)器世界中的數(shù)據(jù)化表示,就是數(shù)據(jù)模型。關(guān)于三個世界之間的術(shù)語對應(yīng)關(guān)系,可由下圖表示。對象特征總體關(guān)鍵特征事物及其聯(lián)系實體屬性實體集鍵概念模型記錄字段文件關(guān)鍵字?jǐn)?shù)據(jù)模型現(xiàn)實世界信息世界機(jī)器世界3概念模型與E-R方法概念模型是從現(xiàn)實世界到信息世界的第一層抽象,是數(shù)據(jù)庫設(shè)計人員進(jìn)行數(shù)據(jù)庫設(shè)計的有力工具,也是數(shù)據(jù)庫設(shè)計人員和用戶之間進(jìn)行交流的語言,因此概念模型應(yīng)滿足以下三個方面的要求:(1)能比較真實地模擬現(xiàn)實世界,具有較強(qiáng)的表達(dá)能力,能夠方便、直接地表達(dá)應(yīng)用中的各種要求。(2)簡單、清晰,容易為人所理解。(3)要便于在計算機(jī)上實現(xiàn)。E-R圖就是用特定的符號來描述E-R模型中實體集及實體集之間的聯(lián)系E-R圖包括三個圖素:(1)實體集。用矩形框表示,框內(nèi)標(biāo)注實體名稱。(2)屬性。用橢圓形表示,并用連線與實體連接起來。(3)實體之間的縣。用菱形框表示,框內(nèi)標(biāo)注聯(lián)系名稱,并用連線將菱形框分別與有夫?qū)嶓w相連,并在連線上注明聯(lián)系類型。下圖是E-R圖的基本圖素。實體名屬性名聯(lián)系名實體集屬性實體之間的聯(lián)系E-R圖的基本圖索建立實體—聯(lián)系模型(E-

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論