



下載本文檔
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
-4-為什么說(shuō)圖形數(shù)據(jù)庫(kù)是大數(shù)據(jù)時(shí)代的利器?利用圖形數(shù)據(jù)庫(kù),我們可以更輕易地描述和更便利地查詢上圖所示的關(guān)系。下一節(jié)我們將看到,在關(guān)聯(lián)關(guān)系更簡(jiǎn)單的情形下,圖形數(shù)據(jù)庫(kù)的查詢效率遠(yuǎn)遠(yuǎn)高于關(guān)系型數(shù)據(jù)庫(kù)。你或許聽說(shuō)過(guò)圖形數(shù)據(jù)庫(kù),也知道它不是存儲(chǔ)圖片文件的數(shù)據(jù)庫(kù)。但是:為什么總有人吹捧它是大數(shù)據(jù)時(shí)代的利器?是數(shù)據(jù)庫(kù)領(lǐng)域重大的技術(shù)革新?它和傳統(tǒng)的關(guān)系型數(shù)據(jù)庫(kù)相比有哪些優(yōu)劣?本文將帶你揭開圖形數(shù)據(jù)庫(kù)的神奇面紗。
什么是圖形數(shù)據(jù)庫(kù)
要理解圖形數(shù)據(jù)庫(kù),你臨時(shí)還不需要具備太多圖論的學(xué)問(wèn)。實(shí)際上,圖形數(shù)據(jù)庫(kù)(GDBMS)在筆者眼中比關(guān)系數(shù)據(jù)庫(kù)(RDBMS)更簡(jiǎn)單理解。
圖(Graph)由頂點(diǎn)(Vertex)和邊(Edge)組成。
在圖形數(shù)據(jù)庫(kù)領(lǐng)域,我們有時(shí)候喜愛把頂點(diǎn)和邊稱為節(jié)點(diǎn)(Node)和關(guān)系(Relationship),但明顯它們是同一回事。
每個(gè)節(jié)點(diǎn)表示一個(gè)實(shí)體(個(gè)人、地點(diǎn)、事物、類別或其他數(shù)據(jù)塊),每個(gè)關(guān)系表示兩個(gè)節(jié)點(diǎn)的關(guān)聯(lián)關(guān)系。
例如,兩個(gè)節(jié)點(diǎn)中國(guó)和臺(tái)灣的關(guān)系是臺(tái)灣屬于中國(guó);而兩個(gè)節(jié)點(diǎn)臺(tái)灣和鳳梨酥的關(guān)系是鳳梨酥是臺(tái)灣的特產(chǎn)。
為什么圖數(shù)據(jù)庫(kù)是將來(lái)的必定趨勢(shì)?
我們生活的世界布滿了對(duì)象之間的相互聯(lián)系,你能舉出一個(gè)例子,某一對(duì)象是完全孤立、不和外界發(fā)生任何關(guān)聯(lián)嗎?圖數(shù)據(jù)庫(kù)在描述、存儲(chǔ)、查詢這些關(guān)聯(lián)時(shí)具有天生優(yōu)勢(shì)。
我們連續(xù)擴(kuò)展上面的例子,上海也屬于中國(guó),陸家嘴位于上海,喬治在陸家嘴上班,佩奇是喬治的姐姐,佩奇來(lái)自臺(tái)灣,喬治雖然誕生在內(nèi)地但是去過(guò)臺(tái)灣,喬治還很喜愛吃鳳梨酥。
假如你是業(yè)務(wù)/產(chǎn)品工作人員,你肯定盼望你的產(chǎn)品或者業(yè)務(wù)涉及到用戶的方方面面。假如你是開發(fā)人員,你肯定盼望能夠簡(jiǎn)潔高效地描述這個(gè)紛繁簡(jiǎn)單的世界。
在傳統(tǒng)的技術(shù)方中,一般會(huì)用關(guān)系型數(shù)據(jù)庫(kù)對(duì)數(shù)據(jù)進(jìn)行長(zhǎng)久化(長(zhǎng)時(shí)存儲(chǔ))。那么為了描述上圖中的模型,我們需要建立多少?gòu)埍砟???guó)家、省/市、人、食品、地標(biāo)、國(guó)家與省/市關(guān)系、省/市與食品關(guān)系、人與省/市關(guān)系、人與至少十幾張表。
這倒沒什么大不了的。
現(xiàn)在請(qǐng)查詢:在哪個(gè)城市上班的人最喜愛吃鳳梨酥?
嗯你只需要關(guān)聯(lián)食品表、人員表、人喜愛的食品關(guān)聯(lián)關(guān)系表三張表就可以查到喬治等人喜愛吃鳳梨酥,但是你還得再關(guān)聯(lián)兩張表找到他們?cè)谀膫€(gè)地標(biāo)工作,進(jìn)而再關(guān)聯(lián)兩張表找到這些地標(biāo)在哪個(gè)城市。還沒完,你還得groupby一下,再排個(gè)序。
你會(huì)覺得這個(gè)查詢簡(jiǎn)直有病。但這恰恰是數(shù)據(jù)分析師最基本的工作,也是大數(shù)據(jù)時(shí)代海量信息處理的一個(gè)縮影。
利用圖形數(shù)據(jù)庫(kù),我們可以更輕易地描述和更便利地查詢上圖所示的關(guān)系。下一節(jié)我們將看到,在關(guān)聯(lián)關(guān)系更簡(jiǎn)單的情形下,圖形數(shù)據(jù)庫(kù)的查詢效率遠(yuǎn)遠(yuǎn)高于關(guān)系型數(shù)據(jù)庫(kù)。
圖數(shù)據(jù)庫(kù)VS關(guān)系型數(shù)據(jù)庫(kù)
1.性能
大數(shù)據(jù)時(shí)代,人類社會(huì)的數(shù)據(jù)量呈爆發(fā)式增長(zhǎng)。任何業(yè)務(wù)或產(chǎn)品所積累的數(shù)據(jù)肯定是快速增長(zhǎng)的,這沒有疑義,但更重要的是,數(shù)據(jù)與數(shù)據(jù)之間的連接(或者說(shuō)關(guān)系)將呈現(xiàn)平方級(jí)增長(zhǎng):
3個(gè)點(diǎn)最多有6條有向邊,4個(gè)點(diǎn)最多有12個(gè)有向邊,N個(gè)節(jié)點(diǎn)最多有N*(N-1)個(gè)有向邊。
在傳統(tǒng)的數(shù)據(jù)庫(kù)中,隨著關(guān)系的數(shù)量和深度的增加,關(guān)系查詢的效率將急劇衰減,甚至崩潰。
然而圖形數(shù)據(jù)庫(kù)的性能將幾乎不變,即使數(shù)據(jù)每天都在增長(zhǎng)。
這共性能差異有多大呢,引用Neo4j(一款圖形數(shù)據(jù)庫(kù))發(fā)布的測(cè)試數(shù)據(jù),我們盼望在一個(gè)社交網(wǎng)絡(luò)里找到最大深度為指定值的伴侶組合。
在100萬(wàn)人的人群中,設(shè)置每個(gè)人大約有50個(gè)伴侶,隨機(jī)選擇兩個(gè)人,是否存在一條路徑,使得他們之間的關(guān)聯(lián)關(guān)系長(zhǎng)度為2或3或4或5?
圖形數(shù)據(jù)庫(kù)與關(guān)系型數(shù)據(jù)庫(kù)執(zhí)行時(shí)間對(duì)比如下表。
可見,在這種關(guān)聯(lián)關(guān)系簡(jiǎn)單且關(guān)聯(lián)深度較大的情形下,用圖形數(shù)據(jù)庫(kù)對(duì)陣關(guān)系型數(shù)據(jù)庫(kù)簡(jiǎn)直好比降維打擊。
2.敏捷性
圖形數(shù)據(jù)模型的結(jié)構(gòu)和模式隨著解決方案和行業(yè)的變化而變化。開發(fā)團(tuán)隊(duì)不必提前對(duì)將來(lái)的需求進(jìn)行詳盡的建模(然后在某些業(yè)務(wù)/產(chǎn)品人員要求更改后徹底地推翻重做);相反,新的節(jié)點(diǎn)、關(guān)系、節(jié)點(diǎn)的屬性還有關(guān)系的屬性都可以后期添加到現(xiàn)有結(jié)構(gòu)中,完全不會(huì)危及當(dāng)前的功能。
一個(gè)好玩的說(shuō)法是:面對(duì)圖形數(shù)據(jù)庫(kù)模型,你只需要口述你的需求,然后讓它作出轉(zhuǎn)變;而關(guān)系型數(shù)據(jù)庫(kù)模型則恰好相反,它告知你它的需求,迫使你適應(yīng)它那該死的表格結(jié)構(gòu)。
3.靈敏性
使用圖形技術(shù)開發(fā)完全符合當(dāng)今的靈敏、測(cè)試驅(qū)動(dòng)的開發(fā)實(shí)踐,它允許數(shù)據(jù)層支持的應(yīng)用程序隨著業(yè)務(wù)需求的進(jìn)展而快速迭代更新。
有哪些好用的圖形數(shù)據(jù)庫(kù)(最好是開源
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- GB/T 38205.1-2025液壓傳動(dòng)16 MPa系列單出桿缸的安裝尺寸第1部分:中型系列
- 北師大版五年級(jí)下冊(cè)分?jǐn)?shù)加減法巧算練習(xí)200道及答案
- 認(rèn)真對(duì)待項(xiàng)目管理考試中的試題及答案
- 學(xué)習(xí)與反思結(jié)合提高2025年注冊(cè)會(huì)計(jì)師考試的能力試題及答案
- 項(xiàng)目組建過(guò)程中的決策設(shè)計(jì)試題及答案
- 醫(yī)院感染控制與微生物檢驗(yàn)及試題及答案
- 行政機(jī)關(guān)合同糾紛處理新機(jī)制
- 廉政談話時(shí)的表態(tài)發(fā)言稿
- 股票投資策略相關(guān)試題及答案
- 室內(nèi)空氣質(zhì)量提升措施計(jì)劃
- 對(duì)患者入院評(píng)估的系統(tǒng)化方法試題及答案
- 教育與社會(huì)發(fā)展的關(guān)系試題及答案
- 七年級(jí)英語(yǔ)下學(xué)期期中押題預(yù)測(cè)卷(深圳專用)(原卷版)
- 2024年貴州貴州路橋集團(tuán)有限公司招聘真題
- DB11-T 2397-2025 取水供水用水排水?dāng)?shù)據(jù)庫(kù)表結(jié)構(gòu)
- 多式聯(lián)運(yùn)模式在跨境電商中的應(yīng)用-全面剖析
- 中藥學(xué)(士)基礎(chǔ)知識(shí)押題密卷1
- 2025年第三屆天揚(yáng)杯建筑業(yè)財(cái)稅知識(shí)競(jìng)賽題庫(kù)附答案(1401-1536題)
- 2025中考語(yǔ)文??甲魑难侯}(10大主題+10篇范文)
- 2024安康市專職消防員招聘考試題目及答案
- 氣相色譜-質(zhì)譜聯(lián)用GC-MS
評(píng)論
0/150
提交評(píng)論