圖數(shù)據(jù)庫中的高科技和高安全性(共7頁)_第1頁
圖數(shù)據(jù)庫中的高科技和高安全性(共7頁)_第2頁
圖數(shù)據(jù)庫中的高科技和高安全性(共7頁)_第3頁
圖數(shù)據(jù)庫中的高科技和高安全性(共7頁)_第4頁
圖數(shù)據(jù)庫中的高科技和高安全性(共7頁)_第5頁
已閱讀5頁,還剩3頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、圖數(shù)據(jù)庫中的高科技和高安全性這篇文章首先(shuxin)出現(xiàn)在 HYPERLINK /web/computingnow/itpro IEEE IT Professional雜志(zzh)上. HYPERLINK /web/computingnow/itpro IEEE IT Professional對(duì)當(dāng)前戰(zhàn)略性的科技議題提供可靠的同行評(píng)議信息。為了能應(yīng)對(duì)挑戰(zhàn)(tio zhn),可靠、靈活地運(yùn)行企業(yè),IT管理者和技術(shù)領(lǐng)導(dǎo)者在獲得最先進(jìn)的解決方案時(shí)需要依靠IT 專家。針對(duì)網(wǎng)絡(luò)安全的措施最好在系統(tǒng)設(shè)計(jì)時(shí)就進(jìn)行考慮,否則后期的改造成本會(huì)非常高。新的技術(shù)和應(yīng)用會(huì)使系統(tǒng)的安全和隱私面臨新的挑戰(zhàn),而且采納新

2、技術(shù)的結(jié)果通常很難去預(yù)測(cè)。圖數(shù)據(jù)庫就是這樣的情形,它是一個(gè)比較新的、關(guān)注度持續(xù)上升的數(shù)據(jù)庫技術(shù)。這篇文章探討了圖數(shù)據(jù)庫的價(jià)值,并對(duì)影響安全和隱私的地方作了一些研究。NOSQL的出現(xiàn)關(guān)系型數(shù)據(jù)庫(RDBMS)起初是為了最大化利用昂貴的存儲(chǔ)而設(shè)計(jì)的,不過它現(xiàn)在已經(jīng)真正成為具有高效和穩(wěn)定事務(wù)處理能力的系統(tǒng)。例如,關(guān)系型數(shù)據(jù)在大規(guī)模信用卡事務(wù)處理和循環(huán)計(jì)費(fèi)操作方面都具有優(yōu)勢(shì)。它在索引數(shù)據(jù)位置上提供了出眾的性能,但在高度動(dòng)態(tài)的環(huán)境下卻表現(xiàn)不佳,比如作為易失性數(shù)據(jù)(volatile data)的管理信息系統(tǒng),或者是有大量多對(duì)多關(guān)系時(shí)所需的系統(tǒng)架構(gòu)。在這些場(chǎng)景下,關(guān)系新數(shù)據(jù)庫的設(shè)計(jì)強(qiáng)加了太多的數(shù)學(xué)和管理開銷

3、。NoSQL(Not Only Structured Query Language)數(shù)據(jù)庫的出現(xiàn)表示在數(shù)十年之久的關(guān)系型數(shù)據(jù)庫1之外有了另一種選擇。多種形式的NoSQL數(shù)據(jù)庫開啟了一扇扇大門,從而極大地改進(jìn)了動(dòng)態(tài)數(shù)據(jù)描述,以及更小的開銷和性能損失。例如,在NoSQL世界中模式(schemas)的定義不必那么嚴(yán)格。NoSQL數(shù)據(jù)庫的種類包括寬列存儲(chǔ)、文本存儲(chǔ)、鍵值(元組)存儲(chǔ)、多模式數(shù)據(jù)庫、對(duì)象數(shù)據(jù)庫、網(wǎng)格/云數(shù)據(jù)庫和圖數(shù)據(jù)庫。其中圖數(shù)據(jù)庫,與NoSQL世界2多個(gè)技術(shù)發(fā)展路線交叉,勢(shì)必會(huì)成為一項(xiàng)成功的技術(shù)。圖數(shù)據(jù)庫圖數(shù)據(jù)庫依賴于熟悉(shx)的“節(jié)點(diǎn)(ji din)-弧-節(jié)點(diǎn)”網(wǎng)絡(luò)關(guān)系,或者(h

4、uzh)更簡(jiǎn)單一些的“名詞-動(dòng)詞-名詞”網(wǎng)絡(luò)關(guān)系(參見圖1)。一個(gè)節(jié)點(diǎn)可以是任意的對(duì)象,而一個(gè)弧則表示了節(jié)點(diǎn)間的關(guān)系。節(jié)點(diǎn)和弧都可以有自己的屬性。這種簡(jiǎn)單的節(jié)點(diǎn)-弧-節(jié)點(diǎn)構(gòu)成了三元一體,通常稱為三元組(triple),三元組是詳盡描述復(fù)雜網(wǎng)絡(luò)行為的基礎(chǔ)構(gòu)件。電力網(wǎng)絡(luò)、企業(yè)供應(yīng)鏈或整體生態(tài)系統(tǒng)這樣的網(wǎng)絡(luò)通常由許多的節(jié)點(diǎn)組成,這些節(jié)點(diǎn)通過它們之間的弧共享大量的多元關(guān)系。這些網(wǎng)絡(luò)非常適合用圖來表示,圖數(shù)據(jù)庫利用了這個(gè)強(qiáng)大的能力來表示網(wǎng)絡(luò)的組成和連接。目前,圖數(shù)據(jù)庫已經(jīng)可以很成熟地支持圖發(fā)現(xiàn)、知識(shí)管理和事件預(yù)測(cè)。在互聯(lián)網(wǎng)世界中,各種類型的網(wǎng)絡(luò)也愈顯重要,而探究網(wǎng)絡(luò)的能力正成為其現(xiàn)代化意義中的基本要素。

5、然而和關(guān)系新數(shù)據(jù)庫一樣,圖數(shù)據(jù)庫只是工具箱中的一種工具,它可以被正確地利用,或者是相反。所以對(duì)這個(gè)令人興奮的新技術(shù),至少?gòu)淖罡叩脑O(shè)計(jì)層次上,大范圍地評(píng)估安全性對(duì)其影響,是個(gè)成熟的做法。圖發(fā)現(xiàn)圖數(shù)據(jù)庫通過處理節(jié)點(diǎn)屬性和連接,從而可以表示豐富的信息,這些信息通常是被隱藏的,直到它們被挖掘出來。圖發(fā)現(xiàn)(Discovery)是一種通過挖掘相關(guān)的大數(shù)據(jù)集,從而提供新的洞察(Insight)的方法,而這些并不需要對(duì)洞察的內(nèi)容具有很強(qiáng)的預(yù)判能力。圖數(shù)據(jù)庫起初并沒有被認(rèn)為是一個(gè)有用的發(fā)現(xiàn)工具。之前人們使用特殊設(shè)計(jì)的超級(jí)計(jì)算機(jī)家族來實(shí)現(xiàn)圖發(fā)現(xiàn)的全部能力。盡管這樣可以很直接地表示圖,但當(dāng)三元組的數(shù)量增加到數(shù)十億的

6、量級(jí)后,快速遍歷多個(gè)路徑就成為計(jì)算的瓶頸,除了那些最強(qiáng)大的機(jī)器。上述的情況經(jīng)常在稠密圖時(shí)出現(xiàn),比如編織緊密的蛋白質(zhì)網(wǎng)絡(luò)。此時(shí),詳細(xì)的圖查詢可以讓計(jì)算能力不足的系統(tǒng)崩潰。當(dāng)前,為了遍歷圖,在處理圖的超級(jí)計(jì)算機(jī)上重新進(jìn)行了設(shè)計(jì),克服了時(shí)間和容量上的限制。完成這樣工作的設(shè)備包括了一些Hadoop平臺(tái)的分析工具,以及近期在克雷超級(jí)計(jì)算機(jī)3上已經(jīng)可用的商用高端圖數(shù)據(jù)庫。為圖發(fā)現(xiàn)而設(shè)計(jì)的高端圖處理超級(jí)計(jì)算機(jī)帶給人們巨大的期望。比如,它可以支持詳盡創(chuàng)建出海洋和天氣之間的復(fù)雜關(guān)系,這些就構(gòu)成了氣候變化的條件。在巨大氣候變化時(shí),進(jìn)一步發(fā)現(xiàn)那些間接的、非線性的原因和影響顯得尤為重要。同樣的,圖處理超級(jí)計(jì)算機(jī)可以加

7、速發(fā)現(xiàn)西非埃博拉疫情的是如何傳播的,這有助于我們阻止這種病情的傳播。圖2描述了用圖數(shù)據(jù)庫做圖發(fā)現(xiàn)的概念。圖1. 基礎(chǔ)圖理論。這種簡(jiǎn)單的節(jié)點(diǎn)-弧-節(jié)點(diǎn)構(gòu)成了三元(sn yun)一體,通常稱為三元組(triple),三元組是詳盡描述復(fù)雜網(wǎng)絡(luò)行為的基礎(chǔ)構(gòu)件。圖2. 利用(lyng)圖處理數(shù)據(jù)庫實(shí)現(xiàn)圖發(fā)現(xiàn)。這種發(fā)現(xiàn)可以支持詳盡創(chuàng)建出海洋和天氣之間的復(fù)雜關(guān)系,這些就構(gòu)成了氣候變化的條件;或者可以加速發(fā)現(xiàn)西非埃博拉疫情的是如何傳播的。圖發(fā)現(xiàn)(fxin):隱私和安全圖發(fā)現(xiàn),給解決復(fù)雜的相關(guān)性問題帶來了很大希望,然而我們要關(guān)注隨之而來的隱私和安全性問題。例如,當(dāng)圖處理超級(jí)計(jì)算機(jī)變成可以挖掘我們社交和金融交易信

8、息以進(jìn)行監(jiān)聽、廣告,以及其它公然利用個(gè)人信息來侵犯?jìng)€(gè)人隱私的設(shè)備時(shí),個(gè)人信息就會(huì)面臨更多被暴露的風(fēng)險(xiǎn)。雖然在一個(gè)繁榮自由的系統(tǒng)中設(shè)置道德(dod)約束的想法有點(diǎn)格格不入,然而事使對(duì)個(gè)人生活的侵犯保持在可接受范圍內(nèi)卻被證明是很有必要的,如果其不是憲法所要求的,也是處于財(cái)務(wù)保密的原因。期望執(zhí)法機(jī)關(guān)利用所有必需的手段以消除我們面臨的那些真正的威脅,是完全合理的想法,但這樣的話社會(huì)成本會(huì)有多高?同樣的,有些人為了利用每次市場(chǎng)機(jī)會(huì)從而使用各種方法來快速推出產(chǎn)品,但這個(gè)目標(biāo)的實(shí)現(xiàn)又會(huì)犧牲多少個(gè)體的代價(jià)呢?現(xiàn)實(shí)中這樣極端的開發(fā)模式不過是已有趨勢(shì)的一個(gè)投影。在社會(huì)經(jīng)濟(jì)學(xué)的研究設(shè)計(jì)中,當(dāng)特別涉及大范圍的社會(huì)和商

9、業(yè)事務(wù)關(guān)系時(shí),安全門檻就必須設(shè)置的非常高。任何(rnh)對(duì)此的惡意侵入,可能比最近一些信用卡發(fā)行公司或影片公司遭受的大規(guī)模黑客攻擊,更具毀滅性的后果。當(dāng)考慮萬物互聯(lián)(IoA:Internet of Anything)這個(gè)概念時(shí),情況會(huì)進(jìn)一步惡化,因?yàn)?yn wi)IoA中包含了無數(shù)的傳感器、執(zhí)行器和移動(dòng)設(shè)備,所有這些看起來都可以被優(yōu)化利用,以泄露個(gè)人隱私。4圖知識(shí)管理節(jié)點(diǎn)-弧-節(jié)點(diǎn)的三元組概念非常適合使用資源描述框架(RDF:Resource Description Framework)這種描述性語言來表達(dá)“主謂對(duì)象(subject predicate-object)”關(guān)系。RDF創(chuàng)建了一種正

10、式表達(dá)的層次從而可以描述和推理圖數(shù)據(jù)庫中的數(shù)據(jù)。并且,RDF很好地滿足了形式本體論(formal ontology),從而可以定義嚴(yán)格語義的術(shù)語。這種形式化定義“多少才夠呢”?這個(gè)問題和形式化定義在實(shí)際中可容許的程度相關(guān),可能要用很多年才能回答。對(duì)W3C來說,RDF和形式化本體論一起提供了網(wǎng)絡(luò)關(guān)聯(lián)數(shù)據(jù)的視圖,并且致力于在常用的網(wǎng)絡(luò)引用格式中提供可重用的結(jié)構(gòu)化知識(shí)5。但它也有一個(gè)缺點(diǎn),即對(duì)于高度結(jié)構(gòu)化的數(shù)據(jù),如組織非常好的電子表格數(shù)據(jù)和數(shù)據(jù)庫轉(zhuǎn)換到RDF是相對(duì)簡(jiǎn)單的,但可靠地轉(zhuǎn)換非結(jié)構(gòu)化數(shù)據(jù)到RDF的能力還只能在一些高端工具中提供,并且還帶有一些限制性的警告。然而并不是所有的圖數(shù)據(jù)庫都需要用RD

11、F來進(jìn)行三元組的表達(dá),許多發(fā)展很好的商業(yè)圖數(shù)據(jù)庫沒有使用RDF,而是使用私有的方法來表達(dá)三元組。一些圖數(shù)據(jù)庫還提供了一些有吸引力的特性,比如圖可視化、備份和恢復(fù)。預(yù)計(jì)到2017年6,圖數(shù)據(jù)庫產(chǎn)業(yè)在數(shù)據(jù)庫市場(chǎng)的份額將從2個(gè)百分點(diǎn)增長(zhǎng)到25個(gè)百分點(diǎn),在此過程中圖數(shù)據(jù)庫工具將會(huì)逐步獲得企業(yè)認(rèn)可,并且其消費(fèi)群體會(huì)持續(xù)增長(zhǎng)。當(dāng)然,其中很多圖數(shù)據(jù)庫會(huì)使用自己的數(shù)據(jù)管理語言和技術(shù),但也會(huì)有對(duì)標(biāo)準(zhǔn)化的實(shí)際需求,至少是在支持?jǐn)?shù)據(jù)的可移植性上。知識(shí)管理:隱私(yn s)與安全不得不再次強(qiáng)調(diào)安全,特別在那些專有的架構(gòu)設(shè)計(jì)中必須有所考慮。如果按現(xiàn)有專家預(yù)期的那樣,網(wǎng)絡(luò)分享是產(chǎn)生大量表述系統(tǒng)三元組的一個(gè)合理渠道(qdo

12、),那么設(shè)計(jì)RDF數(shù)據(jù)倉庫的安全門戶就變得極其重要。同樣,用戶身份認(rèn)證和驗(yàn)證的概念也會(huì)變得很重要。在隱私和安全方面,也許知識(shí)管理可能不會(huì)像圖發(fā)現(xiàn)付出的代價(jià)高,但相關(guān)數(shù)據(jù)庫仍會(huì)暴露特定的身份屬性,而這些屬性本應(yīng)得到很好地保護(hù)。所以必須制定前端規(guī)定(front-end provisions)來確保防范入侵的安全性,以及圖數(shù)據(jù)庫中儲(chǔ)存的個(gè)人數(shù)據(jù)的隱私性。不能提供足夠保護(hù)的圖形數(shù)據(jù)庫產(chǎn)品可能會(huì)被取消資格,被承諾(chngnu)提供這種保護(hù)的圖數(shù)據(jù)庫產(chǎn)品取而代之,盡管后者的接口仍會(huì)容易受到攻擊。圖預(yù)測(cè)在動(dòng)態(tài)環(huán)境中需要揭示其變化過程時(shí),如天氣或經(jīng)濟(jì)的走勢(shì),則非常期望具有預(yù)測(cè)未來行為的能力。圖的表述形式有利

13、于這種預(yù)測(cè),因?yàn)樗屛覀兛梢园岩粋€(gè)系統(tǒng)定量定性地描述成一個(gè)網(wǎng)絡(luò)??梢越o節(jié)點(diǎn)和弧分配屬性,如位置、時(shí)間、重量或數(shù)量,這種能力可以使我們?cè)谙嗨茖傩缘幕A(chǔ)上去定性地評(píng)價(jià)圖。更重要的是,量化技術(shù)可以使我們?cè)u(píng)估幾乎所有圖表的內(nèi)在指標(biāo),這可以應(yīng)用在包括神經(jīng)科學(xué)的許多領(lǐng)域中。7將驗(yàn)證過的指標(biāo)應(yīng)用到圖的能力意味著圖的特征可以被量化,從而可以客觀地去評(píng)價(jià)它。如果圖數(shù)據(jù)是動(dòng)態(tài)的,比如是一個(gè)持續(xù)變化的過程,當(dāng)數(shù)據(jù)流可以被訪問時(shí),那么強(qiáng)大的預(yù)測(cè)能力可能就蘊(yùn)藏其中。這個(gè)方法假定組合圖論和組合數(shù)學(xué)可以被應(yīng)用到實(shí)時(shí)數(shù)據(jù)流處理中。而且,各種圖配置可以根據(jù)指標(biāo)來分類。通過每個(gè)分類模板,加上一個(gè)基于指標(biāo)的圖簽名,就可以對(duì)圖進(jìn)行識(shí)

14、別,也可以作為有相似的圖出現(xiàn)時(shí),預(yù)測(cè)它們的基線。預(yù)測(cè):安全和隱私目前網(wǎng)絡(luò)安全的最佳實(shí)踐建議是對(duì)研究的系統(tǒng)進(jìn)行快照,以確定其安全和隱私中的脆弱關(guān)系,這被認(rèn)為具有重要意義,而系統(tǒng)也可以由此獲得證明其安全性的認(rèn)證。這個(gè)實(shí)踐的謬誤之處在于絕大多數(shù)的系統(tǒng)處于永遠(yuǎn)變化的環(huán)境中,隨著時(shí)間的推移,系統(tǒng)的行為會(huì)發(fā)生改變。因此,認(rèn)證只能說明在快照的那個(gè)時(shí)刻系統(tǒng)是好的。在復(fù)雜性日趨增加的情況下,圖形數(shù)據(jù)庫提供了讓我們監(jiān)測(cè)近實(shí)時(shí)動(dòng)態(tài)變化的可能性。通過定量的方法監(jiān)測(cè)數(shù)據(jù)流中異常節(jié)點(diǎn)或關(guān)系模式的變化,我們就可以(ky)盡早地檢測(cè)和調(diào)查那些入侵行為和其他安全漏洞,以及迅速起訴識(shí)別到的那些罪犯。從預(yù)測(cè)的角度來看,數(shù)據(jù)的完整性

15、必須優(yōu)先保證。而且因?yàn)轭A(yù)測(cè)的成本很高,所以數(shù)據(jù)的來源問題也變得至關(guān)重要。預(yù)測(cè)結(jié)果的準(zhǔn)確性來自預(yù)測(cè)工具使用數(shù)據(jù)的準(zhǔn)確性。錯(cuò)誤的數(shù)據(jù)會(huì)嚴(yán)重(ynzhng)影響到結(jié)果,甚至嚴(yán)重危及到安全性。設(shè)想一下將錯(cuò)誤的預(yù)測(cè)模型應(yīng)用于救災(zāi)時(shí)的后果,這時(shí)它可能要求將資源分配到?jīng)]有受災(zāi)的區(qū)域而不是相反。就這一點(diǎn)而言,實(shí)踐中好的安全性來自于我們?cè)賾?yīng)用科學(xué)時(shí)所采取的高道德標(biāo)準(zhǔn)。盡管圖數(shù)據(jù)庫可以在各種網(wǎng)絡(luò)構(gòu)成的世界中被應(yīng)用,人們也對(duì)這些圖數(shù)據(jù)庫寄予了很大的期望,但它們?nèi)匀粫?huì)暴露出一些固有的安全風(fēng)險(xiǎn),人們對(duì)這些風(fēng)險(xiǎn)尚未能完全認(rèn)識(shí),更不要說去領(lǐng)會(huì)了。謹(jǐn)慎的IT專業(yè)人員從不建筑空中樓閣,他們必須仔細(xì)評(píng)估在預(yù)期操作環(huán)境中的潛在風(fēng)險(xiǎn)

16、,并且進(jìn)行必要的權(quán)衡,最終達(dá)到可接受的安全和數(shù)據(jù)保護(hù)級(jí)別。如果對(duì)這些新技術(shù),如日益流行的圖數(shù)據(jù)庫,在設(shè)計(jì)前期沒有考慮相關(guān)的安全和隱私問題,那么在后期實(shí)現(xiàn)(shxin)它們的代價(jià)就會(huì)變得相當(dāng)高昂。ReferencesA.B.M. Moniruzzaman and S.A. Hossain, “NoSQL Database: New Era of Databases for Big Data AnalyticsClassification, Characteristics and Comparison,” Intl J. Database Theory and Application, vol.

17、6, no. 4, 2013.M. Buerli, “The Current State of Graph Databases,” Dept. of Computer Science, Cal Poly San Luis Obispo, Dec. 2012. HYPERLINK /Assets/PDF/products/urika-gd/Urika-GDWhitePaper.pdf Real Time Discovery in Big-Data Using the Urika-GD Appliance, white paper, Oct. 2014;A. Ukil, S. Bandyopadh

18、yay, and A. Pal, “IoT-Privacy: To be Private or Not to be Private,” IEEE Conf. Computer Communications Workshops (INFOCOM), 2014, pp. 123124.D. Wood et al., Linked DataStructured Data on the Web, Manning Publications, 2014.E. Eifrem, “ HYPERLINK /110554197 Graphs are Eating the World,” keynote, Grap

19、hConnect, Nov. 2014;O. Sporns, “ HYPERLINK /Journal/Abstract.aspx?s=237&name=computational_ neuroscience&ART_DOI=10.3389/fncom.2011.00005 The Nonrandom Brain: Efficiency, Economy, and Complex Dynamics,” Frontiers in Computational Neuroscience, vol. 5, 2011;關(guān)于(guny)作者George Hurlburt是STEMCorp公司的首席科學(xué)家,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論