數(shù)據(jù)可視化技術(shù)分析_第1頁(yè)
數(shù)據(jù)可視化技術(shù)分析_第2頁(yè)
數(shù)據(jù)可視化技術(shù)分析_第3頁(yè)
數(shù)據(jù)可視化技術(shù)分析_第4頁(yè)
數(shù)據(jù)可視化技術(shù)分析_第5頁(yè)
已閱讀5頁(yè),還剩25頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

數(shù)據(jù)可視化技術(shù)分析學(xué)生姓名:王修巖數(shù)據(jù)可視化技術(shù)分析第1頁(yè)目錄ContentsC01研究背景及意義02數(shù)據(jù)可視化主要方法03數(shù)據(jù)挖掘可視化04大數(shù)據(jù)環(huán)境下數(shù)據(jù)可視化05結(jié)論問題與挑戰(zhàn)數(shù)據(jù)可視化技術(shù)分析第2頁(yè)課題背景及意義當(dāng)前,我們世界已經(jīng)邁入大數(shù)據(jù)(bigdata)時(shí)代。截至

年,全世界天天產(chǎn)生2.5EB數(shù)據(jù)。然而,不論數(shù)據(jù)有多大,最終,信息必須流經(jīng)一個(gè)最緊瓶頸,人腦吸收和處理新信息能力所能到達(dá)速度。人類視覺系統(tǒng)不足以滿足人類以數(shù)據(jù)本身形式來(lái)工作要求,所以迫切需要提供可視化工具。所謂數(shù)據(jù)可視化,是對(duì)大型數(shù)據(jù)庫(kù)或數(shù)據(jù)倉(cāng)庫(kù)中數(shù)據(jù)可視化,它是可視化技術(shù)在非空間數(shù)據(jù)領(lǐng)域應(yīng)用,使人們不再局限于經(jīng)過關(guān)系數(shù)據(jù)表來(lái)觀察和分析數(shù)據(jù)信息,還能以更直觀方法看到數(shù)據(jù)及其結(jié)構(gòu)關(guān)系。數(shù)據(jù)可視化技術(shù)基本思想是將數(shù)據(jù)庫(kù)中每一個(gè)數(shù)據(jù)項(xiàng)作為單個(gè)圖元元素表示,大量數(shù)據(jù)集組成數(shù)據(jù)圖像,同時(shí)將數(shù)據(jù)各個(gè)屬性值以多維數(shù)據(jù)形式表示,能夠從不一樣維度觀察數(shù)據(jù),從而對(duì)數(shù)據(jù)進(jìn)行更深入觀察和分析。研究背景及意義數(shù)據(jù)可視化技術(shù)分析第3頁(yè)返回一幅圖勝過千言萬(wàn)語(yǔ).人類從外界取得信息約有80%以上來(lái)自于視覺系統(tǒng),當(dāng)大數(shù)據(jù)以直觀可視化圖形形式展示在分析者面前時(shí),分析者往往能夠一眼洞悉數(shù)據(jù)背后隱藏信息并轉(zhuǎn)化知識(shí)以及智慧.如圖所表示是互聯(lián)網(wǎng)星際圖,將196個(gè)國(guó)家35萬(wàn)個(gè)網(wǎng)站數(shù)據(jù)整合起來(lái),并依據(jù)200多萬(wàn)個(gè)網(wǎng)站鏈接將這些星球經(jīng)過關(guān)系鏈聯(lián)絡(luò)起來(lái),每一個(gè)星球大小依據(jù)其網(wǎng)站流量來(lái)決定,而星球之間距離遠(yuǎn)近則依據(jù)鏈接出現(xiàn)頻率、強(qiáng)度和用戶跳轉(zhuǎn)時(shí)創(chuàng)建鏈接.我們能夠馬上看出,Facebook以及Google是流量最大網(wǎng)站。研究背景及意義數(shù)據(jù)可視化技術(shù)分析第4頁(yè)返回可視化主要方法人類認(rèn)知系統(tǒng)能夠識(shí)別空間三維物體,對(duì)于抽象無(wú)線識(shí)別很困難。當(dāng)前對(duì)于組成可視化方法中主要方法,有以下幾個(gè)方面??臻g三維圖形:經(jīng)過圖形密度顏色分布,大致能夠了解數(shù)據(jù)分布,數(shù)據(jù)之間相同性和數(shù)據(jù)之間關(guān)系。顏色圖:分為彩色圖和灰度圖。彩色圖每一個(gè)顏色,對(duì)應(yīng)著不用屬性維,灰度圖能夠利用顏色深淺來(lái)標(biāo)識(shí)數(shù)據(jù)量屬性值大小,顏色越深數(shù)值越大。亮度:對(duì)于特定區(qū)域,用不一樣亮度來(lái)輔助人眼對(duì)視點(diǎn)觀察。數(shù)學(xué)方法:利用數(shù)學(xué)中統(tǒng)計(jì)方法,先對(duì)數(shù)據(jù)關(guān)系進(jìn)行分析,得到數(shù)據(jù)大致分布信息,然后再結(jié)合其它可視化方法來(lái)進(jìn)行細(xì)節(jié)數(shù)據(jù)分析?;蛘呃脭?shù)學(xué)統(tǒng)計(jì)方法對(duì)數(shù)據(jù)中關(guān)系進(jìn)行映射,映射成為圖形圖像關(guān)系來(lái)幫助分析。數(shù)據(jù)可視化技術(shù)分析第5頁(yè)返回可視化主要方法當(dāng)前主要多維數(shù)據(jù)可視化技術(shù)1ScatterplotMatrix

(散點(diǎn)圖矩陣)Scatterplot是顯示多個(gè)數(shù)據(jù)維中任意兩個(gè)數(shù)據(jù)維之間依賴關(guān)系矩陣圖,分別把多維數(shù)據(jù)中每一個(gè)維數(shù)對(duì)稱地標(biāo)注在橫軸和縱軸上,把它們?cè)跀?shù)據(jù)集中每一對(duì)出現(xiàn)頻度作為關(guān)系依賴評(píng)價(jià),這么每?jī)删S關(guān)系被顯示在這個(gè)平面網(wǎng)格圖中(圖3)。在Scatterplot

matrixn維矩陣中,scatterplots會(huì)產(chǎn)生n*(n-1)/2對(duì)維之間關(guān)系。數(shù)據(jù)可視化技術(shù)分析第6頁(yè)返回可視化主要方法2幾何圖技術(shù)1)星型圖:每個(gè)星型標(biāo)識(shí)結(jié)構(gòu)方法以下:任選空間某一點(diǎn)作為一個(gè)星型標(biāo)識(shí)中心點(diǎn),由中心點(diǎn)作出n條線段來(lái)代表n個(gè)數(shù)據(jù)維,這n個(gè)線段把平面平均分成n份。普通地,每一個(gè)線段長(zhǎng)度代表一個(gè)數(shù)據(jù)維值大小。把一個(gè)星型標(biāo)識(shí)線段終點(diǎn)全部用直線連接起來(lái),就組成了一個(gè)星型圖(圖4)。每一個(gè)星型圖都代表數(shù)據(jù)庫(kù)中一條統(tǒng)計(jì),這么一組數(shù)據(jù)就用一組星型來(lái)代表。2)雷達(dá)圖:類似于星型圖結(jié)構(gòu)方法。3)Andrew’sGurves:對(duì)于多維數(shù)據(jù)數(shù)據(jù)點(diǎn)x=(x1,x2,*,*,*,*,xn),被周期函數(shù)Fx(t)=X1/sqrt(2)+X2sin(t)+X3cot+X4Sin(2t)+cos(2t)作用于一個(gè)多維數(shù)據(jù)點(diǎn)或者(一個(gè)多維)數(shù)據(jù)集合,被顯示成為一組曲線,曲線分布情況反應(yīng)了數(shù)據(jù)性質(zhì)。4)shapecoding技術(shù):主要思想是每一個(gè)數(shù)據(jù)點(diǎn)位于一個(gè)已經(jīng)分解成n個(gè)細(xì)胞表格長(zhǎng)方形中,而且每一個(gè)細(xì)胞表格顏色由每一維來(lái)控制。5)Grand-tour技術(shù):從不一樣視角對(duì)待多維數(shù)據(jù),投影數(shù)據(jù)在可能d-planes經(jīng)過泛化旋轉(zhuǎn)。數(shù)據(jù)可視化技術(shù)分析第7頁(yè)返回可視化主要方法3平行坐標(biāo)技術(shù)平行坐標(biāo)技術(shù)是最早提出以二維形式表示n維空間數(shù)據(jù)可視化技術(shù)之一。它基本思想是將n維數(shù)據(jù)空間用n條等距離平行軸映射到二維平面上,每條軸線都對(duì)應(yīng)于一個(gè)屬性維。坐標(biāo)軸取值范圍,從對(duì)應(yīng)數(shù)據(jù)維屬性最小值到最大值均勻分布(名詞性屬性依次在數(shù)據(jù)維上標(biāo)出即可),這么數(shù)據(jù)庫(kù)中每一條數(shù)據(jù)統(tǒng)計(jì)都能夠轉(zhuǎn)換成為圖形形式,都能夠用一條折線表示在n條平行軸上(圖6)。數(shù)據(jù)可視化技術(shù)分析第8頁(yè)返回傳統(tǒng)數(shù)據(jù)挖掘過程如圖1所表示,是以機(jī)器為中心;而新吸納了可視化技術(shù)數(shù)據(jù)挖掘過程是以人為中心,如圖2所表示。以人為中心數(shù)據(jù)挖掘過程,將數(shù)據(jù)挖掘與可視化技術(shù)完美結(jié)合,提升了數(shù)據(jù)挖掘過程靈活性、有效性、與用戶交互性。數(shù)據(jù)挖掘可視化在數(shù)據(jù)挖掘算法所生成大量模式中,最終只有少許信息能夠以文字形式解釋和評(píng)定。因而可視化技術(shù)作為服務(wù)于計(jì)算機(jī)與用戶之間溝通紐帶,為用戶提供關(guān)于數(shù)據(jù)和知識(shí)直觀信息。傳統(tǒng)數(shù)據(jù)挖掘過程不可見、不可觀,用戶無(wú)法干預(yù)挖掘過程,對(duì)用戶來(lái)說(shuō)好像一個(gè)黑箱子。使用適當(dāng)可視化技術(shù),幫助用戶更緊密地與整個(gè)過程結(jié)合,處理挖掘系統(tǒng)中存在一些問題。數(shù)據(jù)可視化技術(shù)分析第9頁(yè)返回?cái)?shù)據(jù)挖掘中可視化可分為以下三類:(1)數(shù)據(jù)可視化。數(shù)據(jù)庫(kù)和數(shù)據(jù)倉(cāng)庫(kù)中數(shù)據(jù)可看作含有不一樣粒度或不一樣抽象級(jí)別。離散點(diǎn)圖可能是數(shù)據(jù)挖掘中用最廣泛可視化工具,幫助人們分析數(shù)據(jù)聚類,觀察數(shù)據(jù)分布,有沒有奇異點(diǎn)。對(duì)于只有兩個(gè)或三個(gè)屬性數(shù)據(jù),可采取平面或立體表現(xiàn)形式,多個(gè)屬性數(shù)據(jù)集,要用到離散點(diǎn)矩陣,矩陣每一單元為數(shù)據(jù)基于某兩維表示。(2)數(shù)據(jù)挖掘過程可視化。數(shù)據(jù)挖掘過程各個(gè)步驟用可視化方式表現(xiàn)出來(lái),用戶可從中直觀看到內(nèi)容。易于了解并有利于知識(shí)利用。(3)數(shù)據(jù)挖掘模型可視化。有些模型極難被解釋,模型可視化可從兩個(gè)方面考慮:1,讓模型輸出可視化,模型用一個(gè)有意義方式表示。2,交互,允許用戶操縱模型,改變模型輸入以觀察模型輸出改變。數(shù)據(jù)挖掘可視化數(shù)據(jù)可視化技術(shù)分析第10頁(yè)返回如圖3(a)所表示。作為觀察”數(shù)據(jù)山“第一步,應(yīng)用于數(shù)據(jù)預(yù)處理階段。以圖形方式提供一個(gè)數(shù)據(jù)可視印象,給用戶一個(gè)大致直觀感受,幫助用戶確定從何處著手挖掘。如圖3(b)所表示。作為直接執(zhí)行數(shù)據(jù)挖掘一個(gè)方法,應(yīng)用于數(shù)據(jù)挖掘?qū)嵤╇A段,允許用戶借助人腦探索分析功效尋找發(fā)覺模式。當(dāng)人腦能夠?qū)︼@示圖形做出判斷時(shí),這種方式較使用計(jì)算機(jī)自動(dòng)數(shù)據(jù)挖掘技術(shù)有效多。假如3(c)所表示。作為挖掘結(jié)果和預(yù)測(cè)模型一個(gè)方式,應(yīng)用于數(shù)據(jù)挖掘最終階段,使最終用戶能夠更加好地了解挖掘出結(jié)果模式。數(shù)據(jù)挖掘可視化數(shù)據(jù)可視化技術(shù)分析第11頁(yè)返回可視化技術(shù)在數(shù)據(jù)挖掘中能夠起到以下作用:(1)經(jīng)過提供對(duì)數(shù)據(jù)和知識(shí)可視化,能夠利用人類模式識(shí)別能力評(píng)定和提升挖掘出結(jié)果模式有效性。(2)利用可視化技術(shù)建立用戶與數(shù)據(jù)挖掘系統(tǒng)交互良好溝通通道,使用戶能夠使用自己豐富行業(yè)知識(shí)來(lái)規(guī)整、約束挖掘過程,改進(jìn)挖掘結(jié)果。(3)提供對(duì)挖掘結(jié)果可視化顯示,使用戶對(duì)結(jié)果模式能夠有深刻直觀了解,從而打破傳統(tǒng)挖掘算法黑盒子模式,使用戶對(duì)挖掘系統(tǒng)信賴程度大大提升。數(shù)據(jù)挖掘可視化數(shù)據(jù)可視化技術(shù)分析第12頁(yè)返回大數(shù)據(jù)環(huán)境下數(shù)據(jù)可視化大數(shù)據(jù)可視分析是指大數(shù)據(jù)自動(dòng)分析挖掘方法同時(shí),利用支持信息可視化用戶界面以及支持分析過程人機(jī)交互方式與技術(shù),有效融累計(jì)算機(jī)計(jì)算能力和人認(rèn)知能力,以取得對(duì)于大規(guī)模復(fù)雜數(shù)據(jù)集洞察力。數(shù)據(jù)可視化技術(shù)分析第13頁(yè)返回大數(shù)據(jù)環(huán)境下數(shù)據(jù)可視化上圖是經(jīng)典信息可視化參考模型大數(shù)據(jù)分析將掘取信息和洞悉知識(shí)作為目標(biāo),依據(jù)信息特征把信息可視化技術(shù)分為一維信息、二維信息、三維信息、多維信息、層次信息、網(wǎng)絡(luò)信息、時(shí)序信息可視化。伴隨大數(shù)據(jù)興起于發(fā)展,互聯(lián)網(wǎng)、社交網(wǎng)絡(luò)、地理信息系統(tǒng)、企業(yè)商業(yè)智能、社會(huì)公共服務(wù)等主流應(yīng)用領(lǐng)域逐步催生了幾類特征鮮明信息類型,包含文本、網(wǎng)絡(luò)或圖、時(shí)空、多維數(shù)據(jù)等,這些與大數(shù)據(jù)親密相關(guān)信息類型,將成為大數(shù)據(jù)可視化主要研究領(lǐng)域。數(shù)據(jù)可視化技術(shù)分析第14頁(yè)返回大數(shù)據(jù)環(huán)境下數(shù)據(jù)可視化文本信息是大數(shù)據(jù)時(shí)代非結(jié)構(gòu)化數(shù)據(jù)類型經(jīng)典代表。如圖所表示,經(jīng)典文本可視化技術(shù)是標(biāo)簽云。將關(guān)鍵詞依據(jù)詞頻或其它規(guī)則進(jìn)行排序,按照一定規(guī)律進(jìn)行布局排列,用大小、顏色、字體等圖形屬性對(duì)關(guān)鍵詞進(jìn)行可視化,當(dāng)前,大多用字體大小代表該關(guān)鍵詞主要性,在互聯(lián)網(wǎng)應(yīng)用中,多用于快速識(shí)別網(wǎng)絡(luò)媒體主題熱度,當(dāng)關(guān)鍵詞規(guī)模不停增大時(shí),若不設(shè)置閥值,將出現(xiàn)布局密集和重合覆蓋等問題,此時(shí)需提供交互界面允許用戶對(duì)關(guān)鍵詞進(jìn)行操作。數(shù)據(jù)可視化技術(shù)分析第15頁(yè)返回大數(shù)據(jù)環(huán)境下數(shù)據(jù)可視化文本中通常蘊(yùn)含著邏輯層次結(jié)構(gòu)和一定敘述模式,為了對(duì)結(jié)構(gòu)語(yǔ)義進(jìn)行可視化,如圖前者DAViewer將文本以樹形式進(jìn)行可視化,同時(shí)展現(xiàn)了相同度統(tǒng)計(jì),修辭結(jié)構(gòu)以及對(duì)應(yīng)文本內(nèi)容。如圖后者DocuBurst以放射狀層次圓環(huán)形式展示文本結(jié)構(gòu)。數(shù)據(jù)可視化技術(shù)分析第16頁(yè)返回大數(shù)據(jù)環(huán)境下數(shù)據(jù)可視化文本形成和改變過程與時(shí)間屬性親密相關(guān)。如圖前者(Theme)用河流作為隱喻,河流從左至右流淌代表時(shí)間序列,文本主題按不一樣顏色帶表示,頻度以色帶寬窄表示。基于河流隱喻研究者又提出了后者(TextFlow),深入展示了主題合并和分支關(guān)系。數(shù)據(jù)可視化技術(shù)分析第17頁(yè)返回大數(shù)據(jù)環(huán)境下數(shù)據(jù)可視化網(wǎng)絡(luò)關(guān)聯(lián)關(guān)系是大數(shù)據(jù)中最常見關(guān)系,比如互聯(lián)網(wǎng)與社交網(wǎng)絡(luò),層次結(jié)構(gòu)也屬于網(wǎng)絡(luò)信息一個(gè)特殊情況?;诰W(wǎng)絡(luò)節(jié)點(diǎn)和連接拓?fù)潢P(guān)系,直觀地展示網(wǎng)絡(luò)中潛在模式關(guān)系,比如節(jié)點(diǎn)或邊聚集性,是網(wǎng)絡(luò)可視化主要內(nèi)容之一。對(duì)于含有海量節(jié)點(diǎn)和邊大規(guī)模網(wǎng)絡(luò),怎樣在有限屏幕空間中進(jìn)行可視化,將是大數(shù)據(jù)時(shí)代面臨難點(diǎn)和重點(diǎn).除了對(duì)靜態(tài)網(wǎng)絡(luò)拓?fù)潢P(guān)系進(jìn)行可視化,大數(shù)據(jù)相關(guān)網(wǎng)絡(luò)往往含有動(dòng)態(tài)演化性,所以,怎樣對(duì)動(dòng)態(tài)網(wǎng)絡(luò)特征進(jìn)行可視化,也是不可或缺研究?jī)?nèi)容.數(shù)據(jù)可視化技術(shù)分析第18頁(yè)返回大數(shù)據(jù)環(huán)境下數(shù)據(jù)可視化研究者提出了大量網(wǎng)絡(luò)可視化或圖可視化技術(shù),Herman等人綜述了圖可視化基本方法和技術(shù),如圖所表示.經(jīng)典基于節(jié)點(diǎn)和邊可視化,是圖可視化主要形式.圖中主要展示了含有層次特征圖可視化經(jīng)典技術(shù),比如H狀樹H-Tree、圓錐樹ConeTree、氣球圖BalloonView、放射圖RadialGraph、三維放射圖3DRadial、雙曲樹HyperbolicTree等.數(shù)據(jù)可視化技術(shù)分析第19頁(yè)返回大數(shù)據(jù)環(huán)境下數(shù)據(jù)可視化對(duì)于含有層次特征圖,空間填充法也是常采取可視化方法,比如樹圖技術(shù)Treemaps及其改進(jìn)技術(shù),如圖所表示是基于矩形填充、Voronoi圖填充、嵌套圓填充樹可視化技術(shù).Gou等人綜合集成了上述各種圖可視化技術(shù),提出了TreeNetViz,綜合了放射圖、基于空間填充法樹可視化技術(shù).這些圖可視化方法技術(shù)特點(diǎn)是直觀表示了圖節(jié)點(diǎn)之間關(guān)系,但算法難以支撐大規(guī)模(如百萬(wàn)以上)圖可視化,而且只有當(dāng)圖規(guī)模在界面像素總數(shù)規(guī)模范圍以內(nèi)時(shí)效果才很好(比如百萬(wàn)以內(nèi)),所以面臨大數(shù)據(jù)中圖,需要對(duì)這些方法進(jìn)行改進(jìn),比如計(jì)算并行化、圖聚簇簡(jiǎn)化可視化、多尺度交互等.數(shù)據(jù)可視化技術(shù)分析第20頁(yè)返回大數(shù)據(jù)環(huán)境下數(shù)據(jù)可視化大規(guī)模網(wǎng)絡(luò)中,伴隨海量節(jié)點(diǎn)和邊數(shù)目不停增多,比如規(guī)模到達(dá)百萬(wàn)以上時(shí),可視化界面中會(huì)出現(xiàn)節(jié)點(diǎn)和邊大量聚集、重合和覆蓋問題,使得分析者難以辨識(shí)可視化效果.圖簡(jiǎn)化(graphsimplification)方法是處理這類大規(guī)模圖可視化主要伎倆:?一類簡(jiǎn)化是對(duì)邊進(jìn)行聚集處理,比如基于邊捆綁(edgebundling)方法,使得復(fù)雜網(wǎng)絡(luò)可視化效果更為清楚,下列圖展示了3種基于邊捆綁大規(guī)模密集圖可視化技術(shù).另外,Ersoy等人還提出了基于骨架圖可視化技術(shù),主要方法是依據(jù)邊分布規(guī)律計(jì)算出骨架,然后再基于骨架對(duì)邊進(jìn)行捆綁;數(shù)據(jù)可視化技術(shù)分析第21頁(yè)返回大數(shù)據(jù)環(huán)境下數(shù)據(jù)可視化?另一類簡(jiǎn)化是經(jīng)過層次聚類與多尺度交互,將大規(guī)模圖轉(zhuǎn)化為層次化樹結(jié)構(gòu),并經(jīng)過多尺度交互來(lái)對(duì)不一樣層次圖進(jìn)行可視化.比如,如圖所表示ASK-Graphview能夠?qū)?600萬(wàn)條邊圖進(jìn)行分層可視化.這些方法技術(shù)將為大數(shù)據(jù)時(shí)代大規(guī)模圖可視化提供有力支持,同時(shí)我們應(yīng)該看到,交互技術(shù)引入,也將是處理大規(guī)模圖可視化不可或缺伎倆數(shù)據(jù)可視化技術(shù)分析第22頁(yè)返回大數(shù)據(jù)環(huán)境下數(shù)據(jù)可視化時(shí)空數(shù)據(jù)是指帶有地理位置與時(shí)間標(biāo)簽數(shù)據(jù).傳感器與移動(dòng)終端快速普及,使得時(shí)空數(shù)據(jù)成為大數(shù)據(jù)時(shí)代經(jīng)典數(shù)據(jù)類型.時(shí)空數(shù)據(jù)可視化與地理制圖學(xué)相結(jié)合,重點(diǎn)對(duì)時(shí)間與空間維度以及與之相關(guān)信息對(duì)象屬性建立可視化表征,對(duì)與時(shí)間和空間親密相關(guān)模式及規(guī)律進(jìn)行展示.大數(shù)據(jù)環(huán)境下時(shí)空數(shù)據(jù)高維性、實(shí)時(shí)性等特點(diǎn),也是時(shí)空數(shù)據(jù)可視化重點(diǎn).數(shù)據(jù)可視化技術(shù)分析第23頁(yè)返回大數(shù)據(jù)環(huán)境下數(shù)據(jù)可視化為了反應(yīng)信息對(duì)象隨時(shí)間進(jìn)展與空間位置所發(fā)生行為改變,通常經(jīng)過信息對(duì)象屬性可視化來(lái)展現(xiàn).流式地圖Flowmap是一個(gè)經(jīng)典方法,將時(shí)間事件流與地圖進(jìn)行融合,下列圖

顯示了使用Flowmap分別對(duì)1864年法國(guó)紅酒出口情況以及拿破侖進(jìn)攻俄羅斯情況可視化例子.數(shù)據(jù)可視化技術(shù)分析第24頁(yè)返回大數(shù)據(jù)環(huán)境下數(shù)據(jù)可視化散點(diǎn)圖(scatterplot)是最為常用多維可視化方法,二維散點(diǎn)圖將多維中兩個(gè)維度屬性值集合映射至兩條軸,在二維軸確定平面內(nèi)經(jīng)過圖形標(biāo)識(shí)不一樣視覺元素來(lái)反應(yīng)其他維度屬性值,比如,可經(jīng)過不一樣形狀、顏色、尺寸等來(lái)代表連續(xù)或離散屬性值。以下列圖所示.二維散點(diǎn)圖能夠展示維度十分有限。研究者將其擴(kuò)展到三維空間,經(jīng)過可旋轉(zhuǎn)Scatterplot方塊(dice)擴(kuò)展了可映射維度數(shù)目,以下列圖中右圖所示.散點(diǎn)圖適合對(duì)有限數(shù)目標(biāo)較為主要維度進(jìn)行可視化,通常不適于需要對(duì)全部維度同時(shí)進(jìn)行展示情況.數(shù)據(jù)可視化技術(shù)分析第25頁(yè)返回大數(shù)據(jù)環(huán)境下數(shù)據(jù)可視化投影(projection)是能夠同時(shí)展示多維可視化方法之一.如左圖所表示,VaR將各維度屬性列集合經(jīng)過投影函數(shù)映射到一個(gè)方塊形圖形標(biāo)識(shí)中,并依據(jù)維度之間關(guān)聯(lián)度對(duì)各個(gè)小方塊進(jìn)行布局.基于投影多維可視化方法首先反應(yīng)了維度屬性值分布規(guī)律,同時(shí)也直觀展示了多維度之間語(yǔ)義關(guān)系.平行坐標(biāo)(parallelcoordinates)是研究和應(yīng)用最為廣泛一個(gè)多維可視化技術(shù),如右圖

所表示,將維度與坐標(biāo)軸建立映射,在多個(gè)平行軸之間以直線或曲線映射表示多維信息.近年來(lái),研究者將平行坐標(biāo)與散點(diǎn)圖等其它可視化技術(shù)進(jìn)行集成,提出了平行坐標(biāo)散點(diǎn)圖PCP(parallelcoordinateplots).數(shù)據(jù)可視化技術(shù)分析第26頁(yè)返回問題與挑戰(zhàn)(1)多源、異構(gòu)、非完整、非一致、非準(zhǔn)確數(shù)據(jù)集成與接口大數(shù)據(jù)可視化所依賴基礎(chǔ)是數(shù)據(jù),而大數(shù)據(jù)時(shí)代數(shù)據(jù)起源眾多。且對(duì)來(lái)自于異構(gòu)環(huán)境,即使取得數(shù)據(jù)源,得到數(shù)據(jù)完整性、一致性、準(zhǔn)確性都難以確保。數(shù)據(jù)質(zhì)量不確定問題將直接影響可視化分析科學(xué)性和準(zhǔn)確性,大數(shù)據(jù)可視化前提是建立在集成數(shù)據(jù)接口,而且與可視化分析系統(tǒng)形成松耦合接口關(guān)系,以供各種可視化算法方便調(diào)用,使得可視

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論