




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第1章前言1.1研究背景可視化的理論思想誕生于15至17世紀,自此人們對數(shù)據可視化的早期探索正式開始;18世紀,數(shù)據可視化實現(xiàn)了初期的發(fā)展,各類圖標在人們的視野中出現(xiàn);19世紀前期,由于工業(yè)的迅速發(fā)展,人們開始發(fā)現(xiàn)數(shù)據在經濟發(fā)展中的作用,19世紀后期,隨著第一次工業(yè)革命,數(shù)據可視化收到了人們廣泛關注,它的發(fā)展迎來了首個黃金時期,圖表和圖形等被廣泛應用到人們的生產與生活中;20世紀前期;早期的數(shù)據可視化表達方式已經滿足了當時的需求,因而對于圖表、圖形表達的研究沒有進一步發(fā)展下去;20世紀中后期直至今天;科技迅猛發(fā)展,以信息科學與技術為代表的第三產業(yè)的不斷發(fā)展,數(shù)據可視化技術展現(xiàn)出新的生機與活力,開始進入高速發(fā)展階段,并取得了明顯進步,越來越多的應用到了生產與生活中來。目前,數(shù)據可視化的展示方式已超過30種,每一種特定的方式都有它的用處。正因為數(shù)據可視化的方法不斷發(fā)展進步,我們已經不局限于柱狀圖和餅狀圖。數(shù)據可視化有很多好處,但他們往往因為缺乏理解而有所不足。需要我們進一步進行研究和探索。隨著醫(yī)學的不斷發(fā)展,我國傳統(tǒng)中醫(yī)得到了長足發(fā)展,不斷融入最新的科學技術,與時俱進。數(shù)據可視化技術在中醫(yī)用藥分析中起到了極大的作用,越來越多的中醫(yī)用藥數(shù)據分析通過數(shù)據可視化來實現(xiàn),簡化步驟、提高效率,是促進中醫(yī)進步的重要動力。1.2研究意義隨著不斷增長的信息量,要求人們需要具備更加快捷的信息處理方式,所以人們對數(shù)據可視化的需求也大大增加。如今,有三十多種可視化數(shù)據的方式,每種特定方式都有其用途。隨著可視化方法的不斷發(fā)展,我們不再局限于條形圖和餅圖。數(shù)據可視化有很多好處,但是由于缺乏了解而常常受到限制。在某些情況下,同一張上的圖表上內容過多可能會導致整個圖表紛繁紛雜,不便于人們直觀的去理解和使用。我們可以采取用的呈現(xiàn)數(shù)據的方式有很多,但在大多數(shù)情況下只有少數(shù)幾種適用。本文從數(shù)據可視化技術研究和發(fā)展的背景入手,對數(shù)據可視化技術的國內外研究現(xiàn)狀進行了介紹,對數(shù)據可視化與中醫(yī)的相關性進行了分析,對近些年來所實現(xiàn)的成果做了介紹。通過R語言實現(xiàn)數(shù)據可視化技術在中藥分析中的靈活、適當?shù)膽?,以提高可視化技術在中藥分析中的使用率,為知識的傳播與交流提供新的途徑,增強知識密度,提高決策和解決問題的能力。探索中醫(yī)藥與可視化的相關性,分析其在中醫(yī)藥領域的應用,實現(xiàn)可視化技術與中醫(yī)藥分析的更好結合,為中醫(yī)藥的發(fā)展提供更多線索,研究多樣的數(shù)據可視化展示方式,為中醫(yī)可視化技術的發(fā)展提供技術支持。1.3國內外研究現(xiàn)狀數(shù)據可視化技術是為了改進科學計算和輔助處理大量數(shù)據而誕生的,隨之創(chuàng)建了第一個數(shù)據可視化視圖,伴隨著信息技術的快速發(fā)展,產生了大量的沒有經過科學處理的數(shù)據,由于信息過于冗雜,數(shù)據大都沒有辦法獲得適當采用。1987年,美國科學基金協(xié)會在一次專題討論會上提出“科學計算可視化”理論,一門嶄新學科就此誕生,從此,國內外掀起了數(shù)據可視化的熱潮,國內也逐步把數(shù)據可視化技術與各行各業(yè)相聯(lián)系,中國傳統(tǒng)中醫(yī)也順應時代發(fā)展的潮流融入到了數(shù)據可視化的領域中來。諾維薩德大學(2019)進行了對Pacs設計中數(shù)據可視化技術的實證研究[1]。圣保羅大學(2018)在信息可視化領域的發(fā)現(xiàn):用于距離信息的用戶輔助投影技術[2]。俄勒岡大學(2018)的研究人員討論了數(shù)據分析用于模擬、可視化和數(shù)據分析的數(shù)據簡化技術方面的發(fā)現(xiàn)[3].紐約大學(2018)以圖書館為主導開創(chuàng)了“數(shù)據可視化診所”,開創(chuàng)了數(shù)據可視化技術中的新概念、新思路[4]。孟洪宇等人(2018)從數(shù)據可視化技術的發(fā)展歷程入手,對信息和知識可視化在本源、理論根本、目的、數(shù)據可視化目標、描述目標、方法、參與者類型和互補方法等方向進行對比[5]。單琪媛等人(2019)根據近年來國內和國際中藥質譜可視化分析技術的研究資料,對質譜數(shù)據的可視化技術包括在中藥分析中的具體應用進行詳細介紹[6]。許茜等人(2019)基于當前大數(shù)據的發(fā)展現(xiàn)狀對醫(yī)學數(shù)據分析的可視化進行了進一步的探索。楊慧等人(2018)從醫(yī)學可視化圖像與可視化技術的專利目前的發(fā)展狀況入手對醫(yī)學圖像可視化技術進行介紹,并結合各階段專利申報量和重要申報人探究了該項技術的專利情況,并對專利的研究前景和研究趨勢做出總結[7]。
1.4論文主要研究內容本文的主要研究內容是對數(shù)據可視化的研究背景、研究意義和種類進行討論,對常用的展示方式進行討論,進一步探索在將數(shù)據可視化技術應用到中醫(yī)用藥分析過程中對可視化展示方式的選擇,在綜合先前的研究結果的基礎上,將調查研究法、學術研究法、信息研究法和實驗法等研究方法與文獻研究法相結合,通過對中醫(yī)用藥分析的數(shù)據可視化展示方式進行研究,使得人們掌握和分析中醫(yī)用藥數(shù)據更加直觀、便捷。1.5關鍵問題及解決方法本文關鍵問題是如何在實驗過程中選擇合適的數(shù)據可視化的展示方式和如何對選擇的可視化展示方式進行合理的處理,選擇合適的數(shù)據可視化展示方式并不容易,每個圖表都有其優(yōu)點和局限性,同一類圖表中也會有不同的分類,需要我們恰當?shù)膽?。例如,柱狀圖分為一般柱狀圖、分組柱狀圖、堆積柱狀圖、橫線柱狀圖、雙向柱狀圖等。通過對中醫(yī)用藥分析中產生的數(shù)據進行分析,采用不同的數(shù)據可視化展示方式,比較不同數(shù)據可視化展示方式的優(yōu)缺點,著重注意圖表的細節(jié)部分,采用合理的處理方式,提出相應的改進的策略與方向。1.6論文組織結構本文總共分為6個章節(jié),第1章是論文的前言,詳細的介紹了本文的研究意義和背景說明本文完成的意義在于探索中醫(yī)藥與可視化的相關性,并分析其在中醫(yī)用藥范圍內的應用及思想理論成果,目的是為我國傳統(tǒng)中醫(yī)發(fā)展和進步探索更多的新思路、新技術、新方法;第2章是數(shù)據可視化與中醫(yī)的相關性分析,詳細介紹了數(shù)據可視化在中醫(yī)中的應用,進行數(shù)據可視化和中醫(yī)的相關性分析為下一章展示方式的分析做了理論準備;第3章進行了數(shù)據可視化分析中常用展示方式的優(yōu)缺點對比,通過舉例直觀的展示了不同展示方式的效果與優(yōu)缺點;第4章是基于R語言數(shù)據可視化技術的實現(xiàn),通過R語言實現(xiàn)中醫(yī)用藥數(shù)據分析的可視化展示,對采用的可視化展示方式進行分析和總結。第5章是數(shù)據可視化展示方式的改進策略研究;最后是結語,總結全文并提出了未來的展望和可視化技術的展示方式在今后的發(fā)展方向。第2章數(shù)據可視化的介紹以及在中醫(yī)領域的應用2.1數(shù)據可視化技術2.1.1介紹數(shù)據可視化技術是指通過信息技術,以圖表的形式將數(shù)據簡明的呈現(xiàn)出來,并進行交互處理的理論、方法和技術[8]。它可以通過圖表對大量的數(shù)據進行分析和處理,體現(xiàn)信息模型、變量之間的關系和變化方向,方便人們對信息的獲取和利用,便于人們快速的進行決策,加強人和各類數(shù)據的聯(lián)系,探究包含在其中的客觀規(guī)律。數(shù)據可視化技術中最根本的觀念是把數(shù)據庫中的每一項拆分為單個變量,變量的總和組成一個可視化的圖表。2.1.2數(shù)據可視化技術的主要特點(1)人機交互,讀者可以更加便利地與數(shù)據進行交互和處理;(2)多維展示,可以從多個維度看到目標變量的屬性,并且可以根據他們各自的特點,對其歸類、排列、組合和展示[9];(3)可視化展示,數(shù)據可以根據需求制作成不同樣式的圖表來進行展示[10]。2.2數(shù)據可視化技術和中醫(yī)的相關性分析數(shù)據可視化技術中的概念和方法與中醫(yī)有著密不可分的聯(lián)系:數(shù)據可視化技術能夠對海量的中醫(yī)信息進行分析,進而詳細的分類和整理,把醫(yī)學數(shù)據進行可視化展示,有利于更好的對醫(yī)學信息進行解讀和對未來將會產生的信息進行估計。同時中醫(yī)在我國發(fā)展歷史悠久,信息的體量也會十分龐大,體系之多,信息之雜,是人無法簡單的用肉眼去進行辨別分析的,給醫(yī)學者進行醫(yī)學研究和用藥分析等帶來了極大的困擾,但是通過采用數(shù)據可視化技術,為我們研究龐大信息中的內在關聯(lián)和其所含的價值提供了便利,使中醫(yī)用藥更加合理和適當。數(shù)據可視化技術對研究對象知識類型的分類。第一類是顯性知識型,第二類是隱形知識型。他們在中醫(yī)研究中起到了不同的作用,第一類為中醫(yī)基本原理等的掌握,望、聞、問、切四種診察疾病方法后信息的收集與整理,用藥的判斷和采納,遣方用藥思路,經絡治療配穴方法等,數(shù)據可視化技術可以將數(shù)據轉化為方便人們理解的圖形,便于醫(yī)者進行信息理解和新思路的開創(chuàng)。第二類為我國中醫(yī)的傳承起到了重要作用,中醫(yī)在歷史經驗和思路中存在著大量的隱性知識信息,而這些寶貴的信息由于太過龐大不利于我國中醫(yī)的傳承、發(fā)揚與進步,數(shù)據可視化可以把第一類知識類型轉化為第二類知識類型,提高人們對中醫(yī)隱形知識的關注度,為中醫(yī)的傳承提供了新途徑、新方法,進一步方便了醫(yī)學研究者的對病情的分析與判斷。我國的傳統(tǒng)中醫(yī)在不斷的發(fā)展中形成了規(guī)模大、內容完善的理論體系,包含了復雜且繁多的知識與信息。例如,傳統(tǒng)中醫(yī)基本原理所包含的數(shù)據可視化技術的對象以及與之相關聯(lián)的基本概念,存在著大量的一維信息;傳統(tǒng)中醫(yī)的陰陽調和中又蘊含著二維信息;臟腑位置以及體表投影的相關性展現(xiàn)的是統(tǒng)一體的觀念,同時也從另一方面展現(xiàn)了三維映射的關聯(lián);中醫(yī)基礎原理中所涉及到的的精、氣、血、津液學說等都是多維信息的表現(xiàn)。2.3數(shù)據可視化技術在中醫(yī)中的應用Flash的使用使中醫(yī)藏象理論系統(tǒng)的可視化教學方式發(fā)生了改變[11];中醫(yī)藏象理論歷史悠久,其理論淵源于我國傳統(tǒng)文化,具有非常豐富的歷史文化內涵,內容十分廣泛,嚴謹又復雜。Flash能夠生動形象的展示中醫(yī)理論內涵;通過對教學方法的不斷研究與創(chuàng)新改革教學方法使中醫(yī)能夠生動、輕松地理解“藏象理論”的抽象性和含糊不清的知識,使它更具有準確性和系統(tǒng)性?;贑iteSpaces對中醫(yī)體質學說知識圖譜進行可視化分析和展示[12]:它的目的是對“中醫(yī)體質”進行系統(tǒng)的文獻計量學和視覺分析,探尋40多年來中醫(yī)體質的發(fā)展變化情況,對需要我們去重點關注的方向和未來的發(fā)展趨勢進行研究與討論。采用的方法主要是以1975年至2017年CNKI收集的所有相關文獻為對象,進行定量分析。同時,使用CiteSpace5.1對文獻中的機構和關鍵字進行共現(xiàn)分析,并繪制相關的視覺圖。結果,總共查詢到了了5882篇文章,通過定量分析,訪問了一個高產機構和代表性研究人員及其團隊,通過視覺分析,“中醫(yī)體質識別”,“糖尿病”和“危險因素”是其中出現(xiàn)次數(shù)最多。結論:圖譜引領了這一領域的發(fā)展趨勢,并找到了研究熱點,研究疾病的治療方法和危險因素是今后體質研究的重要方向。中國古代中醫(yī)傳統(tǒng)針灸銅人的可視化探索[13]:3D激光掃描為解決針灸銅人等文化遺產單一的數(shù)字保護手段,經驗不足,傳播力弱的問題提供了新手段新方法,這種方法又分為3D可視化和VR技術的數(shù)字化方法。以穴位青銅針灸舉例說明,它第一次將3D激光掃描技術用于數(shù)據采集和3D模型的建立。其次,XML語言被應用于中醫(yī)用藥知識的表現(xiàn)和儲存。同時,他們對二次誤差度量和漸進網格算法進行優(yōu)化用于自動生成針灸銅人多分辨率簡化模型。最后,使用Unity引擎研發(fā)了一套VR針灸青銅人互動顯示系統(tǒng),可以實現(xiàn)3D場景中穴位,經絡,常見病等中醫(yī)知識的快速可視化和互動查詢,為歷史文物和非物質文化遺產的數(shù)字保護和傳播提供參考?;诿}搏脈沖信息獲取的中醫(yī)脈診數(shù)字化與可視化研究[14]:脈診信息模糊不清,無法量化和主觀判斷,對保持中醫(yī)診斷的客觀性造成了困難。目前,中國傳統(tǒng)脈息診斷儀的類似特征是在一維記錄脈壓波動信號。因此,獲得的脈沖診斷信號的特征參數(shù)不足以完全體現(xiàn)傳統(tǒng)脈沖中包含的所有信息。在文獻綜述和脈搏診斷經驗總結的基礎上,本研究運用現(xiàn)代科學技術手段,研究了中醫(yī)脈搏診斷信息采集的關鍵技術。本文突破了僅從“脈沖位置和脈沖數(shù)”分析單個信號特征參數(shù)的缺點。在理論和技術的指導和支持下,成功實現(xiàn)了多維脈沖信息的同步采集,并著重強調了“脈沖形狀和脈沖電位”的信息采集和表達。在數(shù)字仿真和重構四個脈沖診斷屬性的基礎上,觸覺信息可視化的階段性工作已經初步完成。第3章數(shù)據可視化的主要展示方式和中醫(yī)藥特點分析3.1引言數(shù)據可視化展示是指通過借助抽象化的技術手段,將復雜的數(shù)據用圖表的方式呈現(xiàn),有效的可視化背后的主要原則是能夠突出你要表現(xiàn)的核心問題,根據觀眾的需求和接受程度,對數(shù)據實現(xiàn)精確的呈現(xiàn),并且傳造出能夠清晰傳達信息的而可視化結果,本章的主要工作是進行數(shù)據可視化分析中常用展示方式的對比和優(yōu)缺點分析。3.2基本圖形分析1.條形圖,又稱條形統(tǒng)計圖優(yōu)點:可以清楚的反映數(shù)量,便于比較。缺點:統(tǒng)計的類別比較少,比較單調。簡介:條形圖是長度的單位,代表著數(shù)量的多少,根據數(shù)量的多少繪制成不同長度的直條,然后按順序排列這些直條。從條形圖可以很容易地看到各種數(shù)字。條形圖通常稱為條形圖,也稱為條形圖或直條形圖。分類:條形統(tǒng)計圖分為:單式條形統(tǒng)計圖和復式條形統(tǒng)計圖,前者只表示1個項目的數(shù)據,后者可以同時表示多個項目的數(shù)據。頻數(shù):頻數(shù)是數(shù)據分布在不同區(qū)域內的個數(shù)。頻率:頻數(shù)與數(shù)據總和的比例為頻率,頻率×100%就是百分比。舉例:圖3-1條形圖2.餅圖優(yōu)點:能夠清楚的表示各個部分占總體的比例情況。缺點:肉眼對面積大小不敏感。簡介:餅圖是統(tǒng)計學中的常用圖表,往往只有一個數(shù)據系列,區(qū)域的大小代表了再綜合中的比率。分類:餅圖和三維餅圖;復合餅圖和復合條形圖;單獨的餅圖和單獨的三維餅圖:單獨的餅圖顯示每個值相對于總值的大小,同時強調每個值。分離的餅圖可以以三維格式顯示。這樣,扇面可以手動拉出。舉例:圖3-2年齡分布餅圖3.直方圖優(yōu)點:更直觀的傳遞過程質量狀態(tài)信息;在對質量的變化進行研究之后,我們可以控制過程的狀態(tài),并決定將我們的精力更多的集中在提高質量上。缺點:無法輕松的找到問題的重點現(xiàn)象。簡介:直方圖,又稱質量分布圖,是一種統(tǒng)計報表圖形,其數(shù)據分布由一系列不同高度的垂直條紋或線段來表示。橫軸常用于表示數(shù)據的類型,縱軸常用于表示數(shù)據的分布。直方圖是對連續(xù)變量概率分布的估計,由卡爾·皮爾遜首次提出。這是一個條形圖。要建立直方圖,首先要分割數(shù)值范圍,簡單地說就是將整個數(shù)值范圍劃分不同的區(qū)間,然后計算每個區(qū)間中數(shù)值的多少。直方圖也可以被歸一化以顯示“相對”頻率。舉例:圖3-3直方圖4.樹狀圖優(yōu)點:比較直觀,易于理解。缺點:不適用于較大范圍的情況。介紹:樹形圖,也叫樹狀圖。樹圖是數(shù)據樹的圖形表示形式,它以父-子層次結構組織對象。分類:為根據分支,關系可以被表示,其具有二維和三維維度。數(shù)量分類學中用于表型分類的樹形圖稱為現(xiàn)象圖,與系統(tǒng)推理相混合的樹形圖稱為分支圖進行區(qū)分。表型樹圖是根據群體分析繪制的,而系統(tǒng)樹圖是由計算機根據模擬的假設字符進化方向繪制的。舉例:圖3-4聚類樹狀圖5.網狀圖優(yōu)點:明確表達事物之間的邏輯關系,選定關鍵工作和關鍵路徑。缺點:進度狀況不能一目了然,繪圖難度和修改工作量很大,應用要求高,繪圖識別困難。介紹:網狀圖是一種具有網絡形狀的圖形化模型,因此被稱為網狀圖。網狀圖通常用來表示事物之間的聯(lián)系程度。分類:雙代號網狀圖使用箭頭線表示一個活動,活動的名稱寫在箭頭線上。箭頭表示活動的結束。單代號網狀圖用圓圈表示單個網狀圖中的一個活動,并在圓圈中寫上該活動的名稱。箭頭線用于表示相關活動之間的前后次序,沒有其他含義。由于它的活動只能用一個符號表示,所以它被稱為單代碼網狀圖。舉例:圖3-5網狀圖3.3中醫(yī)藥信息特點分析我國中醫(yī)藥信息具備三大特點:1.傳統(tǒng)性我國傳統(tǒng)中醫(yī)發(fā)展歷史悠久,數(shù)量巨大,大量的中醫(yī)用藥數(shù)據在歷史的發(fā)展中得以保留,自戰(zhàn)國時期直至建國以前有記錄的中醫(yī)藥書籍就超過一萬多種,而在民間廣泛流傳的不同時期的不同版本更是接近四萬種,同時還存在著無法實際考證的書籍,如此龐大的數(shù)據體量帶來的是難以考證和無法處理。中藥藥方分析困難,對未來中醫(yī)發(fā)展的延續(xù)性造成了阻礙。2.民族性我國有56個民族,各個民族都在長期的歷史發(fā)展中形成了各自的文化,中醫(yī)藥也在各民族的努力中不斷發(fā)展,但恰恰由于各民族文化差異,中醫(yī)用藥方法也出現(xiàn)了差別,收集整理工作成為了極為重要的部分。3.世界性隨著世界醫(yī)療水平的發(fā)展,我國傳統(tǒng)中醫(yī)進入到了國際化的階段,中醫(yī)用藥數(shù)據需要經過合理的處理和加工才能更便于國際化的發(fā)展。3.4小結上述展示的可視化展示方式中,最常用的是條形圖和餅圖,它們的結構都十分簡單,即使讀者不具備較高的知識水平也能夠輕松閱讀。結合我國傳統(tǒng)中醫(yī)目前的發(fā)展現(xiàn)狀,根據上述幾類數(shù)據可視化展示方式的優(yōu)缺點分析,大多數(shù)可視化方式都能夠應用到中醫(yī)用藥分析中,但是根據中醫(yī)用藥數(shù)據的特點,比較適合采用的有條形圖、網狀圖、樹狀圖等,它們既能對中醫(yī)用藥中的數(shù)據比例、使用頻次進行展示,又能明顯的展示出各類中藥材之間的聯(lián)系。第4章基于R語言數(shù)據可視化技術的實現(xiàn)4.1引言數(shù)據可視化的本質是將大量的數(shù)據進行合理的規(guī)劃和處理,使數(shù)據的表現(xiàn)形式由復雜到簡單,其根本意義是利用數(shù)據做出決策。可視化的工具種類較多,本文是基于R語言進行數(shù)據可視化技術的實現(xiàn),通過R語言實現(xiàn)中醫(yī)藥數(shù)據分析的可視化展示。4.2可視化工具介紹R語言被使用于統(tǒng)計計算、繪制圖表、數(shù)據挖掘的軟件中,它的創(chuàng)始人是新西蘭奧克蘭大學。目前由R語言開發(fā)核心團隊開發(fā),在數(shù)據統(tǒng)計分析、繪圖等領域的應用廣泛。R軟件的語言環(huán)境能夠為用戶的個性化設計提供極大的便利,并且是免費、開源的軟件,再國內和國外廣受歡迎。R語言的三大繪圖系統(tǒng):基本繪圖系統(tǒng)(BasePlottingSystem):需要事先計劃;能夠直接地及時反映繪圖與分析數(shù)據的邏輯圖+修飾常用于繪制2D圖。Lattice繪圖系統(tǒng)(LatticePlottingSystem):簡單的成圖方式適用于觀察變量之間的交互:ggplot2繪圖系統(tǒng)(ggplotwPlottingSystem):能夠把圖和數(shù)據之間進行分離。4.3實驗數(shù)據本實驗數(shù)據來源于中藥抗病毒方藥數(shù)據平臺,包含726種中藥藥品,36種針對病毒性肺炎的方劑,本文選取其中15種藥品進行數(shù)據可視化展示,根據他們的藥物組合、關聯(lián)規(guī)則、藥物頻次,以柱狀圖、網狀圖、樹狀圖為例進行可視化分析。表4-1關聯(lián)規(guī)則No.中藥名稱置信度1桔梗,金銀花,杏仁->連翹12金銀花,杏仁,桔梗->連翹13石膏,杏仁->麻黃14麻黃,石膏->杏仁15石膏,甘草,杏仁->麻黃16石膏,杏仁,甘草->麻黃17麻黃,桔梗->杏仁18麻黃,甘草->杏仁0.93759甘草,麻黃->杏仁0.937510桔梗,甘草->杏仁0.90909111甘草,桔梗->杏仁0.90909112桔梗,金銀花->連翹0.913金銀花,桔梗->連翹0.914前胡->杏仁0.88888915石膏->麻黃0.88888916石膏->杏仁0.88888917生石膏,金銀花->杏仁0.88888918麻黃,生石膏->杏仁0.88888919陳皮->金銀花0.87520生石膏->杏仁0.85714321魚腥草,生石膏->杏仁0.85714322生石膏,魚腥草->金銀花0.85714323金銀花,大青葉->連翹0.85714324甘草,石膏->麻黃0.857143表4-2藥物頻次No.中藥名稱用藥頻次1杏仁352甘草283金銀花274麻黃255連翹246桔梗197魚腥草168生石膏149大青葉1010前胡911北沙參912板藍根913石膏914葶藶子915陳皮84.4實驗過程本文主要采用的工具包主要有tidyverse包、ggplot2包、networkD3包、stringr包、picante包、ape包。1.柱形圖:name2<-"pinci.txt"pinci2<-read.table(name2,sep="\t",header=1)view(pinci2)data_pinci2<-data.frame(pinci2)data_pinci2<-data_pinci2[c(1:15),]ggplot(data_pinci2,aes(data_pinci2$藥物名稱,data_pinci2$頻次))+geom_bar(stat="identity",aes(fill=data_pinci2$藥物名稱))+labs(x="藥物名稱",y="頻次",fill="藥物名稱")ggsave(file="藥物頻次.png")2.網狀圖:name_guize<-"guize.txt"guize1<-read.table(name_guize,sep="\t",header=1)#View(guize1)data_guize<-data.frame(guize1)data_guize1<-data_guize%>%mutate(長度=str_length(data_guize$藥物關聯(lián)規(guī)則),藥物1=str_sub(data_guize$藥物關聯(lián)規(guī)則,1,3),藥物2=str_sub(data_guize$藥物關聯(lián)規(guī)則,1,3),藥物3=str_sub(data_guize$藥物關聯(lián)規(guī)則,1,3),關聯(lián)藥物=str_sub(data_guize$藥物關聯(lián)規(guī)則,1,3))#view(data_guize1)data_guize1$藥物1[c(1)]<-c(str_sub(data_guize$藥物關聯(lián)規(guī)則,1,3)[c(1)])for(iin1:length(data_guize1$長度)){if(data_guize1$長度[i]==22){data_guize1$藥物1[c(i)]<-str_sub(data_guize$藥物關聯(lián)規(guī)則,1,3)[c(i)]data_guize1$藥物2[c(i)]<-str_sub(data_guize$藥物關聯(lián)規(guī)則,7,9)[c(i)]data_guize1$藥物3[c(i)]<-str_sub(data_guize$藥物關聯(lián)規(guī)則,13,15)[c(i)]data_guize1$關聯(lián)藥物[c(i)]=str_sub(data_guize$藥物關聯(lián)規(guī)則,19,22)[c(i)]}elseif(data_guize1$長度[i]==16){data_guize1$藥物1[c(i)]<-str_sub(data_guize$藥物關聯(lián)規(guī)則,1,3)[c(i)]data_guize1$藥物2[c(i)]<-str_sub(data_guize$藥物關聯(lián)規(guī)則,7,9)[c(i)]data_guize1$藥物3[c(i)]<-NAdata_guize1$關聯(lián)藥物[c(i)]<-str_sub(data_guize$藥物關聯(lián)規(guī)則,13,16)[c(i)]}elseif(data_guize1$長度[i]==10){data_guize1$藥物1[c(i)]<-str_sub(data_guize$藥物關聯(lián)規(guī)則,1,3)[c(i)]data_guize1$藥物2[c(i)]<-NAdata_guize1$藥物3[c(i)]<-NAdata_guize1$關聯(lián)藥物[c(i)]<-str_sub(data_guize$藥物關聯(lián)規(guī)則,7,10)[c(i)]}}#View(data_guize1)data_guize2<-tibble(藥物=list(c(data_guize1$藥物1,data_guize1$藥物2,data_guize1$藥物3)),關聯(lián)藥物=list(rep(data_guize1$關聯(lián)藥物,times=3)))#View(data_guize2)networkdata<-data.frame(data_guize2$藥物[[1]][!is.na(data_guize2$藥物[[1]])],data_guize2$關聯(lián)藥物[[1]][!is.na(data_guize2$藥物[[1]])])simpleNetwork(networkdata,zoom=T,fontFamily="黑體",fontSize=20,width=1200,height=500,linkColour="black",nodeColour="black",linkDistance=200)3.樹狀圖:data_shu<-data_pinci2view(data_shu)s(data_shu)<-data_shu$藥物名稱data_shu1<-hclust(dist(data_shu),method="median")plot(data_shu1,hang=0.3,cex=1,xlab="藥物名稱",ylab="頻次",main="聚類樹狀圖")plot(as.phylo(data_shu1),type="fan")4.5實驗效果柱形圖圖4-1柱形圖2.網狀圖圖4-2網狀圖樹狀圖圖4-3樹狀圖4.5實驗總結(1)柱狀圖:對這十五種藥品的使用頻次采用的是柱狀圖的表現(xiàn)形式,并采用了不同的色彩使它們之間的差異更加明顯,可以直觀的看出杏仁的使用頻次最多而陳皮的使用頻次最少。(2)網狀圖:對這十五種藥品的關聯(lián)規(guī)則采用的是網狀圖的表現(xiàn)形式,呈網狀表現(xiàn)出來,很容易讓人發(fā)現(xiàn)其中的焦點,可以直觀的看出與杏仁的相關的藥品最多而與陳皮、大青葉、前胡、黃麻相關藥品的使用頻次最少。(3)樹狀圖:對這十五種藥品的頻次采用的是聚類樹狀圖的表現(xiàn)形式,呈樹狀表現(xiàn)出來,很容易讓人對其進行分類,可以直觀的看出哪幾類能夠分為一組,同時可以根據自己的需求進行分群。柱狀圖和樹狀圖擅于展示各類藥品之間的數(shù)量關系,能夠十分簡潔明了的將藥品的頻次表現(xiàn)出來,通過不同的顏色加深視覺效果也進行了引導性的分類,柱狀圖由于自身的簡潔性也便于進行標注,方便對比,具有普適性。網狀圖則擅于表現(xiàn)各個藥品之間的關聯(lián)程度,但是較為復雜,需要具備一定的知識背景。實驗所展現(xiàn)的可視化展示方式,是十分基礎的展示方式,僅能夠滿足人們的正常使用,如果對數(shù)據可視化展示方式有更高的要求則需要進一步的優(yōu)化。數(shù)據可視化展示方式改進策略研究5.1引言可視化展示方式的選擇決定能否將數(shù)據良好的呈現(xiàn),而一個好的可視化展示方式,在科技快速發(fā)展的今天也會逐漸暴露出缺陷,可視化視圖的改進就變得尤為重要,一個好的視圖能夠吸引人們的注意力,促進深入理解,快速幫助人們進行決策,本章從可視化視圖入手進行改進。5.2改進策略1.對比數(shù)據可視化使比較更容易,并使我們能夠直觀地看到兩個不同的數(shù)據集之間的差異。但是僅僅將兩張圖表并排放置進行比較并不一定能實現(xiàn)這個目標。在實際操作中,它可能會變得更加混亂。方法:(1)盡可能地包括零基線。從零基線開始雖然不是很折線圖的必備要素,但如果它提供了更多的比較背景,則應該包括在內。如果數(shù)據中呈現(xiàn)出的較小波動是有用的,可以通過截斷比率來凸顯差異。(2)選擇最優(yōu)的可視化展示方式。如果對視覺一致性有一定的需求,需要讓讀者更方便的進行比較。我們就需要從折線圖、條形圖等便于比較的圖表中進行選擇。我們要始終把便于讀者的比較和了解放在第一位。圖4-4餅圖和條形圖效果對比2.顏色
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025《煤炭采購合同》
- 2025年企業(yè)用工勞動合同模板
- 殘疾兒童護理員職業(yè)道德
- 華為干部能上能下的案例
- 人力資源培訓管理計劃
- 組織部規(guī)范化課件
- 就業(yè)與創(chuàng)業(yè)行業(yè)定位自我認知
- 艾滋病病毒對免疫系統(tǒng)的破壞
- 北京青年政治學院復試指南
- 2025年陜西道路貨運駕駛員從業(yè)資格考試題庫
- 塞內加爾歷史與現(xiàn)在
- 《中國的科技成就》課件
- T-JYBZ 024-2022《幼兒園戶外游戲場地玩教具配備規(guī)范》
- 關于太空垃圾
- 美妝博主營業(yè)方案
- 流體壓強與流速的關系市公開課一等獎說課公開課獲獎課件百校聯(lián)賽一等獎課件
- 舞臺劇聯(lián)合投資協(xié)議書模板
- GA/T 804-2024機動車號牌專用固封裝置
- 術中獲得性壓力性損傷預防
- 助理醫(yī)師結業(yè)考試真題與答案
- 走近湖湘紅色人物智慧樹知到答案2024年湖南工商大學
評論
0/150
提交評論