下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
數(shù)據(jù)挖掘技術(shù)在中醫(yī)藥研究中的應(yīng)用
挖掘挖掘技術(shù)是一種有效的信息處理技術(shù),可以分析中醫(yī)個(gè)性化診斷信息的特點(diǎn),提取其原有的新理論、新方法,有效總結(jié)和傳承中醫(yī)經(jīng)驗(yàn)。中醫(yī)藥研究歷經(jīng)數(shù)千年總結(jié)發(fā)展后,在許多方面積累了豐富的數(shù)據(jù),這些數(shù)據(jù)具有明顯的海量特征,但它們又多以零散的形式存儲在各種文獻(xiàn)中。對如此海量且無序的數(shù)據(jù),若僅憑個(gè)人思維綜合分析,會受到認(rèn)識水平、思維方式、主觀因素以及研究方法和研究范圍的限制。利用數(shù)據(jù)挖掘相關(guān)技術(shù)進(jìn)行知識的獲取研究,在眾多的中醫(yī)藥資源中去偽存真、去粗取精,以促進(jìn)中醫(yī)藥事業(yè)的發(fā)展,是中醫(yī)藥現(xiàn)代化研究的重要組成部分。數(shù)據(jù)挖掘作為一個(gè)在海量數(shù)據(jù)中獲取知識的有力工具,已在中醫(yī)藥領(lǐng)域得到應(yīng)用,現(xiàn)將應(yīng)用研究情況綜述如下。1知識發(fā)現(xiàn)方法數(shù)據(jù)挖掘指的是在大型數(shù)據(jù)庫的數(shù)據(jù)中提取出人們感興趣的知識,是對大量觀察到的數(shù)據(jù)進(jìn)行分析,從中發(fā)現(xiàn)事先未知的聯(lián)系和規(guī)律[1]。這些知識一般是隱含的、事先未知的潛在有用的信息,提取的知識以概念、規(guī)律、規(guī)則、模式等形式存在。數(shù)據(jù)挖掘需要處理的問題主要是在大型的數(shù)據(jù)庫中尋找有價(jià)值的隱藏知識,通過分析對這些有意義的信息進(jìn)行歸納與總結(jié),形成系統(tǒng)的模式,提供給有關(guān)部門進(jìn)行參考。從廣義上說,數(shù)據(jù)挖掘的過程也是知識發(fā)現(xiàn)(KDD)的過程。這種知識發(fā)現(xiàn)一般分為5個(gè)步驟:第一,問題定義;第二,數(shù)據(jù)提取;第三,數(shù)據(jù)預(yù)處理;第四,數(shù)據(jù)挖掘;第五,知識評估。數(shù)據(jù)挖掘分為預(yù)測型(predictive)和描述型(de-scriptive)兩大類型。在數(shù)據(jù)挖掘領(lǐng)域提出了神經(jīng)網(wǎng)絡(luò)、決策樹、聯(lián)機(jī)分析處理、數(shù)據(jù)可視化、遺傳算法、統(tǒng)計(jì)學(xué)方法、數(shù)據(jù)倉庫技術(shù)等多種實(shí)現(xiàn)模式。在現(xiàn)階段,數(shù)據(jù)挖掘在國外的發(fā)展趨勢及研究主要有:注重對Bayes方法以及Boosting方法的研究和提高[2],即對知識發(fā)現(xiàn)方法的進(jìn)一步研究;在知識發(fā)現(xiàn)中統(tǒng)計(jì)學(xué)回歸法的應(yīng)用;對現(xiàn)代網(wǎng)絡(luò)信息挖掘方法的研究等[3]。在國內(nèi)外還出現(xiàn)了一些較有影響力的數(shù)據(jù)挖掘系統(tǒng),包括各種專用或通用的數(shù)據(jù)挖掘軟件。但總體來講,在現(xiàn)階段數(shù)據(jù)挖掘系統(tǒng)由于各自算法和模型不同,跨平臺操作會受到很大的限制,所以一個(gè)普遍且實(shí)用的模型有待進(jìn)一步研究。在中醫(yī)藥領(lǐng)域中數(shù)據(jù)的特點(diǎn)有離散型、連續(xù)型、混合型等,對這些數(shù)據(jù)的預(yù)處理(如噪聲處理等)是非常復(fù)雜的,挖掘過程需要反復(fù)多次的人機(jī)交互,每一個(gè)環(huán)節(jié)都不可缺少專業(yè)技術(shù)人員。只有在中醫(yī)理論的指導(dǎo)下并緊密結(jié)合臨床實(shí)際,對于不同的問題,通過選擇合理的挖掘方法,才能挖掘出真正有價(jià)值的知識[4]。2文獻(xiàn)形式和程序2.1數(shù)量龐雜,形式多樣有史以來,中醫(yī)藥著作資源數(shù)量非常龐雜。在資產(chǎn)階級民主革命前我國已發(fā)行了近兩萬冊的中醫(yī)學(xué)文獻(xiàn)著作,在新中國成立后,出版了相當(dāng)于建國前刊出總量的圖書品種[5]。在文獻(xiàn)形式和文字上都有了很大的差別。2.2信息的模糊性,術(shù)語不規(guī)范在中醫(yī)藥研究中,對藥物、診療過程、疾病癥狀的描述等都有大量的定性描述和繁多的模糊概念。尤其是對藥物的描述,一藥多名與異藥同名的現(xiàn)象也非常普遍[6]。中醫(yī)學(xué)對疾病的診斷是通過醫(yī)生的四診(望、聞、問、切)經(jīng)驗(yàn)獲取有用信息,對疾病做出診斷。中醫(yī)癥狀的模糊性獲取信息時(shí)形式多樣、癥狀間的一癥多名或多癥一名的現(xiàn)象,增加了中醫(yī)藥數(shù)據(jù)挖掘的難度。3法律及科技的應(yīng)用研究隨著時(shí)代的發(fā)展,中醫(yī)藥信息資源數(shù)量快速增長,但中醫(yī)藥信息資源的特點(diǎn)是龐雜而又無序的,這與專業(yè)技術(shù)人員對信息的需求形成了嚴(yán)重的矛盾。為解決這一矛盾,一個(gè)重要途徑就是將各種信息進(jìn)行加工處理,建立較完善的信息資源數(shù)據(jù)庫。將數(shù)據(jù)挖掘技術(shù)引入中醫(yī)藥現(xiàn)代化研究,正是計(jì)算機(jī)技術(shù)運(yùn)用于中醫(yī)藥現(xiàn)代化研究的又一新嘗試。3.1在中醫(yī)診斷中的應(yīng)用中醫(yī)診斷客觀化的基礎(chǔ)條件是四診客觀化,四診客觀化對古今大量四診文獻(xiàn)進(jìn)行的一種處理方法就是數(shù)據(jù)挖掘。如將中醫(yī)醫(yī)案與中醫(yī)的舌診、脈診理論相結(jié)合,通過建立中醫(yī)病案聯(lián)機(jī)分析處理(OLAP)系統(tǒng),對從一些著名醫(yī)案著作中收集到的上千例案例進(jìn)行實(shí)例研究,從而了解當(dāng)代名醫(yī)大家對于舌脈診的認(rèn)識,舌脈象與病證的相關(guān)性[7]。也有研究將明清及近現(xiàn)代3000例醫(yī)案的相關(guān)內(nèi)容分為病名、證型、舌象、脈象、癥狀等5種模式,嘗試采用Fayyad模型,成功建立了脈象與病名之間、病名與脈象之間、脈象與證型之間、證型與脈象之間的聯(lián)系[8]。在中醫(yī)診斷中,正確的診斷對于確立治療方案、指導(dǎo)用藥及調(diào)理康復(fù)無疑是非常重要的。而在臨床中有些疾病錯(cuò)綜復(fù)雜,運(yùn)用數(shù)據(jù)挖掘的有關(guān)分類分析方法應(yīng)用于疾病的診斷中[9],如對男女患者的CT圖像采用貝葉斯學(xué)習(xí)分類法進(jìn)行自動診斷;對重癥監(jiān)護(hù)者呼吸的壓力、體積曲線用推導(dǎo)機(jī)器學(xué)習(xí)方法進(jìn)行分析等,表明數(shù)據(jù)挖掘技術(shù)在臨床診斷模型中具有良好的分類性能。數(shù)據(jù)挖掘作為中醫(yī)藥現(xiàn)代化研究的重要組成部分,在中醫(yī)診斷學(xué)中尤其在中醫(yī)四診客觀化的研究中有著非常廣泛的應(yīng)用。這種將傳統(tǒng)的研究方法與統(tǒng)計(jì)學(xué)知識、人工智能技術(shù)、數(shù)據(jù)庫技術(shù)的有機(jī)結(jié)合,將是解決大量數(shù)據(jù)難以處理這一研究瓶頸的行之有效的方法,將其運(yùn)用于中醫(yī)四診的研究中,可促進(jìn)中醫(yī)診斷學(xué)的規(guī)范化研究。3.2在中醫(yī)證候研究的應(yīng)用中醫(yī)證候的研究關(guān)鍵是合理運(yùn)用方法學(xué)。運(yùn)用現(xiàn)代科學(xué)技術(shù)和計(jì)算機(jī)技術(shù),為中醫(yī)證候的研究提供了有力的技術(shù)平臺。3.2.2中醫(yī)證候診斷標(biāo)準(zhǔn)及方法的研究袁世宏等[12]以病證結(jié)合為前提,以名老中醫(yī)的病案為數(shù)據(jù)源,開展人工神經(jīng)網(wǎng)絡(luò)用于冠心病證候診斷標(biāo)準(zhǔn)的模型研究,提出了證候診斷標(biāo)準(zhǔn)建立的方法學(xué),通過模型檢驗(yàn)證明了該方法的可行性。醫(yī)學(xué)界對中醫(yī)證候規(guī)范化研究的方法和手段層出不窮,主要方法有多元分析方法、神經(jīng)網(wǎng)絡(luò)方法[13]。多元分析方法主要分為回歸分析法、因子分析法、判別分析法、聚類分析法、相關(guān)分析法等。多元分析在中醫(yī)藥研究中,尤其在中醫(yī)證候?qū)W研究方面的應(yīng)用日趨廣泛并顯現(xiàn)出其重要性。神經(jīng)網(wǎng)絡(luò)方法是繼機(jī)器學(xué)習(xí)方法、統(tǒng)計(jì)學(xué)方法之后的另外一種數(shù)據(jù)挖掘的手段。由于傳統(tǒng)的醫(yī)學(xué)統(tǒng)計(jì)方法具有局限性,研究者們開始嘗試運(yùn)用模糊智能技術(shù)探索中醫(yī)證候分類及療效評估的方法,并用實(shí)驗(yàn)的方法論證了其方法上的可行性[14]。3.3在針灸處方配伍中的應(yīng)用針灸處方配伍規(guī)律的研究是中醫(yī)藥現(xiàn)代化研究的重要組成部分,不僅對豐富和發(fā)展針灸學(xué)理論具有重要意義,同時(shí)也為有效指導(dǎo)臨床用穴組方提供重要依據(jù)。目前在針灸領(lǐng)域運(yùn)用數(shù)據(jù)挖掘技術(shù)的應(yīng)用較少,尚處于起步階段,其前景廣闊,同時(shí)充滿挑戰(zhàn)。用現(xiàn)代科學(xué)技術(shù)來分析針灸處方,揭示其內(nèi)在的配伍和應(yīng)用規(guī)律是當(dāng)前針灸領(lǐng)域研究的熱點(diǎn)問題。如張義等[15]采用數(shù)據(jù)挖掘技術(shù)分析腧穴種類、歸經(jīng)及其使用頻次、配伍組合、分部和特定穴分類等,總結(jié)出針灸治療中風(fēng)偏癱的腧穴運(yùn)用規(guī)律、配伍規(guī)律以及特定穴的運(yùn)用規(guī)律,為臨床選穴組方提供參考和借鑒。3.4在中藥研究中的應(yīng)用數(shù)據(jù)挖掘技術(shù)應(yīng)用于中藥現(xiàn)代化中,是計(jì)算機(jī)技術(shù)在中醫(yī)藥現(xiàn)代化中的又一新嘗試。近期,國內(nèi)外學(xué)者研究的一個(gè)熱點(diǎn)問題就是對中藥復(fù)方的研究,在此方面的文獻(xiàn)、論著也較多,取得了一定成績。3.4.1藥對配伍規(guī)律研究數(shù)據(jù)挖掘技術(shù)在方劑配伍規(guī)律上的研究有以分類為主的數(shù)據(jù)挖掘研究、以聚類為主的數(shù)據(jù)挖掘研究和以關(guān)聯(lián)為主的數(shù)據(jù)挖掘研究等三種模式:這些模式在方劑組方藥物的功效、性味等分類、對方劑的制方要素進(jìn)行分析、在尋找藥物之間的相互聯(lián)系和整體用藥規(guī)律上都取得了很大的成績[16]。3.4.2中藥指紋圖譜及中藥譜效關(guān)系的研究根據(jù)中藥指紋圖譜技術(shù)采集手段的差異,一般分為物理圖譜、化學(xué)圖譜及物理化學(xué)和分子生物學(xué)圖譜等多維多息圖譜。中藥指紋圖譜以可量化性、專屬性、重現(xiàn)性和再現(xiàn)性、穩(wěn)定性、完整性和細(xì)節(jié)處理的模糊性為主要特點(diǎn),中藥指紋圖譜分析在中藥材真?zhèn)舞b別、質(zhì)量評價(jià)等方面已取得了重大成果,同時(shí)為譜效關(guān)系的數(shù)據(jù)挖掘打下了堅(jiān)實(shí)的基礎(chǔ)。數(shù)據(jù)挖掘技術(shù)是發(fā)現(xiàn)和解析中藥指紋圖譜潛在信息的有力工具,通過對中藥指紋圖譜進(jìn)行數(shù)據(jù)挖掘可以從中提取隱含的及具有潛在應(yīng)用價(jià)值、最終可理解的信息的過程。其中比較典型的解析方法有模式識別、人工神經(jīng)網(wǎng)絡(luò)等[17]。中藥譜效關(guān)系是在2001年提出的處于學(xué)術(shù)前沿、全新的中藥現(xiàn)代化研究思路。譜效關(guān)系研究是以中藥指紋圖譜研究為基礎(chǔ),同時(shí)又比指紋圖譜更深入一層的科學(xué)研究[18]。一般的譜效關(guān)系研究過程包括采用適合的分析方法構(gòu)建中藥指紋圖譜,并對圖譜標(biāo)示的成分進(jìn)行分析;建立適合的藥效評價(jià)模型,獲取藥理學(xué)數(shù)據(jù);采用數(shù)據(jù)挖掘技術(shù)將指紋圖譜數(shù)據(jù)和藥理學(xué)數(shù)據(jù)進(jìn)行關(guān)聯(lián),結(jié)合中醫(yī)藥專業(yè)知識,建立有意義的譜-效關(guān)系。其中分析方法和數(shù)據(jù)挖掘技術(shù)是研究譜效關(guān)系的重要組成部分。3.4.3開發(fā)新藥中藥經(jīng)歷代醫(yī)藥學(xué)家醫(yī)療實(shí)踐證明,具有非常明確的性味與功效,從中尋找新的活性成分或先導(dǎo)化合物是開發(fā)創(chuàng)新天然藥物的有效途徑。數(shù)據(jù)挖掘技術(shù)在新藥開發(fā)中,增強(qiáng)了在尋找新藥過程中的主動性,避免了盲目性,真正做到了有的放矢。利用數(shù)據(jù)挖掘技術(shù)從數(shù)百種、數(shù)千種藥用植物中進(jìn)行挖掘,可對新藥開發(fā)具有指導(dǎo)、啟發(fā)作用。如陸愛軍等[19]對中藥化學(xué)數(shù)據(jù)庫使用關(guān)聯(lián)規(guī)則的方法進(jìn)行挖掘,通過對關(guān)聯(lián)規(guī)則的分析、鉆取,得到25個(gè)有趣的關(guān)聯(lián)規(guī)則,這些關(guān)聯(lián)規(guī)則對于相應(yīng)的研究工作有一定的指導(dǎo)作用。4數(shù)據(jù)挖掘的研究數(shù)據(jù)挖掘作為一個(gè)從海量數(shù)據(jù)中獲取知識的有力工具,采用合理的數(shù)據(jù)挖掘模型及算法,能有效地推動了中醫(yī)藥信息化的進(jìn)程。但中醫(yī)藥領(lǐng)域的數(shù)據(jù)挖掘研究目前尚處于起步階段。同其他研究方法一樣,數(shù)據(jù)挖掘技術(shù)并不是萬能的。數(shù)據(jù)挖掘研究結(jié)果的準(zhǔn)確性受數(shù)據(jù)庫
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年AI智能營銷技術(shù)合作合同樣本
- 二零二五年度生態(tài)環(huán)保木工加工廠合作合同4篇
- 2025年醫(yī)療護(hù)士協(xié)議
- 2025年增資協(xié)議書面詳細(xì)約定內(nèi)容文本
- 2025年產(chǎn)品分銷渠道協(xié)定書
- 2025年家裝風(fēng)水合同
- 2025年埋頭競業(yè)禁止合同
- 2025版智能家居燈具音響設(shè)備一體化采購合同4篇
- 2025年媒介環(huán)境分析協(xié)議
- 2025版學(xué)校食堂豬肉食品安全風(fēng)險(xiǎn)評估與監(jiān)控合同2篇
- 口腔執(zhí)業(yè)醫(yī)師定期考核試題(資料)帶答案
- 2024人教版高中英語語境記單詞【語境記單詞】新人教版 選擇性必修第2冊
- 能源管理總結(jié)報(bào)告
- 挖掘機(jī)售后保養(yǎng)及維修服務(wù)協(xié)議(2024版)
- 充電樁巡查記錄表
- 阻燃材料的阻燃機(jī)理建模
- CJT 511-2017 鑄鐵檢查井蓋
- 配電工作組配電網(wǎng)集中型饋線自動化技術(shù)規(guī)范編制說明
- 2024高考物理全國乙卷押題含解析
- 介入科圍手術(shù)期護(hù)理
- 青光眼術(shù)后護(hù)理課件
評論
0/150
提交評論