化學(xué)信息學(xué)論文_第1頁
化學(xué)信息學(xué)論文_第2頁
化學(xué)信息學(xué)論文_第3頁
化學(xué)信息學(xué)論文_第4頁
化學(xué)信息學(xué)論文_第5頁
已閱讀5頁,還剩4頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

來源網(wǎng)絡(luò)來源網(wǎng)絡(luò)來源網(wǎng)絡(luò)化學(xué)信息學(xué)發(fā)展歷史、現(xiàn)狀以及未來趨勢的探究摘要化學(xué)信息學(xué)(ChemicalInformatics,Chemoinformatics,Cheminformatics),是在信息科學(xué)與計算機(jī)科學(xué)、互聯(lián)網(wǎng)高速發(fā)展的前提下近幾年快速成長的化學(xué)化工與信息科學(xué)、計算機(jī)科學(xué)的邊緣交叉學(xué)科利用計算機(jī)及網(wǎng)絡(luò)技術(shù)對化學(xué)信息進(jìn)行收集、處理加工、管理分析、傳播以達(dá)到化學(xué)信息的共享的目的。化學(xué)信息學(xué)的實質(zhì)是“從數(shù)據(jù)到知識”,隨著化學(xué)信息的不斷積累,化學(xué)信息學(xué)在化學(xué)及相關(guān)學(xué)科中必將發(fā)揮越來越重要的作用。本文對于化學(xué)信息學(xué)在過去幾十年內(nèi)發(fā)展的歷史、發(fā)展現(xiàn)狀以及未來發(fā)展趨勢都做了充足的探討。關(guān)鍵字化學(xué)信息學(xué)化學(xué)信息發(fā)展歷史定義藥物分子設(shè)計趨勢1化學(xué)信息信息是什么?信息不是物質(zhì),因為它沒有質(zhì)量,看不見摸不著;信息也不是能量,因為它不能轉(zhuǎn)化驅(qū)動其他物質(zhì)。而其實一切物質(zhì)都可以看做信息,一花一草,日升月落,春夏秋冬都是一種信息。某事物的信息,是它的運動狀態(tài)、結(jié)構(gòu)、性能和相互作用的規(guī)律以及運動狀態(tài)的改變,正如鐘義信教授提出的信息本體論定義:“某事物的信息的本體論層次定義,就是該事物運動的狀態(tài)和狀態(tài)改變的方式”[1]。而化學(xué)信息,就是指在化學(xué)分子、化學(xué)過程中所表現(xiàn)反饋出來的化學(xué)方面的信息。化學(xué)信息主要分為化學(xué)物質(zhì)的化學(xué)信息和媒體形式的化學(xué)信息。前者是利用科學(xué)的原理和方法通過測量得到的化學(xué)成分的相關(guān)信息,如物質(zhì)的物理、化學(xué)性質(zhì),物質(zhì)中各成分的定性、定量以及結(jié)構(gòu)信息,分子間的相互作用信息(包括化學(xué)反應(yīng)信息)等。后者是化學(xué)信息的記錄形式,如圖書、期刊、專利、數(shù)據(jù)庫以及音像資料等,通過化學(xué)信息的傳播使化學(xué)家們共享測量的原理、方法及測量結(jié)果。2化學(xué)信息學(xué)發(fā)展概況2.1化學(xué)信息學(xué)的發(fā)展歷史化學(xué)信息學(xué)是一門以計算機(jī)技術(shù)、計算機(jī)網(wǎng)絡(luò)技術(shù)、信息技術(shù)為基礎(chǔ)的解決化學(xué)問題的學(xué)科,那么它的發(fā)展必然與計算機(jī)技術(shù)的發(fā)展密不可分。20世紀(jì)中后期,伴隨著計算機(jī)的出現(xiàn)及其技術(shù)的高速發(fā)展,化學(xué)信息學(xué)也開始隨之發(fā)展而起。1973年,NSTO高級研究所夏季學(xué)校舉辦了一個研討班,研討班的名稱定為“化學(xué)信息學(xué)的計算機(jī)表征與處理”,將大量采用計算機(jī)處理化學(xué)過程或用計算機(jī)技術(shù)分析化學(xué)信息的不同領(lǐng)域的科學(xué)家聚集在一起。由于他們都是利用計算機(jī)輔助化學(xué)研究,當(dāng)聚在一起,他們意識到一個新的研究領(lǐng)域已經(jīng)形成。從此計算機(jī)科學(xué)和信息學(xué)方法悄然進(jìn)入化學(xué)領(lǐng)域。1987年,法國化學(xué)家列恩(J.MLehn)在研究復(fù)雜分子的反應(yīng)過程中發(fā)現(xiàn)分子具有自組織、自識別的化學(xué)智能反應(yīng)現(xiàn)象,識別的概念包含著信息的展示、傳遞、鑒別和響應(yīng)等過程,列恩首次提出“化學(xué)信息學(xué)”的概念,這也就是化學(xué)信息學(xué)研究的開始。在列恩教授提出“化學(xué)信息學(xué)”的概念后,國外一些大學(xué)就開設(shè)了化學(xué)信息學(xué)課程并確定為研究生的研究方向。于是大量從事化學(xué)信息研究的個人、團(tuán)體開始出現(xiàn),化學(xué)信息學(xué)在這段時間內(nèi)迅速發(fā)展。2000年,WendyA.Warr博士在第218節(jié)美國化學(xué)學(xué)會國家會議和博覽會上做了一個關(guān)于“化學(xué)信息學(xué)的定義”的報告,將化學(xué)信息學(xué)的發(fā)展又一次推向高潮。進(jìn)入新世紀(jì)后,隨著計算機(jī)及網(wǎng)絡(luò)技術(shù)的迅猛進(jìn)步,計算機(jī)技術(shù)能解決的化學(xué)問題越來越多,學(xué)科研發(fā)所耗費的成本也逐漸降低,化學(xué)工作者因此獲得大量而精確的以前未能得到的關(guān)于物質(zhì)的各種化學(xué)信息,因此推動了這門學(xué)科迅猛發(fā)展。2.2化學(xué)信息學(xué)定義的提出關(guān)于化學(xué)信息學(xué)的定義,直到今天學(xué)術(shù)界還有很大爭論,沒有達(dá)成太多共識形成一個完整的定義。而在這門學(xué)科發(fā)展的不同時期,都有學(xué)者給“化學(xué)信息學(xué)”提出定義:美國印第安那大學(xué)(IndianaUniversity)在國際上最早在化學(xué)圖書館科學(xué)的基礎(chǔ)上開設(shè)化學(xué)信息課程及培養(yǎng)化學(xué)信息學(xué)研究生,他們把化學(xué)信息學(xué)定義為:化學(xué)信息學(xué)包括從利用傳統(tǒng)的圖書館科學(xué)方法組織化學(xué)信息到利用現(xiàn)代計算機(jī)技術(shù)產(chǎn)生、存儲、檢索及可視化化學(xué)信息。1998年FrankBrown提出一個定義:把各種化學(xué)信息源數(shù)據(jù)組合為信息,把信息提升為知識,其主要目的是在藥物先導(dǎo)化合物的發(fā)現(xiàn)及優(yōu)化領(lǐng)域快速地更好地作出決定。1999年GregParis給出自己的定義:化學(xué)信息學(xué)是一個一般的術(shù)語,它包括化學(xué)信息的設(shè)計、建立、組織、管理、檢索、分析、判別、可視化及使用。2002年中國科技大學(xué)的邵學(xué)廣等對化學(xué)信息學(xué)也提出過定義:化學(xué)信息學(xué)是近幾年發(fā)展起來的一個新的化學(xué)分支,它利用計算機(jī)和計算機(jī)網(wǎng)絡(luò)技術(shù),對化學(xué)信息進(jìn)行表示、管理、分析、模擬和傳播,以實現(xiàn)化學(xué)信息的提取、轉(zhuǎn)化與共享,揭示化學(xué)信息的內(nèi)在實質(zhì)與內(nèi)在聯(lián)系,促進(jìn)化學(xué)學(xué)科的知識創(chuàng)新。2006年德國的JohannGasteiger提出一個廣義的定義:化學(xué)信息學(xué)是利用信息學(xué)方法解決化學(xué)問題的學(xué)科。而這一定義也是目前傳播較為廣泛的定義[2]。以上各種定義,F(xiàn)rankBrown所提出的太過于片面,他僅僅強(qiáng)調(diào)化學(xué)信息學(xué)在藥物分子設(shè)計過程中所起到的作用,而沒注意到這門學(xué)科的在化學(xué)領(lǐng)域的其他作用;GregParis提出的定義關(guān)于化學(xué)信息獲取后的分析、整理及管理注重太多,而沒注重化學(xué)信息的獲取及應(yīng)用方面;邵學(xué)廣等人提出的定義很詳盡,但注重計算機(jī)技術(shù)而沒提及信息學(xué)方法在這過程中的作用。但不管如何定義這門學(xué)科,化學(xué)信息學(xué)必定是一門新的化學(xué)分支學(xué)科,它結(jié)合計算機(jī)技術(shù)、信息學(xué)方法于一體,著重于研究物質(zhì)分子所展現(xiàn)的信息。3化學(xué)信息學(xué)發(fā)展現(xiàn)狀3.1化學(xué)信息學(xué)研究的內(nèi)容關(guān)于化學(xué)信息學(xué)研究的內(nèi)容,學(xué)術(shù)界內(nèi)各自有不同的看法和意見,但歸根到底他們的意見其實是一致的。比如說北大教授徐筱杰認(rèn)為化學(xué)信息學(xué)研究的主要內(nèi)容是:(1)化學(xué)信息的組織、管理、檢索和使用;(2)分子結(jié)構(gòu)的編碼、描述、三維結(jié)構(gòu)的構(gòu)建;(3)化學(xué)信息的加工、處理及深化;(4)計算組合化學(xué);(5)化學(xué)體系中信息的交換及傳遞;(6)分子的物理化學(xué)性質(zhì)預(yù)測[3]。而在邵學(xué)廣、蔡文生等教授看來,化學(xué)信息學(xué)研究的是:(1)利用計算機(jī)技術(shù)和計算機(jī)網(wǎng)絡(luò)技術(shù)對化學(xué)信息進(jìn)行表示和管理,包括化合物的結(jié)構(gòu)編碼、分子圖形學(xué)、虛擬真實(VirtualReality)技術(shù)、數(shù)據(jù)庫、專家系統(tǒng)與人工智能等;(2)利用計算機(jī)網(wǎng)絡(luò)技術(shù)對化學(xué)信息進(jìn)行收集、傳播和共享,主要包括利用各種Internet服務(wù)進(jìn)行的化學(xué)信息交流和共享,如基于E-mail服務(wù)的通信討論組、基于Gopher、WWW的化學(xué)信息數(shù)據(jù)庫、化學(xué)信息服務(wù)網(wǎng)站以及虛擬社區(qū)等;(3)化學(xué)體系的計算機(jī)模擬或建模,包括波譜模擬、電化學(xué)模擬以及分子模擬;(4)利用計算機(jī)技術(shù)對復(fù)雜的化學(xué)信息進(jìn)行解析,以快捷方便的方式最大限度地提取和利用有用信息,主要包括將各種化學(xué)計量學(xué)方法用于復(fù)雜體系化學(xué)信號的處理,進(jìn)行化學(xué)信號的平滑濾噪、基線矯正、信號分辨等[4]。其實可以說前后兩者的觀點基本是一致的,例如前者觀點中的第(1)、(3)、(5)兩點都講的是關(guān)于化學(xué)信息的獲取及獲取之后的加工處理組織管理等,這與后者觀點中的(1)、(2)、(4)點內(nèi)容相似;而前者的(2)中與后者(3)中的內(nèi)容一致性更是一目了然,都是對分子結(jié)構(gòu)的各種模擬以及建模。由于化學(xué)信息學(xué)在伴隨著近幾年技術(shù)的飛速發(fā)展也發(fā)展極其迅猛,化學(xué)信息學(xué)研究的范圍不斷擴(kuò)大,內(nèi)容也逐漸增多,目前學(xué)科內(nèi)研究的主要內(nèi)容有所改變,但總的大方向總是不變的。1、化合物登記(compoundregistration)。顧名思義,就是指將每一個化合物的化學(xué)結(jié)構(gòu)及相關(guān)信息,如立體化學(xué)參數(shù)、相關(guān)光譜數(shù)據(jù)(如NMR、MS等)、純度數(shù)據(jù)、各種生物活性測定數(shù)據(jù)等存儲在數(shù)據(jù)庫中,使得方便存取、搜索調(diào)用。2、構(gòu)效關(guān)系(structure-activityrelationship,SAR)。指應(yīng)用各種化學(xué)軟件,使用各種化學(xué)計量學(xué)方法(如多元線性回歸分析方法等),計算分子描述子(或分子參數(shù),分子描述符),建立各種構(gòu)效關(guān)系模型,并使用各種檢驗方法(如交叉檢驗、分組檢驗等)檢驗?zāi)P褪欠窈线m,從而研究化學(xué)結(jié)構(gòu)與生理作用或生物活性間的關(guān)系預(yù)測化合物的性質(zhì),指導(dǎo)設(shè)計出具有更高活性的化合物,最終提高設(shè)計分子的成功率。3、虛擬數(shù)據(jù)庫組裝技術(shù)(virtualdatabaseassembly)。通過計算化學(xué)結(jié)合各種基元化學(xué)分子結(jié)構(gòu)和片段,虛擬合成大量的候選化合物,組裝、存儲在虛擬數(shù)據(jù)庫中,然后在這個虛擬數(shù)據(jù)庫中篩選合適的的目標(biāo)化合物分子。遺傳算法(geneticalgorithm,GA)在其中是一個重要工具。遺傳算法是基于生物進(jìn)化理論的隨機(jī)全局搜索方法,包含交叉操作、變異操作、遺傳操作,能對一個虛擬數(shù)據(jù)庫中各個計算化學(xué)性質(zhì)特性值進(jìn)行優(yōu)化以達(dá)到最優(yōu)化。4、數(shù)據(jù)庫挖掘技術(shù)(databasemining)。根據(jù)化合物分子的2D或3D相似性度量、分子形狀、化合物分子構(gòu)架或根據(jù)受體和配體之間的三維結(jié)構(gòu)等特性從數(shù)據(jù)庫中的大量候選分子中尋找、篩選出需要的化合物分子。挖掘技術(shù)的效果根據(jù)對化合物分子結(jié)構(gòu)包括分子三維結(jié)構(gòu)、化合物特性等的認(rèn)識的完整度,以及挖掘工具的特性如挖掘速度等。5、統(tǒng)計方法和技術(shù)。統(tǒng)計方法包括主成分分析、因子分析等,在統(tǒng)計學(xué)上用于分子描述因子的降維,從而可以更加簡單有效地表述分子信息并降低計算的復(fù)雜程度,使計算更加快捷方便。3.2化學(xué)信息學(xué)在藥物分子設(shè)計中的應(yīng)用當(dāng)下化學(xué)信息學(xué)在化工、材料科學(xué)、藥物分子設(shè)計等多個領(lǐng)域都有著廣泛的應(yīng)用,如在化工領(lǐng)域,化學(xué)信息學(xué)可以用來進(jìn)行對反應(yīng)條件的優(yōu)化以及催化劑的篩選等;在材料科學(xué)領(lǐng)域,化學(xué)信息學(xué)可以用來進(jìn)行分子模擬與設(shè)計,并篩選出合適的分子以合成性能更加優(yōu)質(zhì)的材料;在藥物分子設(shè)計領(lǐng)域,可以用來進(jìn)行分子模擬、虛擬合成、虛擬篩選等。正如當(dāng)年FrankBrown給化學(xué)信息學(xué)所下的定義:把各種化學(xué)信息源數(shù)據(jù)組合為信息,把信息提升為知識,其主要目的是在藥物先導(dǎo)化合物的發(fā)現(xiàn)及優(yōu)化領(lǐng)域快速地更好地做出決定。早在十幾年前他就意識到化學(xué)信息學(xué)在藥物分子設(shè)計,藥物開發(fā)研究中的巨大作用。而目前這門學(xué)科在新型藥物的開發(fā)研究中的地位的重要性無人否定。由于目前新型藥物的開發(fā)難度越來越大,如果將每一種設(shè)計出來的藥物分子都進(jìn)行合成再進(jìn)行實際臨床試驗以篩選合適的藥物,將會是一項極其浩大的工程,只有一小部分能成為上市藥物,大多數(shù)將會被淘汰,因此要是按照傳統(tǒng)方法進(jìn)行現(xiàn)代藥物分子設(shè)計與開發(fā),不僅會浪費大量人力物力財力,而且大大增加了藥物開發(fā)的周期,這對于當(dāng)今社會對新興藥物的急需情況來說是個重大的問題。因此引進(jìn)化學(xué)信息學(xué)方法,進(jìn)行現(xiàn)代化的新型的藥物分子設(shè)計方法,對藥物開發(fā)的重要性不言而喻。在現(xiàn)代藥物分子設(shè)計過程中,結(jié)合了包括數(shù)學(xué)、生物學(xué)、計算機(jī)應(yīng)用、藥物學(xué)、化學(xué)等多個學(xué)科在內(nèi)的知識,主要研究如何表征化合物分子結(jié)構(gòu)、如何區(qū)別各種不同化合物之間的差異、如何識別類藥分子、如何建立適當(dāng)?shù)臄?shù)據(jù)庫以滿足多樣性、探究分子結(jié)構(gòu)與生物性能的關(guān)系等等。在這個過程中各個學(xué)科之間能否以及如何實現(xiàn)有機(jī)、完美的結(jié)合將對藥物分子設(shè)計和開發(fā)起著至關(guān)重要的作用。圖1.藥物分子設(shè)計中各學(xué)科的交叉計算機(jī)輔助藥物分子設(shè)計(CADD)是現(xiàn)代藥物分子設(shè)計中重要的方法,它已經(jīng)發(fā)展成為一門完善和新興的研究領(lǐng)域,是目前藥物設(shè)計中至關(guān)重要的一環(huán),大大促進(jìn)了藥物設(shè)計和新藥開發(fā)的效率。圖2.計算機(jī)輔助藥物分子設(shè)計ADME&T預(yù)測[3]。A(absorption):機(jī)體對外源化學(xué)物的吸收,如外源化合物進(jìn)入人體的速度以及數(shù)量;D(distribution):外源化合物的分布,化合物在靶器官內(nèi)的運動及攝?。籑(metabolism):代謝,化合物有多少在體內(nèi)被酶分解成其他物質(zhì);E(excretion)為消除:化合物從體內(nèi)排出過程;T(toxicity):毒性,化合物對各種器官不期望的副反應(yīng)。Lipinshi根據(jù)ADME&T預(yù)測方法以及大量的實驗數(shù)據(jù)得到5規(guī)則(ruleof5),即如果化合物的分子量大于500,計算的lgp(Clgp)大于5,一個化合物多于5個氫鍵給體(OH及NH基團(tuán)總和)或10個氫鍵受體(O及N的總和)成藥的可能性很小。此預(yù)測方法經(jīng)過大量實驗數(shù)據(jù)驗證,其準(zhǔn)確性已得到證實。組合合成(combinatorialsynthesis,CS)和高通量篩選(highthroughputscreening,HTS)。組合合成指在相同條件下一次同步合成一系列化合物,此方法與傳統(tǒng)方法由于不再以單個化合物為目標(biāo)進(jìn)行合成,相比極大地提高了合成效率。高通量篩選技術(shù)是指以分子、細(xì)胞水平的實驗方法為基礎(chǔ),以微板形式作為實驗工具載體,以自動化操作系統(tǒng)執(zhí)行試驗過程,以靈敏快速的檢測儀器采集實驗結(jié)果數(shù)據(jù),以計算機(jī)分析處理實驗數(shù)據(jù),在同一時間檢測數(shù)以千萬的樣品,并以得到的相應(yīng)數(shù)據(jù)庫支持運轉(zhuǎn)的技術(shù)體系,它具有微量、快速、靈敏和準(zhǔn)確等特點。先導(dǎo)化合物優(yōu)化。先導(dǎo)化合物(leadcompound)是通過各種途徑和手段得到的具有某種生物活性和化學(xué)結(jié)構(gòu)的化合物,用于進(jìn)一步的結(jié)構(gòu)改造和修飾,是現(xiàn)代新型藥物開發(fā)研究的出發(fā)點。由于先導(dǎo)化合物存在著某些如活性不夠高,選擇性不好,化學(xué)結(jié)構(gòu)不穩(wěn)定等缺陷,需要對其進(jìn)行化學(xué)修飾以使其優(yōu)化成為理想化合物。4化學(xué)信息學(xué)未來發(fā)展趨勢正如文章開頭所講,化學(xué)信息學(xué)的實質(zhì)是“從數(shù)據(jù)到知識”,通過各種化學(xué)信息庫的建立與分析,總結(jié)出規(guī)律,最大限度地挖掘、開發(fā)和應(yīng)用化學(xué)信息。因此化學(xué)信息學(xué)在相關(guān)的各個領(lǐng)域內(nèi)發(fā)揮著越來越重要的作用。藥物開發(fā)、材料設(shè)計、復(fù)雜體系分析、海量數(shù)據(jù)挖掘與知識發(fā)現(xiàn)以及新算法的研究將仍然是這門學(xué)科關(guān)注的重點和熱點問題。數(shù)據(jù)挖掘和知識發(fā)現(xiàn)是化學(xué)信息學(xué)的核心內(nèi)容,對于海量的生命科學(xué)及醫(yī)藥研究數(shù)據(jù),如何從中挖掘出最有用的信息,是對化學(xué)信息學(xué)的巨大挑戰(zhàn)。分子動力學(xué)、QSAR等分子模擬方法在化學(xué)、生物領(lǐng)域的應(yīng)用,也有待更深入廣泛的工作,與化學(xué)信息學(xué)相關(guān)的領(lǐng)域如前面所提到的材料、醫(yī)藥、化工等眾多領(lǐng)域都會帶來長足的發(fā)展。解釋實驗現(xiàn)象,指導(dǎo)實驗的發(fā)展仍然是重要的研究課題。更高效、快速的優(yōu)化算法仍是關(guān)注的焦點,針對特定的化學(xué)問題進(jìn)行優(yōu)化算法研究可能是一個重要的突破口。算法研究是化學(xué)計量學(xué)的基本任務(wù),。算法研究的目的是解決化學(xué)實際問題,因此結(jié)合化學(xué)實際問題進(jìn)行新算法研究是化學(xué)信息學(xué)重要的發(fā)展方向。化學(xué)信息學(xué)教育問題也是必須注重的一個方面,必須加大對于化學(xué)信息學(xué)的教學(xué)投入,目前階段國內(nèi)的教育引導(dǎo)方面做得不是很充分,必須加大內(nèi)容的擴(kuò)充以及完善,這對于我國的化學(xué)信息學(xué)學(xué)科很有必要。5結(jié)語化學(xué)信息學(xué)作為近些年強(qiáng)勢發(fā)展而起的一門新興學(xué)科,盡管時間并不是太長,但由于其與多門學(xué)科

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論