




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第二節(jié)生物信息學(xué)及其發(fā)展歷史
生物信息學(xué)及其發(fā)展歷史1、生物信息學(xué)的概念生物信息學(xué)及其發(fā)展歷史生物信息學(xué)(Bioinformatics)這一名詞的來(lái)由
八十年代末期,林華安博士認(rèn)識(shí)到將計(jì)算機(jī)科學(xué)與生物學(xué)結(jié)合起來(lái)的重要意義,開始留意要為這一領(lǐng)域構(gòu)思一個(gè)合適的名稱。起初,考慮到與將要支持他主辦一系列生物信息學(xué)會(huì)議的佛羅里達(dá)州立大學(xué)超型計(jì)算機(jī)計(jì)算研究所的關(guān)系,他使用的是“CompBio”;之后,又將其更改為兼具法國(guó)風(fēng)情的“bioinformatique”,看起來(lái)似乎有些古怪。因此不久,他便進(jìn)一步把它更改為“bio-informatics(或bio/informatics)”。但由于當(dāng)時(shí)的電子郵件系統(tǒng)與今日不同,該名稱中的-或/符號(hào)經(jīng)常會(huì)引起許多系統(tǒng)問(wèn)題,于是林博士將其去除,今天我們所看到的“bioinformatics”就正式誕生了,林博士也因此贏得了“生物信息學(xué)之父”的美譽(yù)。生物信息學(xué)及其發(fā)展歷史生物信息學(xué)HGP生物數(shù)據(jù)的激增(每15個(gè)月翻一番)生物學(xué)家數(shù)學(xué)家計(jì)算機(jī)科學(xué)家生物信息學(xué)(bioinfomatics)的誕生生物信息學(xué)及其發(fā)展歷史三種科學(xué)文化的融合生物學(xué)家(生物學(xué)問(wèn)題)數(shù)學(xué)物理學(xué)家計(jì)算機(jī)科學(xué)家(基礎(chǔ)理論問(wèn)題)工程師(技術(shù)應(yīng)用)生物信息學(xué)及其發(fā)展歷史
生物信息學(xué)(bioinformatics)是80年代未隨著人類基因組計(jì)劃(Humangenomeproject)的啟動(dòng)而興起的一門新的交叉學(xué)科。它涉及生物學(xué)、數(shù)學(xué)、計(jì)算機(jī)科學(xué)和工程學(xué),依賴于計(jì)算機(jī)科學(xué)、工程學(xué)和應(yīng)用數(shù)學(xué)的基礎(chǔ),依賴于生物實(shí)驗(yàn)和衍生數(shù)據(jù)的大量?jī)?chǔ)存。生物信息學(xué)及其發(fā)展歷史概念(廣義)生物體系和過(guò)程中信息的存貯、傳遞和表達(dá)細(xì)胞、組織、器官的生理、病理、藥理過(guò)程的中各種生物信息信息科學(xué)生命科學(xué)中的信息科學(xué)
生物信息學(xué)及其發(fā)展歷史廣義的說(shuō),生物信息不僅包括基因組信息,如基因的DNA序列、染色體定位,也包括基因產(chǎn)(蛋白質(zhì)或RNA)的結(jié)構(gòu)和功能及各生物種間的進(jìn)化關(guān)系等其他信息資源。生物信息學(xué)既涉基因組信息的獲取、處理、貯存、傳遞、分析和解釋,又涉及蛋白質(zhì)組信息學(xué)如蛋白質(zhì)的序列、結(jié)構(gòu)、功能及定位分類、蛋白質(zhì)連鎖圖、蛋白質(zhì)數(shù)據(jù)庫(kù)的建立、相關(guān)分析軟件的開發(fā)和應(yīng)用等方面,還涉及基因與蛋白質(zhì)的關(guān)系如蛋白質(zhì)編碼基因的識(shí)別及算法研究、蛋白質(zhì)結(jié)構(gòu)、功能預(yù)測(cè)等,另外,新藥研制、生物進(jìn)化也是生物信息學(xué)研究的熱點(diǎn)。生物信息學(xué)及其發(fā)展歷史概念(狹義)生物分子數(shù)據(jù)深層次生物學(xué)知識(shí)分子生物信息學(xué)MolecularBioinformatics挖掘獲取生物分子信息的獲取、存貯、分析和利用生物信息學(xué)及其發(fā)展歷史
由于當(dāng)前生物信息學(xué)發(fā)展的主要推動(dòng)力來(lái)自分子生物學(xué),生物信息學(xué)的研究主要集中于核苷酸和氨基酸序列的存儲(chǔ)、分類、檢索和分析等方面,所以目前生物信息學(xué)可以狹義地定義為:將計(jì)算機(jī)科學(xué)和數(shù)學(xué)應(yīng)用于生物大分子信息的獲取、加工、存儲(chǔ)、分類、檢索與分析,以達(dá)到理解這些生物大分子信息的生物學(xué)意義的交叉學(xué)科。生物信息學(xué)及其發(fā)展歷史1995年,在美國(guó)人類基因組計(jì)劃(HGP)第一個(gè)五年總結(jié)報(bào)告
中給出了一個(gè)較為完整的生物信息學(xué)的定義:生信息學(xué)是包含生物信息的獲取、處理、貯存、分發(fā)、分析和解釋的所有方面的一門學(xué)科,它綜合運(yùn)用數(shù)學(xué)、計(jì)算機(jī)科學(xué)和生物學(xué)的各種工具進(jìn)行研究,目的在于了解大量的生物學(xué)意義。生物信息學(xué)及其發(fā)展歷史Bioinformatics生物分子數(shù)據(jù)計(jì)算機(jī)計(jì)算+生物信息學(xué)及其發(fā)展歷史2、生物分子信息生物信息學(xué)及其發(fā)展歷史細(xì)胞分子存貯、復(fù)制、傳遞和表達(dá)遺傳信息的系統(tǒng)生物信息的載體生物信息學(xué)及其發(fā)展歷史生物信息學(xué)主要研究?jī)煞N信息載體DNA分子蛋白質(zhì)分子生物信息學(xué)及其發(fā)展歷史生物信息學(xué)及其發(fā)展歷史ProteinMachines
生物信息學(xué)及其發(fā)展歷史FromtheCelltoProteinMachines
生物信息學(xué)及其發(fā)展歷史生物分子至少攜帶著三種信息遺傳信息與功能相關(guān)的結(jié)構(gòu)信息進(jìn)化信息生物信息學(xué)及其發(fā)展歷史(1)遺傳信息的載體——DNA
遺傳信息的載體主要是DNA
控制生物體性狀的基因是一系列DNA片段生物體生長(zhǎng)發(fā)育的本質(zhì)就是遺傳信息的傳遞和表達(dá)生物信息學(xué)及其發(fā)展歷史DNA通過(guò)自我復(fù)制,在生物體的繁衍過(guò)程中傳遞遺傳信息基因通過(guò)轉(zhuǎn)錄和翻譯,使遺傳信息在生物個(gè)體中得以表達(dá),并使后代表現(xiàn)出與親代相似的生物性狀。
基因控制著蛋白質(zhì)的合成DNARNA蛋白質(zhì)轉(zhuǎn)錄翻譯生物信息學(xué)及其發(fā)展歷史基因的DNA序列DNA前體RNAmRNA多肽鏈蛋白質(zhì)序列對(duì)應(yīng)關(guān)系遺傳密碼生物信息學(xué)及其發(fā)展歷史(2)蛋白質(zhì)的結(jié)構(gòu)決定其功能蛋白質(zhì)功能取決于蛋白質(zhì)的空間結(jié)構(gòu)
蛋白質(zhì)結(jié)構(gòu)決定于蛋白質(zhì)的序列(這是目前基本共認(rèn)的假設(shè)),蛋白質(zhì)結(jié)構(gòu)的信息隱含在蛋白質(zhì)序列之中。生物信息學(xué)及其發(fā)展歷史(3)DNA分子和蛋白質(zhì)分子
都含有進(jìn)化信息
通過(guò)比較相似的蛋白質(zhì)序列,如肌紅蛋白和血紅蛋白,可以發(fā)現(xiàn)由于基因復(fù)制而產(chǎn)生的分子進(jìn)化證據(jù)。通過(guò)比較來(lái)自于不同種屬的同源蛋白質(zhì),即直系同源蛋白質(zhì),可以分析蛋白質(zhì)甚至種屬之間的系統(tǒng)發(fā)生關(guān)系,推測(cè)它們共同的祖先蛋白質(zhì)。生物信息學(xué)及其發(fā)展歷史生物分子信息DNA序列數(shù)據(jù)蛋白質(zhì)序列數(shù)據(jù)生物分子結(jié)構(gòu)數(shù)據(jù)生物分子功能數(shù)據(jù)最基本直觀復(fù)雜生物分子數(shù)據(jù)類型生物信息學(xué)及其發(fā)展歷史
DNA核酸序列蛋白質(zhì)氨基酸序列蛋白質(zhì)結(jié)構(gòu)蛋白質(zhì)功能最基本的生物信息維持生命活動(dòng)的機(jī)器第一部遺傳密碼第二部遺傳密碼?生命體系千姿百態(tài)的變化生物分子數(shù)據(jù)及其關(guān)系生物信息學(xué)及其發(fā)展歷史第一部遺傳密碼已被破譯,但對(duì)密碼的轉(zhuǎn)錄過(guò)程還不清楚,對(duì)大多數(shù)DNA非編碼區(qū)域的功能還知之甚少對(duì)于第二部密碼,目前則只能用統(tǒng)計(jì)學(xué)的方法進(jìn)行分析無(wú)論是第一部遺傳密碼,還是第二部遺傳密碼,都隱藏在大量的生物分子數(shù)據(jù)之中。生物分子數(shù)據(jù)是寶藏,生物信息數(shù)據(jù)庫(kù)是金礦,等待我們?nèi)ネ诰蚝屠谩I镄畔W(xué)及其發(fā)展歷史生物分子信息的特征生物分子信息數(shù)據(jù)量大生物分子信息復(fù)雜生物分子信息之間存在著密切的聯(lián)系生物信息學(xué)及其發(fā)展歷史3、生物信息學(xué)的發(fā)展歷史生物信息學(xué)基本思想的產(chǎn)生生物信息學(xué)的迅速發(fā)展二十世紀(jì)50年代二十世紀(jì)80-90年代生物科學(xué)和技術(shù)的發(fā)展人類基因組計(jì)劃的推動(dòng)生物信息學(xué)及其發(fā)展歷史20世紀(jì)50年代,生物信息學(xué)開始孕育20世紀(jì)60年代,生物分子信息在概念上將計(jì)算生物學(xué)和計(jì)算機(jī)科學(xué)聯(lián)系起來(lái)20世紀(jì)70年代,生物信息學(xué)的真正開端20世紀(jì)70年代到80年代初期,出現(xiàn)了一系列著名的序列比較方法和生物信息分析方法20世紀(jì)80年代以后,出現(xiàn)一批生物信息服務(wù)機(jī)構(gòu)和生物信息數(shù)據(jù)庫(kù)20世紀(jì)90年代后,HGP促進(jìn)生物信息學(xué)的迅速發(fā)展生物信息學(xué)及其發(fā)展歷史關(guān)于生物信息學(xué)發(fā)展歷程中的重要大事,請(qǐng)參見下面兩個(gè)網(wǎng)站的介紹:/BLASTinfo/milestones.html、。生物信息學(xué)及其發(fā)展歷史第三節(jié)生物信息學(xué)主要研究?jī)?nèi)容生物信息學(xué)及其發(fā)展歷史生物信息學(xué)主要研究?jī)?nèi)容1、
生物分子數(shù)據(jù)的收集與管理2、數(shù)據(jù)庫(kù)搜索及序列比較3、基因組序列分析4、基因表達(dá)數(shù)據(jù)的分析與處理5、蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)生物信息學(xué)及其發(fā)展歷史基因組數(shù)據(jù)庫(kù)蛋白質(zhì)序列數(shù)據(jù)庫(kù)蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫(kù)DDBJEMBLGenBankSWISS-PROTPDBPIR1、生物分子數(shù)據(jù)的收集與管理生物信息學(xué)及其發(fā)展歷史2、數(shù)據(jù)庫(kù)搜索及序列比較搜索同源序列在一定程度上就是通過(guò)序列比較尋找相似序列序列比較的一個(gè)基本操作就是比對(duì)(Alignment),即將兩個(gè)序列的各個(gè)字符(代表核苷酸或者氨基酸殘基)按照對(duì)應(yīng)等同或者置換關(guān)系進(jìn)行對(duì)比排列,其結(jié)果是兩個(gè)序列共有的排列順序,這是序列相似程度的一種定性描述多重序列比對(duì)研究的是多個(gè)序列的共性。序列的多重比對(duì)可用來(lái)搜索基因組序列的功能區(qū)域,也可用于研究一組蛋白質(zhì)之間的進(jìn)化關(guān)系。生物信息學(xué)及其發(fā)展歷史發(fā)現(xiàn)同源分子生物信息學(xué)及其發(fā)展歷史3、基因組序列分析
遺傳語(yǔ)言分析——天書基因組結(jié)構(gòu)分析基因識(shí)別基因功能注釋基因調(diào)控信息分析基因組比較生物信息學(xué)及其發(fā)展歷史4、基因表達(dá)數(shù)據(jù)的分析與處理基因表達(dá)數(shù)據(jù)分析是目前生物信息學(xué)研究的熱點(diǎn)和重點(diǎn)目前對(duì)基因表達(dá)數(shù)據(jù)的處理主要是進(jìn)行聚類分析,將表達(dá)模式相似的基因聚為一類,在此基礎(chǔ)上尋找相關(guān)基因,分析基因的功能所用方法主要有:相關(guān)分析方法模式識(shí)別技術(shù)中的層次式聚類方法人工智能中的自組織映射神經(jīng)網(wǎng)絡(luò)主元分析方法生物信息學(xué)及其發(fā)展歷史基因芯片生物信息學(xué)及其發(fā)展歷史生物信息學(xué)及其發(fā)展歷史生物信息學(xué)及其發(fā)展歷史層次式聚類生物信息學(xué)及其發(fā)展歷史二維電泳圖生物信息學(xué)及其發(fā)展歷史5、蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)
蛋白質(zhì)的生物功能由蛋白質(zhì)的結(jié)構(gòu)所決定,蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)成為了解蛋白質(zhì)功能的重要途徑蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)分為:二級(jí)結(jié)構(gòu)預(yù)測(cè)空間結(jié)構(gòu)預(yù)測(cè)蛋白質(zhì)折疊生物信息學(xué)及其發(fā)展歷史二級(jí)結(jié)構(gòu)預(yù)測(cè)在一定程度上二級(jí)結(jié)構(gòu)的預(yù)測(cè)可以歸結(jié)為模式識(shí)別問(wèn)題
在二級(jí)結(jié)構(gòu)預(yù)測(cè)方面主要方法有:立體化學(xué)方法圖論方法統(tǒng)計(jì)方法最鄰近決策方法基于規(guī)則的專家系統(tǒng)方法分子動(dòng)力學(xué)方法人工神經(jīng)網(wǎng)絡(luò)方法預(yù)測(cè)準(zhǔn)確率超過(guò)70%的第一個(gè)軟件是基于神經(jīng)網(wǎng)絡(luò)的PHD系統(tǒng)生物信息學(xué)及其發(fā)展歷史空間結(jié)構(gòu)預(yù)測(cè)在空間結(jié)構(gòu)預(yù)測(cè)方面,比較成功的理論方法是同源模型法該方法的依據(jù)是:相似序列的蛋白質(zhì)傾向于折疊成相似的三維空間結(jié)構(gòu)運(yùn)用同源模型方法可以完成所有蛋白質(zhì)10-30%的空間結(jié)構(gòu)預(yù)測(cè)工作生物信息學(xué)及其發(fā)展歷史第四節(jié)生物信息學(xué)當(dāng)前的主要任務(wù)
生物信息學(xué)及其發(fā)展歷史
縱觀當(dāng)今生物信息學(xué)界的現(xiàn)狀,可以發(fā)現(xiàn),大部分人都把注意力集中在基因組、蛋白質(zhì)組、蛋白質(zhì)結(jié)構(gòu)以及與之相結(jié)合的藥物設(shè)計(jì)上生物信息學(xué)及其發(fā)展歷史1.基因組
1.1新基因的發(fā)現(xiàn)
通過(guò)計(jì)算分析從EST(ExpressedSequenceTags)序列庫(kù)中拼接出完整的新基因編碼區(qū),也就是通俗所說(shuō)的“電子克隆”;通過(guò)計(jì)算分析從基因組DNA序列中確定新基因編碼區(qū),經(jīng)過(guò)多年的積累,已經(jīng)形成許多分析方法,如根據(jù)編碼區(qū)具有的獨(dú)特序列特征、根據(jù)編碼區(qū)與非編碼區(qū)在堿基組成上的差異、根據(jù)高維分布的統(tǒng)計(jì)方法、根據(jù)神經(jīng)網(wǎng)絡(luò)方法、根據(jù)分形方法和根據(jù)密碼學(xué)方法等。生物信息學(xué)及其發(fā)展歷史1.2非蛋白編碼區(qū)生物學(xué)意義的分析
生物信息學(xué)及其發(fā)展歷史
非蛋白編碼區(qū)約占人類基因組的95%,其生物學(xué)意義目前尚不是很清楚,但從演化觀點(diǎn)來(lái)看,其中必然蘊(yùn)含著重要的生物學(xué)功能,由于它們并不編碼蛋白,一般認(rèn)為,它們的生物學(xué)功能可能體現(xiàn)在對(duì)基因表達(dá)的時(shí)空調(diào)控上。對(duì)非蛋白編碼區(qū)進(jìn)行生物學(xué)意義分析的策略有兩種,一種是基于已有的已經(jīng)為實(shí)驗(yàn)證實(shí)的所有功能已知的DNA元件的序列特征,預(yù)測(cè)非蛋白編碼區(qū)中可能含有的功能已知的DNA元件,從而預(yù)測(cè)其可能的生物學(xué)功能,并通過(guò)實(shí)驗(yàn)進(jìn)行驗(yàn)證;另一種則是通過(guò)數(shù)理理論直接探索非蛋白編碼區(qū)的新的未知的序列特征,并從理論上預(yù)測(cè)其可能的信息含義,最后同樣通過(guò)實(shí)驗(yàn)驗(yàn)證。生物信息學(xué)及其發(fā)展歷史1.3基因組整體功能及其調(diào)節(jié)網(wǎng)絡(luò)的系統(tǒng)把握
把握生命的本質(zhì),僅僅掌握基因組中部分基因的表達(dá)調(diào)控是遠(yuǎn)遠(yuǎn)不夠的,因?yàn)樯F(xiàn)象是基因組中所有功能單元相互作用共同制造出來(lái)的?;蛐酒夹g(shù)由于可以監(jiān)測(cè)基因組在各種時(shí)間斷面上的整體轉(zhuǎn)錄表達(dá)狀況,因此成為該領(lǐng)域中一項(xiàng)非常重要和關(guān)鍵的實(shí)驗(yàn)技術(shù),對(duì)該技術(shù)所產(chǎn)生的大量實(shí)驗(yàn)數(shù)據(jù)進(jìn)行高效分析,從中獲得基因組運(yùn)轉(zhuǎn)以及調(diào)控的整體系統(tǒng)的機(jī)制或者是網(wǎng)絡(luò)機(jī)制,便成了生物信息學(xué)在該領(lǐng)域中首先要解決的問(wèn)題。生物信息學(xué)及其發(fā)展歷史1.4基因組演化與物種演化
生物信息學(xué)及其發(fā)展歷史
盡管已經(jīng)在分子演化方面取得了許多重要的成就,但僅僅依靠某些基因或者分子的演化現(xiàn)象,就想闡明物種整體的演化歷史似乎不太可靠。例如,智人與黑猩猩之間有98%-99%的結(jié)構(gòu)基因和蛋白質(zhì)是相同的,然而表型上卻具有如此巨大的差異,這就不能不使我們聯(lián)想到形形色色千差萬(wàn)別的建筑樓群,它們的外觀如此不同,但基礎(chǔ)的部件組成卻是幾乎一樣的,差別就在于這些基礎(chǔ)部件的組織方式不同,這就提示我們基因組整體組織方式而不僅僅是個(gè)別基因在研究物種演化歷史中的重要作用。由于基因組是物種所有遺傳信息的儲(chǔ)藏庫(kù),從根本上決定著物種個(gè)體的發(fā)育和生理,因此,從基因組整體結(jié)構(gòu)組織和整體功能調(diào)節(jié)網(wǎng)絡(luò)方面,結(jié)合相應(yīng)的生理表征現(xiàn)象,進(jìn)行基因組整體的演化研究,將是揭示物種真實(shí)演化歷史的最佳途徑。生物信息學(xué)及其發(fā)展歷史2、蛋白質(zhì)組
生物信息學(xué)及其發(fā)展歷史
基因組對(duì)生命體的整體控制必須通過(guò)它所表達(dá)的全部蛋白質(zhì)來(lái)執(zhí)行,由于基因芯片技術(shù)只能反映從基因組到RNA的轉(zhuǎn)錄水平上的表達(dá)情況,由于從RNA到蛋白質(zhì)還有許多中間環(huán)節(jié)的影響,因此僅憑基因芯片技術(shù)我們還不能最終掌握生物功能具體執(zhí)行者——蛋白質(zhì)的整體表達(dá)狀況;因此,近幾年在發(fā)展基因芯片的同時(shí),人們也發(fā)展了一套研究基因組所有蛋白質(zhì)產(chǎn)物表達(dá)情況——蛋白質(zhì)組研究技術(shù),從技術(shù)上來(lái)講包括二維凝膠電泳技術(shù)和質(zhì)譜測(cè)序技術(shù)。通過(guò)二維凝膠電泳技術(shù)可以獲得某一時(shí)間截面上蛋白質(zhì)組的表達(dá)情況,通過(guò)質(zhì)譜測(cè)序技術(shù)就可以得到所有這些蛋白質(zhì)的序列組成。這些都是技術(shù)實(shí)現(xiàn)問(wèn)題,最重要的就是如何運(yùn)用生物信息學(xué)理論方法去分析所得到的巨量數(shù)據(jù),從中還原出生命運(yùn)轉(zhuǎn)和調(diào)控的整體系統(tǒng)的分子機(jī)制。生物信息學(xué)及其發(fā)展歷史
基因組和蛋白質(zhì)組研究的迅猛發(fā)展,使許多新蛋白序列涌現(xiàn)出來(lái),然而要想了解它們的功能,只有氨基酸序列是遠(yuǎn)遠(yuǎn)不夠的,因?yàn)榈鞍踪|(zhì)的功能是通過(guò)其三維高級(jí)結(jié)構(gòu)來(lái)執(zhí)行的,而且蛋白質(zhì)三維結(jié)構(gòu)也不一定是靜態(tài)的,在行使功能的過(guò)程中其結(jié)構(gòu)也會(huì)相應(yīng)的有所改變。因此,得到這些新蛋白的完整、精確和動(dòng)態(tài)的三維結(jié)構(gòu)就成為擺在我們面前的緊迫任務(wù)。目前除了通過(guò)諸如X射線晶體結(jié)構(gòu)分析、多維核磁共振(NMR)波譜分析和電子顯微鏡二維晶體三維重構(gòu)(電子晶體學(xué),EC)等物理方法得到蛋白質(zhì)三維結(jié)構(gòu)之外3、蛋白質(zhì)結(jié)構(gòu)
生物信息學(xué)及其發(fā)展歷史
另外一種廣泛使用的方法就是通過(guò)計(jì)算機(jī)輔助預(yù)測(cè)的方法,目前,一般認(rèn)為蛋白質(zhì)的折疊類型只有數(shù)百到數(shù)千種,遠(yuǎn)遠(yuǎn)小于蛋白質(zhì)所具有的自由度數(shù)目,而且蛋白質(zhì)的折疊類型與其氨基酸序列具有相關(guān)性,這樣就有可能直接從蛋白質(zhì)的氨基酸序列通過(guò)計(jì)算機(jī)輔助方法預(yù)測(cè)出蛋白質(zhì)的三維結(jié)構(gòu)生物信息學(xué)及其發(fā)展歷史4、新藥設(shè)計(jì)
生物信息學(xué)及其發(fā)展歷史
近年來(lái)隨著結(jié)構(gòu)生物學(xué)的發(fā)展,相當(dāng)數(shù)量的蛋白質(zhì)以及一些核酸、多糖的三維結(jié)構(gòu)獲得精確測(cè)定,基于生物大分子結(jié)構(gòu)知識(shí)的藥物設(shè)計(jì)成為當(dāng)前的熱點(diǎn)。生物信息學(xué)的研究不僅可提供生物大分子空間結(jié)構(gòu)的信息,還能提供電子結(jié)構(gòu)的信息,如能級(jí)、表面電荷分布、分子軌道相互作用等以及動(dòng)力學(xué)行為的信息,如生物化學(xué)反應(yīng)中的能量變化、電荷轉(zhuǎn)移、構(gòu)象變化等。理論模擬還可研究包括生物分子及其周圍環(huán)境的復(fù)雜體系和生物分子的量子效應(yīng)。生物信息學(xué)及其發(fā)展歷史
但生物信息學(xué)的任務(wù)遠(yuǎn)不止于此。在以上工作的基礎(chǔ)上,最重要的是如何運(yùn)用數(shù)理理論成果對(duì)生物體進(jìn)行完整系統(tǒng)的數(shù)理模型描述,使得人類能夠從一個(gè)更加明確的角度和一個(gè)更加易于操作的途徑來(lái)認(rèn)識(shí)和控制自身以及所有其他的生命體生物信息學(xué)及其發(fā)展歷史生物信息學(xué)不僅僅是一門科學(xué)學(xué)科,它更是一種重要的研究開發(fā)工具。
從科學(xué)的角度來(lái)講,它是一門研究生物和生物相關(guān)系統(tǒng)中信息內(nèi)容物和信息流向的綜合系統(tǒng)科學(xué),只有通過(guò)生物信息學(xué)的計(jì)算處理,我們才能從眾多分散的生物學(xué)觀測(cè)數(shù)據(jù)中獲得對(duì)生命運(yùn)行機(jī)制的詳細(xì)和系統(tǒng)的理解。從工具的角度來(lái)講,它是今后幾乎進(jìn)行所有生物(醫(yī)藥)研究開發(fā)所必需的舵手和動(dòng)力機(jī),只有基于生物信息學(xué)通過(guò)對(duì)大量已有數(shù)據(jù)資料的分析處理所提供的理論指導(dǎo)和分析,我們才能選擇正確的研發(fā)方向,同樣,只有選擇正確的生物信息學(xué)分析方法和手段,我們才能正確處理和評(píng)價(jià)新的觀測(cè)數(shù)據(jù)并得到準(zhǔn)確的結(jié)論。生物信息學(xué)及其發(fā)展歷史生物信息學(xué)研究意義生物信息學(xué)將是21世紀(jì)生物學(xué)的核心
認(rèn)識(shí)生物本質(zhì)了解生物分子信息的組織和結(jié)構(gòu),破譯基因組信息,闡明生物信息之間的關(guān)系改變生物學(xué)的研究方式改變傳統(tǒng)研究方式,引進(jìn)現(xiàn)代信息學(xué)方法在醫(yī)學(xué)上的重要意義為疾病的診斷和治療提供依據(jù)為設(shè)計(jì)新藥提供依據(jù)生物信息學(xué)及其發(fā)展歷史第五節(jié)生物信息學(xué)所用的方法和技術(shù)
1、數(shù)學(xué)統(tǒng)計(jì)方法2、動(dòng)態(tài)規(guī)劃方法3、機(jī)器學(xué)習(xí)與模式識(shí)別技術(shù)4、數(shù)據(jù)庫(kù)技術(shù)及數(shù)據(jù)挖掘5、人工神經(jīng)網(wǎng)絡(luò)技術(shù)6、專家系統(tǒng)7、分子模型化技術(shù)8、量子力學(xué)和分子力學(xué)計(jì)算9、生物分子的計(jì)算機(jī)模擬10、因特網(wǎng)(Internet)技術(shù)生物信息學(xué)及其發(fā)展歷史1、數(shù)學(xué)統(tǒng)計(jì)方法生物活動(dòng)常常以大量、重復(fù)的形式出現(xiàn),既受到內(nèi)在因素的制約,又受到外界環(huán)境的隨機(jī)干擾。因此概率論和數(shù)學(xué)統(tǒng)計(jì)是現(xiàn)代生物學(xué)研究中一種常用的分析方法數(shù)據(jù)統(tǒng)計(jì)、因素分析、多元回歸分析是生物學(xué)研究必備的工具隱馬爾科夫模型(HiddenMarkovModels)在序列分析方面有著重要的應(yīng)用。與隱馬爾科夫模型相關(guān)的技術(shù)是馬爾科夫鏈(MarkovChain)生物信息學(xué)及其發(fā)展歷史2、動(dòng)態(tài)規(guī)劃方法動(dòng)態(tài)規(guī)劃(DynamicProgramming)是一種解決多階段決策過(guò)程的最優(yōu)化方法或復(fù)雜空間的優(yōu)化搜索方法動(dòng)態(tài)規(guī)劃解決問(wèn)題的基本過(guò)程是:將一個(gè)問(wèn)題的全局解分解為局部解,逆序遞推求出局部最優(yōu)解,隨著執(zhí)行過(guò)程的推進(jìn),“局部”逐漸接近“全局”,最終獲得全局最優(yōu)解生物信息學(xué)及其發(fā)展歷史3、機(jī)器學(xué)習(xí)與模式識(shí)別技術(shù)機(jī)器學(xué)習(xí)機(jī)器學(xué)習(xí)是模擬人類的學(xué)習(xí)過(guò)程,以計(jì)算機(jī)為工具獲取知識(shí)、積累經(jīng)驗(yàn)1、遺傳算法采用隨機(jī)搜索方法,具有自適應(yīng)能力和便于并行計(jì)算2、神經(jīng)網(wǎng)絡(luò)的理論是基于人腦的結(jié)構(gòu),其目的是揭示一個(gè)系統(tǒng)是如何向環(huán)境學(xué)習(xí)的,這一種方法被稱為聯(lián)接主義。模式識(shí)別模式識(shí)別是機(jī)器學(xué)習(xí)的一個(gè)主要任務(wù)。模式是對(duì)感興趣客體定量的或者結(jié)構(gòu)的描述,而模式識(shí)別就是利用計(jì)算機(jī)對(duì)客體進(jìn)行鑒別,將相同或者相似的客體歸入同種類別中模式識(shí)別主要有兩種方法:根據(jù)對(duì)象的統(tǒng)計(jì)特征進(jìn)行識(shí)別,根據(jù)對(duì)象的結(jié)構(gòu)特征進(jìn)行識(shí)別
生物信息學(xué)及其發(fā)展歷史環(huán)境學(xué)習(xí)知識(shí)庫(kù)執(zhí)行機(jī)器學(xué)習(xí)系統(tǒng)的基本結(jié)構(gòu)
反饋生物信息學(xué)及其發(fā)展歷史4、數(shù)據(jù)庫(kù)技術(shù)及數(shù)據(jù)挖掘數(shù)據(jù)庫(kù)技術(shù)數(shù)據(jù)倉(cāng)庫(kù)虛擬數(shù)據(jù)庫(kù)技術(shù)(VirtualDatabase,簡(jiǎn)稱VDB)數(shù)據(jù)挖掘(datamining)又稱作數(shù)據(jù)庫(kù)中的知識(shí)發(fā)現(xiàn)(KnowledgeDiscoveryinDatabase),它是從數(shù)據(jù)庫(kù)或數(shù)據(jù)倉(cāng)庫(kù)中發(fā)現(xiàn)并提取隱藏在其中的信息的一種新技術(shù),它能自動(dòng)分析數(shù)據(jù),對(duì)它們進(jìn)行歸納性推理和聯(lián)想,尋找數(shù)據(jù)間內(nèi)在的某些關(guān)聯(lián),從中發(fā)掘出潛在的、對(duì)信息預(yù)測(cè)和決策行為起著十分重要作用的模式數(shù)據(jù)挖掘過(guò)程一般分為4個(gè)基本步驟:數(shù)據(jù)選擇、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)挖掘和結(jié)果分析生物信息學(xué)及其發(fā)展歷史5、人工神經(jīng)網(wǎng)絡(luò)技術(shù)人工神經(jīng)網(wǎng)絡(luò)(ArtificialNeuralNetwork,簡(jiǎn)稱ANN)是通過(guò)模擬神經(jīng)元的特性以及腦的大規(guī)模并行結(jié)構(gòu)、信息的分布式和并行處理等機(jī)制建立的一種數(shù)學(xué)模型在生物信息學(xué)中,使用得最多的是反向傳播神經(jīng)網(wǎng)絡(luò)(Ba
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2019-2025年軍隊(duì)文職人員招聘之軍隊(duì)文職教育學(xué)題庫(kù)與答案
- 2025年軍隊(duì)文職人員招聘之軍隊(duì)文職管理學(xué)與服務(wù)考試題庫(kù)
- 2021-2022學(xué)年廣東省廣州市白云區(qū)六校七年級(jí)(下)期中數(shù)學(xué)試卷(含答案)
- 企業(yè)級(jí)數(shù)據(jù)安全合規(guī)策略制定服務(wù)協(xié)議
- 網(wǎng)絡(luò)直播平臺(tái)合作項(xiàng)目表
- 四川省成都市武侯區(qū)2024-2025學(xué)年七年級(jí)上學(xué)期期末生物學(xué)試題(含答案)
- 湖南省岳陽(yáng)市岳陽(yáng)縣2024-2025學(xué)年七年級(jí)上學(xué)期期末生物學(xué)試題(含答案)
- 語(yǔ)言學(xué)英語(yǔ)翻譯技能測(cè)試卷
- 濕地松采脂承包合同
- 團(tuán)隊(duì)目標(biāo)與績(jī)效考核表
- 2025版年度城市綠化活動(dòng)策劃及實(shí)施服務(wù)合同范本
- 2025年誠(chéng)通證券招聘筆試參考題庫(kù)含答案解析
- 人教版高一上學(xué)期數(shù)學(xué)(必修一)期末考試卷(附答案)
- 專題17 全等三角形模型之奔馳模型解讀與提分精練(全國(guó))(解析版)
- 智能制造能力成熟度模型(-CMMM-)介紹及評(píng)估方法分享
- 臨床康復(fù)??谱o(hù)士主導(dǎo)神經(jīng)重癥患者早期漸進(jìn)式離床活動(dòng)實(shí)踐應(yīng)用
- 《搜索引擎使用方法》課件
- DBJT14-100-2013 外墻外保溫應(yīng)用技術(shù)規(guī)程(改性酚醛泡沫板薄抹灰外墻外保溫系統(tǒng))
- 《兒科補(bǔ)液》課件
- 2024解析:第六章質(zhì)量和密度-講核心(解析版)
- 基爾霍夫定律課件(共17張課件)
評(píng)論
0/150
提交評(píng)論