生物信息學(xué)課件_第1頁
生物信息學(xué)課件_第2頁
生物信息學(xué)課件_第3頁
生物信息學(xué)課件_第4頁
生物信息學(xué)課件_第5頁
已閱讀5頁,還剩32頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、生物信息學(xué)Bioinformatics生物信息學(xué)緒 論v1. 什么是生物信息學(xué)?v2. 生物信息學(xué)的產(chǎn)生v3. 生物信息學(xué)發(fā)展過程v4. 生物信息學(xué)的基本方法v5. 生物信息學(xué)的研究?jī)?nèi)容v6. 生物信息學(xué)的應(yīng)用v7. 基因組信息學(xué)的首要任務(wù)v8. 生物信息學(xué)的重要研究課題v9. 生物信息學(xué)的商業(yè)價(jià)值v10. 通過學(xué)習(xí)應(yīng)逐漸掌握的內(nèi)容生物信息學(xué)1. 什么是生物信息學(xué)?vWhat is bioinformatics ?vWhat do you know about bioinformatics ?v收集、維護(hù)、傳播、分析以及利用在分子生物學(xué)研究中獲得的大量數(shù)據(jù)。生物信息學(xué)(bioinformati

2、cs)是生物學(xué)與計(jì)算機(jī)科學(xué)以及應(yīng)用數(shù)學(xué)等學(xué)科相互交叉而形成的一門新興學(xué)科。它通過對(duì)生物學(xué)實(shí)驗(yàn)數(shù)據(jù)的獲取、加工、存儲(chǔ)、檢索與分析,進(jìn)而達(dá)到揭示數(shù)據(jù)所蘊(yùn)含的生物學(xué)意義的目的。由于當(dāng)前生物信息學(xué)發(fā)展的主要推動(dòng)力來自分子生物學(xué),生物信息學(xué)的研究主要集中于核苷酸和氨基酸序列的存儲(chǔ)、分類、檢索和分析等方面,所以目前生物信息學(xué)可以狹義地定義為:將計(jì)算機(jī)科學(xué)和數(shù)學(xué)應(yīng)用于生物大分子信息的獲取、加工、存儲(chǔ)、分類、檢索與分析,以達(dá)到理解這些生物大分子信息的生物學(xué)意義的交叉學(xué)科。生物信息學(xué)1. 什么是生物信息學(xué)? 現(xiàn)代分子生物學(xué)的發(fā)展,特別是人基因組計(jì)劃的實(shí)施,使生物學(xué)家所面對(duì)的數(shù)據(jù)不再是實(shí)驗(yàn)記錄本上或文獻(xiàn)上的幾行簡(jiǎn)

3、單數(shù)字,而是公共數(shù)據(jù)庫中數(shù)以千兆計(jì)的記錄。v基因組信息是生物信息中最基本的表達(dá)形式,并且基因組信息量在生物信息量中占有極大的比重,但是,生物信息并不僅限于基因組信息,生物信息學(xué)也不等于是基因組信息學(xué)。廣義的說,生物信息不僅包括基因組信息,如基因的DNA序列、染色體定位,也包括基因產(chǎn)物(蛋白質(zhì)或RNA)的結(jié)構(gòu)和功能及各生物種間的進(jìn)化關(guān)系等其他信息資源。生物信息學(xué)1. 什么是生物信息學(xué)?vWhat is bioinformatics ?vGenome informatics is a scientific discipline that encompasses all aspects of gen

4、ome information acquisition, processing, storage, distribution, analysis, and interpretation. 生物信息學(xué), 它是一個(gè)學(xué)科領(lǐng)域,包含著基因組信息的獲取、處理、存儲(chǔ)、分配 、分析和解釋的所有方面。 (The U.S. Human Genome Project: The First Five Years FY 1991-1995, by NIH and DOE) ?生物信息學(xué)2. 生物信息學(xué)的產(chǎn)生v生物信息學(xué)(bioinformatics)是80年代末隨著人類基因組計(jì)劃(Human genome proje

5、ct)的啟動(dòng)而興起的一門新的交叉學(xué)科。它涉及生物學(xué)、數(shù)學(xué)、計(jì)算機(jī)科學(xué)和工程學(xué),依賴于計(jì)算機(jī)科學(xué)、工程學(xué)和應(yīng)用數(shù)學(xué)的基礎(chǔ),依賴于生物實(shí)驗(yàn)和衍生數(shù)據(jù)的大量?jī)?chǔ)存。生物信息學(xué)不只是一門為了建立、更新生物數(shù)據(jù)庫及獲取生物數(shù)據(jù)而聯(lián)合使用多項(xiàng)計(jì)算機(jī)科學(xué)技術(shù)的應(yīng)用性學(xué)科,也不僅僅是只限于生物信息學(xué)這一概念的理論性學(xué)科。事實(shí)上,它是一門理論概念與實(shí)踐應(yīng)用并重的學(xué)科。v生物信息學(xué)的產(chǎn)生發(fā)展僅有10年左右的時(shí)間 bioinformatics這一名詞在1991年左右才在文獻(xiàn)中出現(xiàn),還只是出現(xiàn)在電子出版物的文本中。事實(shí)上,生物信息學(xué)的存在已有30多年,只不過最初常被稱為基因組信息學(xué)。生物信息學(xué)3. 生物信息學(xué)發(fā)展過程v

6、20世紀(jì)50年代末 數(shù)學(xué)模型、統(tǒng)計(jì)學(xué)方法和計(jì)算機(jī)處理宏觀生物學(xué)數(shù)據(jù)。數(shù)量分類學(xué)、數(shù)學(xué)生態(tài)。v應(yīng)用于分子生物學(xué):分子生物學(xué)數(shù)據(jù)庫、蛋白質(zhì)結(jié)構(gòu)分析與預(yù)測(cè)。v人類基因組計(jì)劃(human genome project, HGP):1990年啟動(dòng),10年時(shí)間完成草圖(3x10e9個(gè)堿基對(duì),2.91x10e9并對(duì)30,000多個(gè)基因進(jìn)行了注釋)。v越來越多的微生物和其他模式生物也完成了全基因組測(cè)序工作。生物信息學(xué)3. 生物信息學(xué)的發(fā)展過程大致經(jīng)歷了3個(gè)階段:v前基因組時(shí)代生物數(shù)據(jù)庫的建立、檢索工具的開發(fā)、DNA和蛋白質(zhì)序列分析、全局和局部的序列對(duì)位排列;v基因組時(shí)代基因?qū)ふ液妥R(shí)別、網(wǎng)絡(luò)數(shù)據(jù)庫系統(tǒng)的建立、交

7、互界面的開發(fā);v后基因組時(shí)代大規(guī)?;蚪M分析、蛋白質(zhì)組分析。生物信息學(xué)3. 生物信息學(xué)的發(fā)展過程v世紀(jì)后期,生物科學(xué)技術(shù)迅猛發(fā)展,無論從數(shù)量上還是從質(zhì)量上都極大地豐富了生物科學(xué)的數(shù)據(jù)資源。數(shù)據(jù)資源的急劇膨脹迫使人們尋求一種強(qiáng)有力的工具去組織這些數(shù)據(jù),以利于儲(chǔ)存、加工和進(jìn)一步利用。而海量的生物學(xué)數(shù)據(jù)中必然蘊(yùn)含著重要的生物學(xué)規(guī)律,這些規(guī)律將是解釋生命之謎的關(guān)鍵,人們同樣需要一種強(qiáng)有力的工具來協(xié)助人腦完成對(duì)這些數(shù)據(jù)的分析工作。另一方面,以數(shù)據(jù)分析、處理為本質(zhì)的計(jì)算機(jī)科學(xué)技術(shù)和網(wǎng)絡(luò)技術(shù)迅猛發(fā)展,并日益滲透到生物科學(xué)的各個(gè)領(lǐng)域。于是,一門嶄新的、擁有巨大發(fā)展?jié)摿Φ男聦W(xué)科生物信息學(xué)悄然興起。生物信息學(xué)3.

8、 生物信息學(xué)的發(fā)展過程生物信息學(xué)的生物信息學(xué)的誕生誕生及其重要性:及其重要性:v早在1956年,在美國(guó)田納西州蓋特林堡(Datlinburg)召開的首次“生物學(xué)中的信息理論研討會(huì)”上,便產(chǎn)生了生物信息學(xué)的概念。但是,就生物信息學(xué)的發(fā)展而言,它還是一門相當(dāng)年輕的學(xué)科。直到20世紀(jì)8090年代,伴隨著計(jì)算機(jī)科學(xué)技術(shù)的進(jìn)步,生物信息學(xué)才獲得突破性進(jìn)展。v1987年,林華安博士正式把這一學(xué)科命名為“生物信息學(xué)” (Bioinformatics)。此后,其內(nèi)涵隨著研究的深入和現(xiàn)實(shí)需要的變化而幾經(jīng)更迭。1995年,在美國(guó)人類基因組計(jì)劃第一個(gè)五年總結(jié)報(bào)告中,給出了一個(gè)較為完整的生物信息學(xué)定義:生物信息學(xué)是一

9、門交叉科學(xué),它包含了生物信息的獲取、加工、存儲(chǔ)、分配、分析、解釋等在內(nèi)的所有方面,它綜合運(yùn)用數(shù)學(xué)、計(jì)算機(jī)科學(xué)和生物學(xué)的各種工具,來闡明和理解大量數(shù)據(jù)所包含的生物學(xué)意義。生物信息學(xué)3. 生物信息學(xué)的發(fā)展過程生物信息學(xué)的生物信息學(xué)的誕生誕生及其重要性:及其重要性:v生物信息學(xué)不僅是一門新學(xué)科,更是一種重要的研究開發(fā)工具。從科學(xué)的角度來講,生物信息學(xué)是一門研究生物和生物相關(guān)系統(tǒng)中信息內(nèi)容與信息流向的綜合系統(tǒng)科學(xué)。只有通過生物信息學(xué)的計(jì)算處理,人們才能從眾多分散的生物學(xué)觀測(cè)數(shù)據(jù)中獲得對(duì)生命運(yùn)行機(jī)制的系統(tǒng)理解。從工具的角度來講,生物信息學(xué)幾乎是今后所有生物(醫(yī)藥)研究開發(fā)所必需的工具。只有根據(jù)生物信息學(xué)

10、對(duì)大量數(shù)據(jù)資料進(jìn)行分析后,人們才能選擇該領(lǐng)域正確的研發(fā)方向。v生物信息學(xué)不僅具有重大的科學(xué)意義,而且具有巨大的經(jīng)濟(jì)效益。它的許多研究成果可以較快地產(chǎn)業(yè)化,成為價(jià)值很高的產(chǎn)品。生物信息學(xué)4. 生物信息學(xué)的基本方法v建立生物數(shù)據(jù)庫:核苷酸順序數(shù)據(jù)庫(GENBANK)、Protein Data Bank(PDB)、氨基酸順序數(shù)據(jù)庫(SWISS-PRO)、酵母基因組數(shù)據(jù)庫(YEASTS)、美國(guó)種質(zhì)保藏中心(ATCC)、美國(guó)專利局?jǐn)?shù)據(jù)庫(USPO)。v數(shù)據(jù)庫檢索:Blastv序列分析:序列對(duì)位排列、同源比較、進(jìn)化分析。v統(tǒng)計(jì)模型:如隱馬爾可夫模型(hidden Markov model, HMM) 基因

11、識(shí)別、藥物設(shè)計(jì)。最大似然模型(maximun likelihood model, ML)、 最大簡(jiǎn)約法(Maximum Parsimony, MP) 分子進(jìn)化分析。v算法:如自動(dòng)序列拼接、外顯子預(yù)測(cè)和同源比較、遺傳算法、人工神經(jīng)網(wǎng)絡(luò)(artificial neural network)。生物信息學(xué)5. 生物信息學(xué)的研究?jī)?nèi)容v生物信息學(xué)的研究?jī)?nèi)容是伴隨著基因組研究而發(fā)展的。廣義地說,生物信息學(xué)從事對(duì)基因組研究相關(guān)生物信息的獲取、加工、存儲(chǔ)、分配、分析和解釋。這個(gè)定義的含義是雙重的:一是對(duì)海量數(shù)據(jù)的收集、整理與服務(wù),即管理好這些數(shù)據(jù);二是從中發(fā)現(xiàn)新的規(guī)律,也就是使用好這些數(shù)據(jù)。v具體地說,生物信息

12、學(xué)是把基因組DNA(脫氧核糖核酸)序列信息分析作為源頭,找到基因組序列中代表蛋白質(zhì)和RNA (核糖核酸)基因的編碼區(qū)。同時(shí),闡明基因組中大量存在的非編碼區(qū)的信息實(shí)質(zhì),破譯隱藏在DNA序列中的遺傳語言規(guī)律。在此基礎(chǔ)上,歸納、整理與基因組遺傳信息釋放及其調(diào)控相關(guān)的轉(zhuǎn)錄譜和蛋白質(zhì)譜的數(shù)據(jù),從而認(rèn)識(shí)代謝、發(fā)育、分化、進(jìn)化的規(guī)律。生物信息學(xué)5. 生物信息學(xué)的研究?jī)?nèi)容v獲取人和各種生物的完整基因組v發(fā)現(xiàn)新基因和新的單核苷酸多態(tài)性(1)基因的電腦克隆(2)從基因組 DNA序列中預(yù)測(cè)新基因(3)發(fā)現(xiàn)單核苷酸多態(tài)(SNP)v基因組中非編碼區(qū)信息結(jié)構(gòu)分析v在基因組水平研究生物進(jìn)化v完整基因組的比較研究v從功能基因

13、組到系統(tǒng)生物學(xué)v蛋白質(zhì)結(jié)構(gòu)模擬與藥物設(shè)計(jì)生物信息學(xué)6. 生物信息學(xué)的應(yīng)用v基因組分析v基因芯片v藥物開發(fā)v其他生物信息學(xué)生物信息學(xué)的應(yīng)用: 6.1. 基因組分析 將已知的序列與功能聯(lián)系在一起、從基于常規(guī)克隆的基因分類轉(zhuǎn)向基于序列及功能的分析的基因分類、 從單個(gè)基因致病機(jī)制的研究轉(zhuǎn)向多個(gè)基因致病機(jī)制的研究、從組織與組織之間的比較來研究功能基因組和蛋白質(zhì)組、 從基因組和蛋白質(zhì)組的結(jié)構(gòu)與功能關(guān)系來預(yù)測(cè)三級(jí)結(jié)構(gòu)和功能,并從三級(jí)結(jié)構(gòu)和功能反推可能的序列、通過比較不同生物物種的基因組來進(jìn)行分子進(jìn)化研究。生物信息學(xué)生物信息學(xué)的應(yīng)用: 6.1.基因組分析 基因組:v基因組研究的首要目標(biāo)是獲得人的整套遺傳密碼。

14、人的遺傳密碼有億個(gè)堿基,而現(xiàn)在的測(cè)序儀每個(gè)反應(yīng)只能讀取幾百到上千個(gè)堿基。這樣,要得到人的全部遺傳密碼,首先要把人的基因組打碎,測(cè)完一個(gè)個(gè)小段的序列后再把它們重新拼接起來。而基因組大規(guī)模測(cè)序的每一個(gè)環(huán)節(jié),都同信息分析緊密相關(guān),每一步都緊密依賴于生物信息學(xué)的軟件和數(shù)據(jù)庫。生物信息學(xué)生物信息學(xué)的應(yīng)用: 1.基因組分析 蛋白質(zhì)組:蛋白質(zhì)組:v基因組對(duì)生命體的整體控制必須通過它所表達(dá)的全部蛋白質(zhì)來執(zhí)行。由于基因芯片技術(shù)只能反映從基因組到RNA的轉(zhuǎn)錄水平上的表達(dá)情況,而從RNA到蛋白質(zhì)還有許多中間環(huán)節(jié)的影響,這樣,僅憑基因芯片技術(shù)人們還不能最終掌握生物功能的具體執(zhí)行者蛋白質(zhì)的整體表達(dá)狀況。因此,近年在發(fā)展

15、基因芯片的同時(shí),人們還發(fā)展了一套研究基因組所有蛋白質(zhì)產(chǎn)物表達(dá)情況的技術(shù)蛋白質(zhì)組研究技術(shù),包括二維凝膠電泳技術(shù)和質(zhì)譜測(cè)序技術(shù)。然而,最重要的是如何運(yùn)用生物信息學(xué)的方法去分析獲得的海量數(shù)據(jù),從中還原出生命運(yùn)轉(zhuǎn)和調(diào)控的整體系統(tǒng)的分子機(jī)制。生物信息學(xué)生物信息學(xué)的應(yīng)用 6.1.基因組分析 人類基因組計(jì)劃人類基因組計(jì)劃(HGP):v人類基因組計(jì)劃(Human Genome Project簡(jiǎn)稱HGP)是美國(guó)科學(xué)家在1985年率先提出的,其目的在于闡明人類基因組DNA 3109核苷酸序列,破譯人類全部遺傳信息,HGP于1990年正式啟動(dòng)。隨著HGP產(chǎn)生的數(shù)據(jù)爆炸,一門新興學(xué)科生物信息學(xué)應(yīng)運(yùn)而生。生物信息學(xué)是以

16、計(jì)算機(jī)為主要工具,開發(fā)各種軟件,對(duì)日益增長(zhǎng)的DNA和蛋白質(zhì)的序列和結(jié)構(gòu)等相關(guān)信息進(jìn)行收集、儲(chǔ)存、發(fā)行、提取、加工、分析和研究,同時(shí)建立理論模型,指導(dǎo)實(shí)驗(yàn)研究,它由數(shù)據(jù)庫、計(jì)算機(jī)網(wǎng)絡(luò)和應(yīng)用軟件三大部分構(gòu)成,在基因組計(jì)劃中發(fā)揮不可替代的作用。生物信息學(xué)生物信息學(xué)的應(yīng)用 6.1.基因組分析人類基因組計(jì)劃人類基因組計(jì)劃(HGP):vHGP目的之一,就是找到人類基因組中的所有基因。除功能克隆和定位克隆策略之外,生物信息學(xué)為分子生物學(xué)家提供了一條尋找和研究新基因的新思路,即從高度自動(dòng)化的實(shí)驗(yàn)出發(fā),經(jīng)過數(shù)據(jù)的獲取與處理、序列片段的拼接、可能基因的尋找、基因功能的預(yù)測(cè)一直到基因的分子進(jìn)化研究。這個(gè)過程的每一個(gè)

17、環(huán)節(jié),都是生物信息學(xué)研究的重要內(nèi)容。生物信息學(xué)生物信息學(xué)的應(yīng)用 6.1.基因組分析 人類基因組計(jì)劃人類基因組計(jì)劃(HGP)HGP的目標(biāo)大致如下:v(1)建立一高分辨力的人體基因組圖譜。(2) 建立某 些選擇性模型機(jī)體(如大腸桿菌、線蟲等)的DNA和人體染色體的基因物理圖譜。(3)測(cè)定這些人體和選擇性機(jī)體的DNA序列,以便更好了解正?;蛘{(diào)控、基因遺傳性疾病及其演化過程。(4)建立軟件和數(shù)據(jù)庫以提高應(yīng)用和判斷這些基因信息的效能。(5)發(fā)明有關(guān)的創(chuàng)新技術(shù)。(6)建立HGP的倫理學(xué)、法律和社會(huì)參與的程序。生物信息學(xué)生物信息學(xué)的應(yīng)用 6.1.基因組分析人類基因組計(jì)劃人類基因組計(jì)劃(HGP):v高度自動(dòng)

18、化的實(shí)驗(yàn)數(shù)據(jù)的獲得、加工和整理如何將實(shí)驗(yàn)室中得到的生物學(xué)信息轉(zhuǎn)化為計(jì)算機(jī)能夠處理的數(shù)字信息,是生物信息學(xué)的一個(gè)重要課題。這種轉(zhuǎn)化大量地體現(xiàn)在各種自動(dòng)化分子生物學(xué)儀器應(yīng)用上,如DNA測(cè)序儀,PCR儀等。這類儀器將實(shí)驗(yàn)所得的物理化學(xué)信號(hào)轉(zhuǎn)化為數(shù)字信息,并對(duì)其作簡(jiǎn)單分析,再將分析結(jié)果用于實(shí)驗(yàn)條件的控制,完成高度自動(dòng)化的實(shí)驗(yàn)過程。從事大規(guī)模EST測(cè)序和DNA物理圖譜構(gòu)建的實(shí)驗(yàn)室都已建立起高度自動(dòng)化的機(jī)器人系統(tǒng)來完成大部分的實(shí)驗(yàn)工作。生物信息學(xué)生物信息學(xué)的應(yīng)用生物信息學(xué)的應(yīng)用 6.1.基因組分析基因組分析人類基因組計(jì)劃人類基因組計(jì)劃(HGP):v伴隨著實(shí)驗(yàn)過程的高度自動(dòng)化甚至工廠化,從事大規(guī)模分子生物學(xué)

19、項(xiàng)目的實(shí)驗(yàn)室,每天需要存儲(chǔ)的數(shù)據(jù)可以輕易地超過幾千兆字節(jié)。這樣大的數(shù)據(jù)量必須用專門的實(shí)驗(yàn)室數(shù)據(jù)管理系統(tǒng)進(jìn)行處理,以自動(dòng)完成包括實(shí)驗(yàn)進(jìn)程和數(shù)據(jù)的記錄,常規(guī)數(shù)據(jù)分析,數(shù)據(jù)質(zhì)量檢測(cè)和問題的自動(dòng)查找,常規(guī)的數(shù)據(jù)說明和數(shù)據(jù)輸人數(shù)據(jù)庫在內(nèi)的各項(xiàng)工作。由于不同實(shí)驗(yàn)室需處理的數(shù)據(jù)類型各不相同,目前各個(gè)實(shí)驗(yàn)室都是各自開發(fā)自己的系統(tǒng),還沒有成熟的可用于不同實(shí)驗(yàn)室的分子生物學(xué)數(shù)據(jù)管理系統(tǒng)。但隨著測(cè)序逐漸成為實(shí)驗(yàn)室的常規(guī)工作,對(duì)這種系統(tǒng)的需求會(huì)越來越大,此類系統(tǒng)的發(fā)展將成為大勢(shì)所趨。生物信息學(xué)生物信息學(xué)的應(yīng)用 6.1.基因組分析基因組分析人類基因組計(jì)劃人類基因組計(jì)劃(HGP):v序列片段的拼接 目前DNA自動(dòng)測(cè)序儀每

20、個(gè)反應(yīng)只能測(cè)序500bP左右。如何將這些序列片段拼接成完整的DNA順序就成為接下來的一個(gè)重要工作。傳統(tǒng)的測(cè)序技術(shù)通常將克隆進(jìn)行亞克隆并對(duì)亞克隆進(jìn)行排序。這些工作需要大量的人力物力。現(xiàn)在生物信息學(xué)提供了自動(dòng)而高速地拼接序列的算法,即根據(jù)Lander-Waterman模型利用鳥槍法進(jìn)行測(cè)序,再將大量隨機(jī)測(cè)序的片段用計(jì)算機(jī)進(jìn)行自動(dòng)拼接。這種技術(shù)不僅避免了亞克隆排序所需的大量繁瑣的工作,還使序列具有一定的冗余性以保證序列中每個(gè)堿基的準(zhǔn)確性。序列拼接算法的進(jìn)一步發(fā)展,需要在以下方面進(jìn)行改進(jìn):1將已知的基因組知識(shí)應(yīng)用與拼接算法,以進(jìn)一步提高拼接真核基因組的有效性。2自動(dòng)處理自動(dòng)測(cè)序造成的差錯(cuò),特別是對(duì)差錯(cuò)

21、傾向的EST順序更是如此。生物信息學(xué)生物信息學(xué)的應(yīng)用 6.1.基因組分析基因組分析人類基因組計(jì)劃人類基因組計(jì)劃(HGP):基因區(qū)域的預(yù)測(cè) v在完成序列的拼接后,我們得到的是很長(zhǎng)的DNA序列,甚至可能是整個(gè)基因組的序列。這些序列中包含著許多未知的基因,下一步就是將基因區(qū)域從這些長(zhǎng)序列中找出來。 v所謂基因區(qū)域的預(yù)測(cè),一般是指預(yù)測(cè)DNA順序中編碼蛋白質(zhì)的部分,即外顯子部分。不過目前基因區(qū)域的預(yù)測(cè)已從單純外顯子預(yù)測(cè)發(fā)展到整個(gè)基因結(jié)構(gòu)的預(yù)測(cè)。這些預(yù)測(cè)綜合各種外顯子預(yù)測(cè)的算法和人們對(duì)基因結(jié)構(gòu)信號(hào)(如TATA box和加尾信號(hào))的認(rèn)識(shí),預(yù)測(cè)出可能的完整基因。生物信息學(xué)生物信息學(xué)的應(yīng)用 6.1.基因組分析基

22、因組分析人類基因組計(jì)劃人類基因組計(jì)劃(HGP):基因功能預(yù)測(cè) v序列同源比較;v尋找蛋白質(zhì)家族保守順序;v蛋白質(zhì)結(jié)構(gòu)的預(yù)測(cè)。生物信息學(xué)生物信息學(xué)生物信息學(xué)的應(yīng)用 6.1.基因組分析基因組分析分子進(jìn)化的研究:分子進(jìn)化的研究: v通過上述種種方法我們可以預(yù)測(cè)出一個(gè)新基因的可能具有的功能。然而預(yù)測(cè)新基因只是生物信息學(xué)研究的一個(gè)方面,這門學(xué)科的根本目標(biāo)是探究隱藏在生物數(shù)據(jù)后面的生物學(xué)知識(shí)。對(duì)于基因組研究來說,一個(gè)重要的研究方向就是分子序列的進(jìn)化。通過比較不同生物基因組中各種結(jié)構(gòu)成分的異同,可以大大加深我們對(duì)生物進(jìn)化的認(rèn)識(shí)。這種研究已逐步形成一個(gè)稱為比較基因組學(xué)的新學(xué)科。從各種基因結(jié)構(gòu)與成分的進(jìn)化,密碼

23、子使用的進(jìn)化,到進(jìn)化樹的構(gòu)建,各種理論上和實(shí)驗(yàn)上的課題都等待生物信息學(xué)家的研究。生物信息學(xué)生物信息學(xué)的應(yīng)用 6.1.基因組分析基因組分析分子進(jìn)化的研究:分子進(jìn)化的研究:v科學(xué)家們對(duì)處于不同進(jìn)化階段物種的基因組結(jié)構(gòu)和功能進(jìn)行比較分析,企圖最終弄清人類10 萬個(gè)基因的起源和進(jìn)化、結(jié)構(gòu)和功能的演變,發(fā)現(xiàn)其間的親緣關(guān)系,像元素周期表那樣把基 因和蛋白質(zhì)分類、排序,得到生物學(xué)的周期表,根據(jù)基因在進(jìn)化樹上的位置,或一小段核苷 酸序列,或蛋白質(zhì)的基序、模塊、折疊等,即可預(yù)測(cè)其來源、結(jié)構(gòu)、功能等。這項(xiàng)浩大的工 程顯然需要大量生物信息學(xué)家長(zhǎng)期不懈努力才能完成。生物信息學(xué)生物信息學(xué)的應(yīng)用 6.2.基因芯片 基因芯

24、片基因微陣列或DNA芯片(gene microarray 或DNA chips)的原理是將幾萬個(gè)寡核苷酸或DNA作為探針,密集排列于硅片等固相支持物上,將研究樣品標(biāo)記后與微點(diǎn)陣雜交并進(jìn)行檢測(cè)。根據(jù)雜交信號(hào)強(qiáng)弱及探針位置和序列,可以確定靶DNA的表達(dá)情況以及突變和多態(tài)性存在與否。生物信息學(xué)生物信息學(xué)的應(yīng)用 6.3.藥物開發(fā)藥物開發(fā) 藥物開發(fā)藥物開發(fā)v基因組和蛋白質(zhì)組研究的迅猛發(fā)展,使許多新蛋白序列涌現(xiàn)出來。要了解它們的功能,只有氨基酸序列是遠(yuǎn)遠(yuǎn)不夠的。得到這些新蛋白的完整、精確和動(dòng)態(tài)的三維結(jié)構(gòu),是擺在人們面前的緊迫任務(wù)。生物信息學(xué) 藥物開發(fā)藥物開發(fā)v近年,隨著結(jié)構(gòu)生物學(xué)的發(fā)展,相當(dāng)數(shù)量的蛋白質(zhì)以及一些核酸、多糖的三維結(jié)構(gòu)獲得了精確的測(cè)定。根據(jù)生物大分子結(jié)構(gòu)的知識(shí),有針對(duì)性地設(shè)計(jì)藥物成為熱點(diǎn)。生物信息學(xué)的應(yīng)用 6.3.藥物開發(fā)藥物開發(fā)生物信息學(xué)生物信息學(xué)的應(yīng)用 6.4. 其他:v疾病相關(guān)的基因信息及相關(guān)算法和軟件開發(fā)v建立與動(dòng)、植物良種繁育相關(guān)的基因組數(shù)據(jù)庫,發(fā)展分子標(biāo)記輔助育種技術(shù)v研究與發(fā)展藥物設(shè)計(jì)軟件和基于生物信息的分子生物學(xué)技術(shù)v寄生蟲與流行病學(xué)研究、v農(nóng)作物基因組分析、v神經(jīng)科學(xué)。生物信息學(xué)7.

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論