生物信息學總論2014_第1頁
生物信息學總論2014_第2頁
生物信息學總論2014_第3頁
生物信息學總論2014_第4頁
生物信息學總論2014_第5頁
已閱讀5頁,還剩122頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

1、Bioinformatics 2014 生物信息學概論 武漢大學武漢大學 生物醫(yī)學工程系生物醫(yī)學工程系 趙旻趙旻 Introduction to Bioinformatics Bioinformatics 2014第一節(jié)第一節(jié) 生物信息學基礎生物信息學基礎第二節(jié)第二節(jié) 生物信息學生物信息學與人類基因組計劃與人類基因組計劃第三節(jié)第三節(jié) 生物信息學的生物信息學的研究內(nèi)容研究內(nèi)容第四節(jié)第四節(jié) 生物信息學相關技術(shù)生物信息學相關技術(shù) 本章內(nèi)容本章內(nèi)容Bioinformatics 2014學習目的1、了解生物信息學的發(fā)展背景2、理解生物信息學在生命科學研究中的作用3、理解數(shù)學、計算機科學與生物信息學的關系

2、4、了解生物信息學主要技術(shù)方法的原理和應用Bioinformatics 2014醫(yī)學生物信息學原理醫(yī)學生物信息學原理教材參考資料目錄教材參考資料目錄教材教材 1. 生物信息學(供8年制及7年制臨床醫(yī)學等專業(yè)用)李霞,李亦學,廖飛 人民衛(wèi)生出版社 2012 2. 生物信息學基礎與臨床醫(yī)學應用指南 伍欣星 趙旻 主編 科學出版社 2005參考書目參考書目 1. 基因組研究手冊:基因組學、蛋白質(zhì)組學、代謝組學、生物信息學、倫理和法律問題。 C.W.森森(Sensen.C.W.),謝東 著 科學出版社 20092. 理解生物信息學. M.澤瓦勒貝,JO.鮑姆 著 科學出版社 20123. 生物信息學

3、許忠能 清華大學出版社 2008Bioinformatics 2014序號課程內(nèi)容授課教師課時日期1總論; 數(shù)據(jù)庫應用趙旻52014,9,212基因組與醫(yī)學(1)趙旻52014,9,283基因組與醫(yī)學(2);數(shù)據(jù)分析基礎趙旻62014,10,124RNA組學原理和應用邱小萍52014,10,195模式生物與轉(zhuǎn)基因技術(shù)蔡國斌52014,10,266蛋白質(zhì)組學與技術(shù)邱小萍52014,11,27分子進化與病毒進化趙旻52014,11,98考試:完成綜述2014,11,16病毒所三樓,病毒所三樓, Bioinformatics 2014 第一節(jié) 生物信息學基礎Bioinformatics 2014一、

4、生物信息的特征生物信息的特征生命現(xiàn)象是不同層次上的物質(zhì)物質(zhì)、能量能量與信息信息的交換,不同層次是指核酸、蛋白質(zhì)、細胞、器官、系統(tǒng)、機體,與醫(yī)學研究密切相聯(lián)生物信息不僅包括基因組信息基因組信息,如基因的DNA序列、染色體定位,也包括基因產(chǎn)物(蛋白質(zhì)或RNA)的結(jié)構(gòu)和結(jié)構(gòu)和功能功能;生物種間的進化關系進化關系等其他信息資源。生物體系和生物過程中信息的內(nèi)涵和信息的傳遞 Bioinformatics 2014生命與信息生命與信息 Concept Computers Organisms Instructions Program Genome Bits 0,1 a,c,g,t Stable memory

5、ROM,Disk,tape DNA Active memory RAM RNA Processing CPU/Compiler enzyme/Ribosome Editing Editor tRNA Environment Sockets,people Water,salts,heat I/O AD/DA proteins Monomer Minerals Nucleotide Polymer chip DNA,RNA,protein Replication Cut/Paste DNA replication Sensor/In scanner Chem/photo receptorBioin

6、formatics 2014基因組信息的獲取、處理、貯存、傳遞、分析和解釋蛋白質(zhì)的序列、結(jié)構(gòu)、功能及定位分類、蛋白質(zhì)連鎖圖、蛋白質(zhì)數(shù)據(jù)庫的建立相關分析軟件的開發(fā)和應用新藥研制生物進化二、生物信息的研究范疇二、生物信息的研究范疇Bioinformatics 2014n遺傳信息遺傳信息三、生物信息的內(nèi)涵三、生物信息的內(nèi)涵n與功能相關的結(jié)構(gòu)信息與功能相關的結(jié)構(gòu)信息n進化信息進化信息Bioinformatics 2014Bioinformation From the Nucleus to Protein Machines Bioinformatics 2014基因序列基因序列DNA前體RNAmRNA多

7、肽鏈多肽鏈蛋白質(zhì)序列蛋白質(zhì)序列對對應應關關系系遺遺傳傳密密碼碼Bioinformatics 2014DNA通過復制,在生物體的繁衍過程中傳遞通過復制,在生物體的繁衍過程中傳遞遺傳遺傳信息信息 基因通過轉(zhuǎn)錄和翻譯,使遺傳信息在生物個體中得基因通過轉(zhuǎn)錄和翻譯,使遺傳信息在生物個體中得以表達,并使后代表現(xiàn)出與親代相似的生物性狀以表達,并使后代表現(xiàn)出與親代相似的生物性狀 基因控制著蛋白質(zhì)的合成基因控制著蛋白質(zhì)的合成 DNARNA蛋白蛋白質(zhì)質(zhì)轉(zhuǎn)錄轉(zhuǎn)錄翻譯翻譯?逆轉(zhuǎn)錄逆轉(zhuǎn)錄中心法則中心法則Bioinformatics 2014nDNA本身是否也具有酶活性呢?1994年,GFJoyce等人發(fā)現(xiàn)一個人工合成的

8、DNA分子具有一種特殊的磷酸二酯酶活性。又有多例報道人工合成的DNA序列具有各種不同的酶活性。1995年后從多種生物中提取的DNA均具有酯酶活性,能催化乙酸萘酯水解為萘酚和乙酸。這種較弱的酯酶活性并不需要特定序列的DNA編碼,而是非特異性DNA的一般性質(zhì)。DNA分子本身的酯酶活性作為 “分子化石”遺跡。 n1970年,DBaltimore和HMTemin在致癌的RNA病毒中,發(fā)現(xiàn)依賴RNA的DNA多聚酶,即逆轉(zhuǎn)錄酶。這就是說,遺傳信息流也可以反過來,從RNADNA。巴爾的摩和梯明于1975年榮獲諾貝爾獎。n1981年,TRCech等人在四膜蟲發(fā)現(xiàn)自催化剪切的tRNA。1983年SAltman發(fā)

9、現(xiàn)大腸桿菌的核糖核酸P的催化活性取決于RNA而不是蛋白質(zhì)。這意味著RNA可以不通過蛋白質(zhì)而直接表現(xiàn)出本身的某種遺傳信息,而這種信息并不以核苷酸三聯(lián)體來編碼。這是對中心法則的又一次補充和發(fā)展。切赫和阿爾特曼榮獲1989年的諾貝爾化學獎。中心法則的補充中心法則的補充朊病毒朊病毒蛋白質(zhì)信息傳遞疑問?蛋白質(zhì)信息傳遞疑問?朊病毒病已發(fā)現(xiàn)有4種:庫魯病Ku-rmm、克雅氏綜合癥CJD、格斯特曼綜合癥GSS及致死性家庭性失眠癥FFI。臨床變化都局限于人和動物的中樞神經(jīng)系統(tǒng)。 Bioinformatics 2014DNA分子分子 蛋白質(zhì)分子蛋白質(zhì)分子四、生物信息載體四、生物信息載體Bioinformatics

10、 2014(1)遺傳信息的載體遺傳信息的載體DNA或或RNAn 遺傳信息的載體主要是DNA或RNA分子n 控制生物體性狀的基因是一系列DNA片段n 生物體生長發(fā)育的本質(zhì)就是遺傳信息的傳遞和表達 Bioinformatics 2014(2)遺傳信息的功能載體遺傳信息的功能載體蛋白質(zhì)蛋白質(zhì)n蛋白質(zhì)蛋白質(zhì)功能功能取決于蛋白質(zhì)的空間取決于蛋白質(zhì)的空間結(jié)構(gòu)結(jié)構(gòu) n蛋白質(zhì)結(jié)構(gòu)決定于蛋白質(zhì)的蛋白質(zhì)結(jié)構(gòu)決定于蛋白質(zhì)的序列序列,蛋白質(zhì)結(jié),蛋白質(zhì)結(jié)構(gòu)的信息隱含在蛋白質(zhì)序列之中。構(gòu)的信息隱含在蛋白質(zhì)序列之中。Bioinformatics 2014(3) DNA分子和蛋白質(zhì)分子都含有分子和蛋白質(zhì)分子都含有進化信息進化

11、信息n通過比較相似的蛋白質(zhì)序列相似的蛋白質(zhì)序列,如肌紅蛋白和血紅蛋白,可以發(fā)現(xiàn)由于基因復制而產(chǎn)生的分子進化證據(jù)。n通過比較來自于不同種屬的同源蛋白質(zhì),即直系直系同源蛋白質(zhì)同源蛋白質(zhì),可以分析蛋白質(zhì)甚至種屬之間的系統(tǒng)發(fā)生關系,推測它們共同的祖先蛋白質(zhì)。Bioinformatics 2014n進化信息 通過比較相似的蛋白質(zhì)序列可以發(fā)現(xiàn)基因的分子進化證據(jù)。通過比較來自于不同種屬的同源蛋白質(zhì),即直系同源蛋白質(zhì),可以分析種屬之間的系統(tǒng)發(fā)生關系,推測它們共同的祖先蛋白質(zhì)。Bioinformatics 2014五、生物信息的特征五、生物信息的特征n生物信息數(shù)據(jù)量龐大生物信息數(shù)據(jù)量龐大 n生物信息復雜度高:生

12、物信息復雜度高:遺傳信息,功能結(jié)構(gòu)信息n生物信息之間存在著密切的聯(lián)系生物信息之間存在著密切的聯(lián)系n存在特定載體:存在特定載體:核酸分子和分子和蛋白質(zhì)分子分子n存在不同的層次:存在不同的層次:分子,細胞,組織器官和機體分子,細胞,組織器官和機體Bioinformatics 2014六、六、 生物信息學生物信息學(Bioinformatics)的建立的建立 八十年代末期,林華安博士認識到將計算機科學與生物學結(jié)合起來的重要意義。起初,使用的是CompBio,之后又將其更改為 bioinformatique ;進一步更改為bio-informatics (或bio/informatics)。該名稱中的

13、-或/符號經(jīng)常會引起許多計算機系統(tǒng)問題,于是將其去除, bioinformatics 就正式誕生,林博士也因此贏得了“生物信息學之父”的美譽。 Bioinformatics 2014生物信息學生物信息學(bioinformatics)是80年代未隨著人類基因組計劃(Human genome project, HGP)的啟動而興起的一門新的交叉學科。它涉及生物學、數(shù)學、計算機科學和工程學,依賴于計算機科學、工程學和應用數(shù)學的基礎,依賴于生物實驗和衍生數(shù)據(jù)的大量儲存和加工。 Bioinformatics 2014ComputationInformaticsBiologyBioinformatics

14、學科交叉發(fā)展的需要學科交叉發(fā)展的需要Bioinformatics 2014HGP生物數(shù)據(jù)生物數(shù)據(jù)(每(每15個月翻一番個月翻一番)生物學家生物學家數(shù)學家數(shù)學家計算機計算機科學家科學家生物信息學生物信息學(bioinfomatics)的誕生的誕生大量數(shù)據(jù)處理分析的需要大量數(shù)據(jù)處理分析的需要Bioinformatics 2014生物體系和過程中信息的存貯、生物體系和過程中信息的存貯、傳遞傳遞和表達和表達細胞、組織、器官的生理、病理、細胞、組織、器官的生理、病理、藥理過程的中各種生物信息藥理過程的中各種生物信息信息科學信息科學生生命命科科學學中中的的信信息息科科 學學 醫(yī)學發(fā)展的需要醫(yī)學發(fā)展的需要B

15、ioinformatics 2014 1995年,在人類基因組計劃(HGP)第一個五年總結(jié)報告中給出了一個較為完整較為完整的生物信息學的定義:生信息學是包含生物信息的獲取、處理、貯存、分發(fā)、分析和解釋的所有方面的一門學科,它綜合運用數(shù)學、計算機科學和生物學的各種工具進行研究,目的在于理解生物大分子信息的生物學意義的交叉學科。 Bioinformatics 2014生物信息學研究意義生物信息學研究意義生物信息學將是生物信息學將是21世紀生物學的核心世紀生物學的核心 n認識生物本質(zhì)認識生物本質(zhì)了解生物分子信息的組織和結(jié)構(gòu),破譯基因組信息,闡明生物信息之間的關系對序列、結(jié)構(gòu)數(shù)據(jù)進行定性和定量分析,從

16、中獲取基因編碼、基因調(diào)控、序列-結(jié)構(gòu)-功能關系等理性知識闡明細胞、器官和個體的發(fā)生、發(fā)育、病變、衰亡的基本規(guī)律和時空聯(lián)系探索生命起源、生物進化、生命本質(zhì)等重大理論問題,最終建立“生物學周期表”Bioinformatics 2014 DNA核酸序列核酸序列蛋白質(zhì)蛋白質(zhì)氨基酸序列氨基酸序列蛋白質(zhì)蛋白質(zhì)結(jié)構(gòu)結(jié)構(gòu)蛋白質(zhì)蛋白質(zhì)功能功能最基本的最基本的生物信息生物信息維持生命活維持生命活動的機器動的機器第一部第一部遺傳密碼遺傳密碼第二部第二部遺傳密碼?遺傳密碼?生命體系千姿生命體系千姿百態(tài)的變化百態(tài)的變化生物分子數(shù)據(jù)及其關系生物分子數(shù)據(jù)及其關系Bioinformatics 2014n第一部遺傳密碼已被破譯

17、,但對密碼的轉(zhuǎn)錄過程還不清楚,對大多數(shù)DNA非編碼區(qū)域的功能還知之甚少n 對于第二部密碼,目前則只能用統(tǒng)計學的方法進行分析n無論是第一部遺傳密碼,還是第二部遺傳密碼,都隱藏在大量的生物分子數(shù)據(jù)之中。Bioinformatics 2014n改變生物學的研究方式改變生物學的研究方式 改變傳統(tǒng)研究方式,引進現(xiàn)代信息學方法n在醫(yī)學上的重要意義在醫(yī)學上的重要意義為疾病的診斷和治療提供依據(jù)為設計新藥提供依據(jù)生物分子數(shù)據(jù)是寶藏,生物信息數(shù)據(jù)庫是生物分子數(shù)據(jù)是寶藏,生物信息數(shù)據(jù)庫是金礦,等待我們?nèi)ネ诰蚝屠?。金礦,等待我們?nèi)ネ诰蚝屠?。Bioinformatics 2014第二節(jié)第二節(jié) 生物信息學的建立和發(fā)展

18、生物信息學的建立和發(fā)展 人類基因組計劃簡介人類基因組計劃簡介Bioinformatics 2014生物信息學產(chǎn)生的背景生物信息學產(chǎn)生的背景1、人類基因組計劃的初步完成人類基因組計劃的初步完成 人類基因組計劃工作草圖已完成。人類基因組計劃工作草圖已完成。人類對基因的認識,人類對基因的認識,從以往的單個基因的了解,上升到在整個基因組水平。從以往的單個基因的了解,上升到在整個基因組水平。2、后基因組時代到來、后基因組時代到來 基因組研究已進入全面信息提取和數(shù)據(jù)分析基因組研究已進入全面信息提取和數(shù)據(jù)分析階段,功能階段,功能基因組和蛋白質(zhì)組的大量數(shù)據(jù)已開始涌現(xiàn)?;蚪M和蛋白質(zhì)組的大量數(shù)據(jù)已開始涌現(xiàn)。Bi

19、oinformatics 2014海量生物信息需要分析;海量生物信息需要分析;大量未知基因需要破解其功能大量未知基因需要破解其功能nGenBank中的DNA堿基數(shù)目呈指數(shù)增加。2000年后其數(shù)目已達110億,它們來自47000種生物;UniGene的數(shù)目約達7萬個。n1999年初單核苷酸多態(tài)性(SNP)數(shù)據(jù)庫出現(xiàn)以來,已超過600萬。n自全長1.8Mb的嗜血流感桿菌基因組序列于1995年發(fā)表以來,已有54個模型生物的完整基因組完成了測序,包括9個古細菌、31個原核真細菌、14個真核生物的完整基因組或它們的完整染色體,其中包括釀酒酵母和線蟲。還有另外的70余個微生物基因組正在測試當中。Bioin

20、formatics 2014計算機運算速度計算機運算速度: 18個月增長一倍個月增長一倍; DNA序列數(shù)據(jù)序列數(shù)據(jù): 14個月增長一倍個月增長一倍Bioinformatics 2014n20世紀50年代,生物信息學開始孕育n20世紀60年代,生物分子信息在概念上將計算生物學和計算機科學聯(lián)系起來n20世紀70年代,生物信息學的真正開端n20世紀70年代到80年代初期 ,出現(xiàn)了一系列著名的序列比較方法和生物信息分析方法 n20世紀80年代以后,出現(xiàn)一批生物信息服務機構(gòu)和生物信息數(shù)據(jù)庫n20世紀90年代后 ,HGP促進生物信息學的迅速發(fā)展生物信息學的發(fā)展歷程Bioinformatics 2014生物

21、信息學的發(fā)展歷程n1952年,Sanger根據(jù)胰島素蛋白質(zhì)的測序結(jié)果,推斷蛋白質(zhì)是排列完美的分子。最早的信息論觀點。n1955年,Sanger與合作者分別對牛、豬和羊的胰島素蛋白質(zhì)進行了測序并做了序列上的比較。最早的序列比對。n1962年,鮑林提出分子進化的理論,推測在人中可能存在50,000100,000個不同的基因/蛋白質(zhì)。分子進化理論的奠定。n1965年,Margaret Dayhoff構(gòu)建蛋白質(zhì)序列圖譜n1970年,Needleman-Wunsch算法:全局優(yōu)化比對。n1981年,Smith-Waterman算法開發(fā):局部優(yōu)化比對。n1990年,快速序列相似性搜索工具BLAST的開發(fā)B

22、ioinformatics 2014生物信息學發(fā)展過程中的里程碑性事件生物信息學發(fā)展過程中的里程碑性事件Bioinformatics 2014人類基因組計劃人類基因組計劃 人類基因組計劃(Human Genome Project,HGP)是由美國科學家Renato Dulbecco在1985年首先提出,美國政府1990年10月正式啟動的,耗資30億美元。 目標是構(gòu)建詳細的人類基因組遺傳圖和物理圖,確定人類DNA的全部核苷酸序列,定位約3萬基因,以及人類基因的鑒定和分離的內(nèi)容。人類基因組計劃全部測序工作提前到2000年春季完成“工作框架”,即工作草圖。Bioinformatics 2014曼哈頓

23、原子彈計劃曼哈頓原子彈計劃阿波羅登月計劃阿波羅登月計劃人類基因組計劃人類基因組計劃人類自然科學史上的三大計劃人類自然科學史上的三大計劃Bioinformatics 2014 人類基因組計劃準備用15年時間投入30億美元,完成人全部24(22+X+Y)條染色體中3109個堿基對的序列測定,主要任務包括作圖、測序和基因預測,其根本任務是解讀和破譯生物體的遺傳信息。Bioinformatics 2014Bioinformatics 20141984 猶他州阿爾塔組織會議,研討測定人類整個基因組猶他州阿爾塔組織會議,研討測定人類整個基因組DNA序列的意義序列的意義1985 Dulbecco在在Scie

24、nce撰文撰文 “腫瘤研究的轉(zhuǎn)折點腫瘤研究的轉(zhuǎn)折點:人類基因組的測人類基因組的測序序” ;美國能源部;美國能源部(DOE)提出提出“人類基因組計劃人類基因組計劃”草案草案1987 美國能源部和國家衛(wèi)生研究院(美國能源部和國家衛(wèi)生研究院(NIH)聯(lián)合啟動)聯(lián)合啟動計劃計劃1989 美國成立美國成立“國家人類基因組研究中心國家人類基因組研究中心”,Watson擔任第一任主任擔任第一任主任1990.10 經(jīng)美國國會批準,人類基因組計劃正式啟動經(jīng)美國國會批準,人類基因組計劃正式啟動James WatsonBioinformatics 20141996 完成人類基因組計劃的遺傳作圖完成人類基因組計劃的遺

25、傳作圖1998 完成人類基因組計劃的物理作圖;開始人類基因組的大規(guī)模測序;完成人類基因組計劃的物理作圖;開始人類基因組的大規(guī)模測序;Celera公司加入,與公共領域競爭;啟動水稻基因組計劃公司加入,與公共領域競爭;啟動水稻基因組計劃1999.7 第第5屆國際公共領域人類基因組測序會議,加快測序速度屆國際公共領域人類基因組測序會議,加快測序速度流感嗜血菌流感嗜血菌( (1995) )釀酒酵母釀酒酵母(1997)秀麗線蟲秀麗線蟲(1998)大腸桿菌大腸桿菌 (1998)水稻基因組計水稻基因組計劃劃(2002)Bioinformatics 20142000 Celera公司宣布完成果蠅基因組測序;國

26、際公共領域宣布完成第公司宣布完成果蠅基因組測序;國際公共領域宣布完成第一個植物基因組一個植物基因組擬南芥全基擬南芥全基 因組的測序工作因組的測序工作2001.2.15 Nature刊文發(fā)表人類基因組測序國際公共領域結(jié)果刊文發(fā)表人類基因組測序國際公共領域結(jié)果2001.2.16 Science刊文發(fā)表刊文發(fā)表Celera公司及其合作者結(jié)果公司及其合作者結(jié)果Drosophila melanogaster果蠅果蠅(2000)Arabidopsis thaliana擬南芥擬南芥(2000)Bioinformatics 2014確定人類基因組全部確定人類基因組全部DNA序列;建立序列;建立基因組圖譜基因組

27、圖譜識別基因;識別基因;建立儲存信息的數(shù)據(jù)庫;建立儲存信息的數(shù)據(jù)庫;開發(fā)數(shù)據(jù)分析工具軟件;開發(fā)數(shù)據(jù)分析工具軟件;人類基因組研究的模式生物(細菌、酵母菌、線蟲、人類基因組研究的模式生物(細菌、酵母菌、線蟲、 果蠅、小鼠、擬南介)的基因組果蠅、小鼠、擬南介)的基因組研究研究HGP實施所帶來的倫理、法律和社會問題。實施所帶來的倫理、法律和社會問題。發(fā)展建立生物信息學發(fā)展建立生物信息學 HGP目標目標Bioinformatics 2014遺傳圖譜、物理圖譜、轉(zhuǎn)錄圖譜和序列圖譜遺傳圖譜、物理圖譜、轉(zhuǎn)錄圖譜和序列圖譜n遺傳圖譜是以具有遺傳多態(tài)性的遺傳標記為“路標”,以遺傳學距離為圖距的基因組圖。進行基因識

28、別和基因定位n物理圖譜是指有關基因組中特異性序列排列和間距的信息.建立物理圖譜實際上是為全基因組測序建立“路標”。n轉(zhuǎn)錄圖譜是在識別基因組所包含的蛋白質(zhì)編碼序列的基礎上繪制的結(jié)合有關基因序列、位置及表達模式等信息的圖譜。Bioinformatics 2014基因組學功能基因組學1、信息的整合、信息的整合2、信息的儲存、信息的儲存3、信息的比較、信息的比較4、信息的分析、信息的分析5、信息的分解、信息的分解人類基因組計劃對生物信息學的挑戰(zhàn)人類基因組計劃對生物信息學的挑戰(zhàn)Bioinformatics 20142022-5-30 人類基因組計劃提供了巨量的生物學信息資源。人類基因組計劃提供了巨量的生

29、物學信息資源。 基因組信息的收集、儲存、分發(fā)、分析顯得越來基因組信息的收集、儲存、分發(fā)、分析顯得越來越緊迫和重要,信息的管理和分析成為人類基因組計越緊迫和重要,信息的管理和分析成為人類基因組計劃實施過程中的一項重要工作,人類基因組計劃向信劃實施過程中的一項重要工作,人類基因組計劃向信息學提出了巨大的挑戰(zhàn)。息學提出了巨大的挑戰(zhàn)。 人類基因組計劃一開始就與計算機技術(shù)、信息高人類基因組計劃一開始就與計算機技術(shù)、信息高速公路同步發(fā)展,信息技術(shù)為生物信息學的發(fā)展提供速公路同步發(fā)展,信息技術(shù)為生物信息學的發(fā)展提供了非常好的條件,為生物信息學的研究和應用提供了了非常好的條件,為生物信息學的研究和應用提供了非

30、常好的支撐。非常好的支撐。48Bioinformatics 20142022-5-30 從信息學的角度來看,最重要的任務是利用各種數(shù)從信息學的角度來看,最重要的任務是利用各種數(shù)學模型和人工智能技術(shù),分析現(xiàn)有的基因組數(shù)據(jù),研究學模型和人工智能技術(shù),分析現(xiàn)有的基因組數(shù)據(jù),研究基因組數(shù)據(jù)之間的關系,發(fā)現(xiàn)隱藏在大量數(shù)據(jù)背后的生基因組數(shù)據(jù)之間的關系,發(fā)現(xiàn)隱藏在大量數(shù)據(jù)背后的生物學規(guī)律,解讀生物遺傳密碼,認識生命的本質(zhì)。物學規(guī)律,解讀生物遺傳密碼,認識生命的本質(zhì)。49Bioinformatics 20142022-5-30 如果說生物信息學在人類基因組計劃中的著重點如果說生物信息學在人類基因組計劃中的著重

31、點是基因組序列的話,那么在功能基因組中,生物信息是基因組序列的話,那么在功能基因組中,生物信息學的著重點則是序列的生物學意義,基因組編碼序列學的著重點則是序列的生物學意義,基因組編碼序列的轉(zhuǎn)錄、翻譯的過程和結(jié)果,著重分析基因表達調(diào)控的轉(zhuǎn)錄、翻譯的過程和結(jié)果,著重分析基因表達調(diào)控信息,分析基因及其產(chǎn)物的功能。信息,分析基因及其產(chǎn)物的功能。 在功能基因組時代,應用生物信息學方法,高通在功能基因組時代,應用生物信息學方法,高通量地注釋基因組所有編碼產(chǎn)物的生物學功能是功能基量地注釋基因組所有編碼產(chǎn)物的生物學功能是功能基因組研究的一個重要特征因組研究的一個重要特征。50Bioinformatics 20

32、142022-5-30 生物信息學與人類基因組計劃緊密結(jié)合,互相滲透,生物信息學與人類基因組計劃緊密結(jié)合,互相滲透,生物信息學成為基因組計劃不可分割的一部分。事實證生物信息學成為基因組計劃不可分割的一部分。事實證明,人類基因組計劃在生物信息學的支持下,前進步伐明,人類基因組計劃在生物信息學的支持下,前進步伐大大加快,已經(jīng)提前完成了預期計劃,功能基因組研究大大加快,已經(jīng)提前完成了預期計劃,功能基因組研究也已經(jīng)全面展開。也已經(jīng)全面展開。 而人類基因組計劃反過來又大大促進了生物信息學而人類基因組計劃反過來又大大促進了生物信息學的發(fā)展,的發(fā)展,HGP豐富了生物信息學的研究內(nèi)容,促進生物豐富了生物信息學

33、的研究內(nèi)容,促進生物信息學新思想、新方法的產(chǎn)生,生物信息學在近信息學新思想、新方法的產(chǎn)生,生物信息學在近10年迅年迅速發(fā)展的歷程證明了這一點。速發(fā)展的歷程證明了這一點。51Bioinformatics 2014Bioinformatics 2014第三節(jié)第三節(jié)生物信息學主要研究內(nèi)容生物信息學主要研究內(nèi)容Bioinformatics 2014研究內(nèi)容研究內(nèi)容1 1、生物分子數(shù)據(jù)的收集與管理、生物分子數(shù)據(jù)的收集與管理2 2、數(shù)據(jù)庫搜索及序列比較、數(shù)據(jù)庫搜索及序列比較 3 3、基因組序列分析、基因組序列分析 4 4、基因表達數(shù)據(jù)的分析與處理、基因表達數(shù)據(jù)的分析與處理 5 5、蛋白質(zhì)結(jié)構(gòu)預測、蛋白質(zhì)結(jié)

34、構(gòu)預測Bioinformatics 2014 (序列比對) (蛋白質(zhì)結(jié)構(gòu)預測) (計算機輔助基因識別) (DNA語言) (分子進化和比較基因組學) (序列重疊群裝配) (遺傳密碼的起源) (代謝網(wǎng)絡分析) (基因芯片設計)常見研究領域常見研究領域Bioinformatics 2014研究方向研究方向基因組序列裝配基因組序列裝配基因識別基因識別基因功能預報基因功能預報基因多態(tài)性分析基因多態(tài)性分析基因進化基因進化mRNA結(jié)構(gòu)預測結(jié)構(gòu)預測基因芯片設計基因芯片設計基因芯片數(shù)據(jù)分析基因芯片數(shù)據(jù)分析疾病相關基因分析疾病相關基因分析 蛋白質(zhì)序列分析蛋白質(zhì)序列分析 蛋白質(zhì)家族分類蛋白質(zhì)家族分類 蛋白質(zhì)結(jié)構(gòu)預測

35、蛋白質(zhì)結(jié)構(gòu)預測 蛋白質(zhì)折疊研究蛋白質(zhì)折疊研究 代謝途徑分析代謝途徑分析 轉(zhuǎn)錄調(diào)控機制轉(zhuǎn)錄調(diào)控機制 蛋白質(zhì)芯片設計蛋白質(zhì)芯片設計 蛋白質(zhì)芯片數(shù)據(jù)分析蛋白質(zhì)芯片數(shù)據(jù)分析 藥物設計藥物設計Bioinformatics 2014基因組基因組數(shù)據(jù)庫數(shù)據(jù)庫 蛋白質(zhì)蛋白質(zhì)序列序列數(shù)據(jù)庫數(shù)據(jù)庫 蛋白質(zhì)蛋白質(zhì)結(jié)構(gòu)結(jié)構(gòu)數(shù)據(jù)庫數(shù)據(jù)庫 DDBJEMBLGenBankSWISS-PROT PDBPIR1、 生物分子數(shù)據(jù)的收集與管理生物分子數(shù)據(jù)的收集與管理Bioinformatics 2014各種自動化分子生物學儀器應用上,如DNA測序儀,PCR儀等n實驗過程高度自動化,產(chǎn)生的海量數(shù)據(jù),專門的實驗室數(shù)據(jù)管理系統(tǒng)自動完成包

36、括實驗進程和實驗數(shù)據(jù)的紀錄,常規(guī)數(shù)據(jù)分析,數(shù)據(jù)質(zhì)量檢測和問題的自動查找,常規(guī)的數(shù)據(jù)說明和數(shù)據(jù)輸入數(shù)據(jù)庫。n建立分子生物學數(shù)據(jù)管理系統(tǒng)。 例:高度自動化的實驗數(shù)據(jù)的獲得、加工和整理例:高度自動化的實驗數(shù)據(jù)的獲得、加工和整理Bioinformatics 2014DNA序列片段的測序拼接序列片段的測序拼接n目前DNA自動測序儀每個反應只能測序100-1000bp,傳統(tǒng)測序方法是將克隆進行亞克隆并對亞克隆進行排序。n自動而高速拼接序列的算法,Lander-Waterman模型(Lander ES and Waterman MS,1998)利用鳥槍法進行測序,再將大量隨機測序的片段用計算機進行自動拼接。

37、 1.9Mb Haemophilus influenzae(流感嗜血桿菌流感嗜血桿菌) (1995) 0.58Mb Mycoplasmu genitalium(支原體)(支原體) (1995) 0.58Mb jannaschii(甲烷桿菌)(甲烷桿菌) (1996)n拼接算法需要進一步提高拼接真核基因組的有效性;自動處理自動測序造成的差錯。Bioinformatics 20142、 數(shù)據(jù)庫搜索及序列比較數(shù)據(jù)庫搜索及序列比較 n搜索同源序列在一定程度上就是通過序列比較尋找相似序列 n序列比較的一個基本操作就是比對(Alignment),即將兩個序列的各個字符(代表核苷酸或者氨基酸殘基)按照對應等

38、同或者置換關系進行對比排列,其結(jié)果是兩個序列共有的排列順序,這是序列相似程度的一種定性描述n多重序列比對研究的是多個序列的共性。序列的多重比對可用來搜索基因組序列的功能區(qū)域,也可用于研究一組蛋白質(zhì)之間的進化關系。 Bioinformatics 2014常用序列分析工具常用序列分析工具nCLUSTAL: 已知同源的序列間的配比nFASTA:全基因數(shù)據(jù)庫的快速搜索nPSI-BLAST:非??焖俚娜珨?shù)據(jù)庫搜索nHMM:特定蛋白家族的序列模式識別nPHYLIPS:基因進化樹Bioinformatics 2014序列比較序列比較發(fā)現(xiàn)同源分子發(fā)現(xiàn)同源分子Bioinformatics 20143、 基因組序

39、列分析基因組序列分析 n遺傳語言分析遺傳語言分析n基因組結(jié)構(gòu)分析基因組結(jié)構(gòu)分析n基因識別基因識別n基因功能注釋基因功能注釋n基因調(diào)控信息分析基因調(diào)控信息分析n基因組比較基因組比較Bioinformatics 2014基因識別基因識別n識別基因組編碼區(qū),識別基因結(jié)構(gòu)1、同源比較(DNA序列、EST)2、基因預測(不是用同源搜索的方法來識別基因) 從頭開始基因預測,基于知識的基因預測(密碼子使用,堿基組成,剪切位點特征,PolyA信號,核苷酸頻率,轉(zhuǎn)錄信號,轉(zhuǎn)譯信號,尺寸分布)Bioinformatics 2014基因預測的步驟:1、識別可能的外顯子2、辨別起始/內(nèi)部/終止外顯子3、把外顯子聯(lián)結(jié)起

40、來,形成可能的基因4、確保該可能的基因沒有內(nèi)部的移位或終止密碼子5、leftovers:shadow exons算法: Rule-based system; linguistic system; linear discriminant analysis;decision tree; spliced alignment;fourier analysisBioinformatics 2014Evaluating Gene Predictionn敏感性敏感性(Sensitivity) 敏感性=預測基因中確為基因的數(shù)目/待測序列中的基因數(shù)目; How many exons were correctly

41、 predicted?n特異性特異性(Specifity) 特異性=預測基因中確為基因的數(shù)目/預測基因數(shù)目 How many exon predictions are true?Bioinformatics 2014n生物學家們一直假設,人類擁有生物學家們一直假設,人類擁有8萬到萬到10萬個基因。但萬個基因。但是根據(jù)測序完成的人類基因組第是根據(jù)測序完成的人類基因組第21對、對、22對染色體的經(jīng)對染色體的經(jīng)驗,得出的結(jié)論是整個基因組有不多于驗,得出的結(jié)論是整個基因組有不多于4萬個基因。萬個基因。n比較現(xiàn)有的人類基因序列與淡水河豚基因序列,提出了比較現(xiàn)有的人類基因序列與淡水河豚基因序列,提出了更低

42、的人類基因數(shù)估計:在更低的人類基因數(shù)估計:在27700與與34300之間。之間。n馬里蘭馬里蘭Rockville的基因組研究所的基因組研究所(TIGR)的的John Quackenbush根據(jù)根據(jù)TIGR的人類基因指數(shù)的估計的人類基因指數(shù)的估計118259個個基因?;颉?*生物體的復雜性并不是簡單地與基因數(shù)量相關聯(lián)的。生生物體的復雜性并不是簡單地與基因數(shù)量相關聯(lián)的。生物體的復雜性來自于基因如何被管理或表達的,而不是物體的復雜性來自于基因如何被管理或表達的,而不是基因數(shù)目本身?;驍?shù)目本身。人類基因的數(shù)目爭論!人類基因的數(shù)目爭論!Bioinformatics 2014基因功能預測基因功能預測

43、序列同源比較: 如果基因A與基因 B有相當?shù)耐葱裕敲椿駻可能具有類似基因B的功能。n公共數(shù)據(jù)庫:GenBank,EMBL,DDBJn功能數(shù)據(jù)庫:dbEST, dbSTS, dbGSS(Genome Survey Sequence), dbHTG(high throughput Genomic Sequence,未完成整理的序列數(shù)據(jù))n蛋白質(zhì)序列庫:PIR(protein information resource), Swiss-Prot n蛋白質(zhì)高級結(jié)構(gòu)數(shù)據(jù)庫PDB(protein data bank):生物大分子三級結(jié)構(gòu)的數(shù)據(jù)庫。n同源比較算法:分為整體對齊(Global alignm

44、ent)和局部對齊(local alignment)局部對齊的算法有Smith-Watermann 算法; FASTA算法;BLAST算法Bioinformatics 20144、基因表達數(shù)據(jù)的分析與處理、基因表達數(shù)據(jù)的分析與處理n基因表達數(shù)據(jù)分析是目前生物信息學研究的熱基因表達數(shù)據(jù)分析是目前生物信息學研究的熱 點和重點點和重點 n目前對基因表達數(shù)據(jù)的處理主要是進行聚類分目前對基因表達數(shù)據(jù)的處理主要是進行聚類分 析,將表達模式相似的基因聚為一類,在此基析,將表達模式相似的基因聚為一類,在此基 礎上尋找相關基因,分析基因的功能礎上尋找相關基因,分析基因的功能 n所用方法主要有:所用方法主要有:n

45、相關分析方法相關分析方法n模式識別技術(shù)中的層次式聚類方法模式識別技術(shù)中的層次式聚類方法n人工智能中的自組織映射神經(jīng)網(wǎng)絡人工智能中的自組織映射神經(jīng)網(wǎng)絡n主元分析方法主元分析方法 Bioinformatics 2014基因表達分析和調(diào)控網(wǎng)絡研究基因表達分析和調(diào)控網(wǎng)絡研究n高通量基因轉(zhuǎn)錄實驗技術(shù)高通量基因轉(zhuǎn)錄實驗技術(shù)1、mRNAncDNA microarraynOligonucleotide chipnRT-PCRnSAGE2、proteinn 2D-PAGEBioinformatics 2014Bioinformatics 2014層次式聚類層次式聚類Bioinformatics 2014Bioi

46、nformatics 20145、蛋白質(zhì)結(jié)構(gòu)預測、蛋白質(zhì)結(jié)構(gòu)預測 n蛋白質(zhì)的生物功能由蛋白質(zhì)的結(jié)構(gòu)所決定蛋白質(zhì)的生物功能由蛋白質(zhì)的結(jié)構(gòu)所決定 ,蛋,蛋白質(zhì)結(jié)構(gòu)預測成為了解蛋白質(zhì)功能的重要途徑白質(zhì)結(jié)構(gòu)預測成為了解蛋白質(zhì)功能的重要途徑n蛋白質(zhì)結(jié)構(gòu)預測分為蛋白質(zhì)結(jié)構(gòu)預測分為:n二級結(jié)構(gòu)預測二級結(jié)構(gòu)預測n空間結(jié)構(gòu)預測空間結(jié)構(gòu)預測 蛋白質(zhì)折疊蛋白質(zhì)折疊Bioinformatics 2014二級結(jié)構(gòu)預測二級結(jié)構(gòu)預測n二級結(jié)構(gòu)的預測可以歸結(jié)為模式識別問題二級結(jié)構(gòu)的預測可以歸結(jié)為模式識別問題 n主要方法有:主要方法有:n立體化學方法立體化學方法n圖論方法圖論方法n統(tǒng)計方法統(tǒng)計方法n最鄰近決策方法最鄰近決策方法

47、n基于規(guī)則的專家系統(tǒng)方法基于規(guī)則的專家系統(tǒng)方法n分子動力學方法分子動力學方法n人工神經(jīng)網(wǎng)絡方法人工神經(jīng)網(wǎng)絡方法 n預測準確率超過預測準確率超過70%的第一個軟件是基于神經(jīng)網(wǎng)絡的的第一個軟件是基于神經(jīng)網(wǎng)絡的PHD系統(tǒng)系統(tǒng)Bioinformatics 2014蛋白質(zhì)三級結(jié)構(gòu)預測 n同源模型化方法n遠程同源模型化方法n結(jié)構(gòu)的從頭預測方法n距離幾何n分子動力學 Bioinformatics 2014同源模型化方法同源模型化方法n空間結(jié)構(gòu)預測方面,比較成功的理論方法是空間結(jié)構(gòu)預測方面,比較成功的理論方法是同源模型法同源模型法 n該方法的依據(jù)是:相似序列的蛋白質(zhì)傾向于折疊成相似該方法的依據(jù)是:相似序列的蛋

48、白質(zhì)傾向于折疊成相似的三維空間結(jié)構(gòu),如果具有的三維空間結(jié)構(gòu),如果具有25-30%的等同序列,可以的等同序列,可以假設這兩個蛋白質(zhì)折疊成相似的空間結(jié)構(gòu)假設這兩個蛋白質(zhì)折疊成相似的空間結(jié)構(gòu)n運用同源模型方法,借助于數(shù)據(jù)庫搜索和序列的比對排運用同源模型方法,借助于數(shù)據(jù)庫搜索和序列的比對排列,可以完成所有蛋白質(zhì)列,可以完成所有蛋白質(zhì)10-30%的空間結(jié)構(gòu)預測工作的空間結(jié)構(gòu)預測工作Bioinformatics 2014n可以通過計算(如分子力學、分子動力學可以通過計算(如分子力學、分子動力學等)來進行結(jié)構(gòu)預測等)來進行結(jié)構(gòu)預測n可以通過計算(如分子力學、分子動力學可以通過計算(如分子力學、分子動力學等)

49、來進行結(jié)構(gòu)預測:立體作用等)來進行結(jié)構(gòu)預測:立體作用, 空間堆積,空間堆積,靜電作用,氫鍵,疏水作用靜電作用,氫鍵,疏水作用Bioinformatics 20146 比較基因組比較基因組學學研究研究n研究生命是從哪里起源的?n生命是如何進化的?n遺傳密碼是如何起源的?n估計最小獨立生活的生物至少需要多少基因,這些基因是如何使它們活起來的?n鼠和人的基因組大小相似,基因的數(shù)目類似??墒鞘蠛腿藶槭裁床町惔_如此之大?n不同人種間基因組的差別僅為 0.01%;人猿間差別約為1%。但表型間的差異十分顯著。Bioinformatics 2014生物進化研究1、序列相似性比較。就是將待研究序列與DNA或蛋白

50、質(zhì)序列庫進行比較,用于確定該序列的生物屬性,也就是找出與此序列相似的已知序列是什么。完成這一工作只需要使用兩兩序列比較算法。常用的程序包有BLAST、FASTA等;2、序列同源性分析。是將待研究序列加入到一組與之同源,但來自不同物種的序列中進行多序列同時比較,以確定該序列與其它序列間的同源性大小。這是理論分析方法中最關鍵的一步。完成這一工作必須使用多序列比較算法。常用的程序包有CLUSTAL等;Bioinformatics 20143、構(gòu)建系統(tǒng)進化樹。根據(jù)序列同源性分析的結(jié)果,重建反映物種間進化關系的進化樹。為完成這一工作已發(fā)展了多種軟件包,象PYLIP、MEGA等;4、穩(wěn)定性檢驗。為了檢驗構(gòu)

51、建好的進化樹的可靠性,需要進行統(tǒng)計可靠性檢驗,通常構(gòu)建過程要隨機地進行成百上千次,只有以大概率(70以上)出現(xiàn)的分支點才是可靠的。通用的方法使用 Bootstrap算法,相應的軟件已包括在構(gòu)建系統(tǒng)進化樹所用的軟件包當中。為便于使用者查找表三給出了進化分析相關軟件的因特網(wǎng)地址。Bioinformatics 2014 16S rRNA 通過比較真核細胞通過比較真核細胞 rRNA的核苷酸順序和的核苷酸順序和“真細真細菌菌”、“古細菌古細菌”的的 rRNA核苷酸順序,發(fā)現(xiàn)它們之核苷酸順序,發(fā)現(xiàn)它們之間截然不同,表明真核細胞不是來自原核細胞,而是間截然不同,表明真核細胞不是來自原核細胞,而是遠在原核細胞

52、生成之前,真核細胞就已和原核細胞分遠在原核細胞生成之前,真核細胞就已和原核細胞分開而成獨立的一支,即開而成獨立的一支,即“早真核生物早真核生物”,它才是現(xiàn)代,它才是現(xiàn)代真核生物的始祖真核生物的始祖。Bioinformatics 2014Bioinformatics 2014第四節(jié)第四節(jié) 生物信息學的主要任務生物信息學的主要任務Bioinformatics 2014 當今生物信息學界,注意力集中在基因組、蛋白質(zhì)組、蛋白質(zhì)結(jié)構(gòu)以及與之相結(jié)合的藥物設計上。 Bioinformatics 20141. 基因組基因組 1.1 新基因的發(fā)現(xiàn)新基因的發(fā)現(xiàn) 通過計算分析從EST(Expressed Seque

53、nce Tags)序列庫中拼接出完整的新基因編碼區(qū),也就是通俗所說的“電子克隆電子克隆”; 通過計算分析從基因組DNA序列中確定新基因編碼區(qū),如根據(jù)編碼區(qū)具有的獨特序列特征、根據(jù)編碼區(qū)與非編碼區(qū)在堿基組成上的差異、根據(jù)高維分布的統(tǒng)計方法、根據(jù)神經(jīng)網(wǎng)絡方法、根據(jù)分形方法和根據(jù)密碼學方法等。 Bioinformatics 20141.2 非蛋白編碼區(qū)生物學意義的分析非蛋白編碼區(qū)生物學意義的分析 非蛋白編碼區(qū)約占人類基因組的95%,其生物學意義目前尚不是很清楚,但從演化觀點來看,其中必然蘊含著重要的生物學功能,由于它們并不編碼蛋白,一般認為,它們的生物學功能可能體現(xiàn)在對基因表達的時空調(diào)控上。 Bio

54、informatics 2014對非蛋白編碼區(qū)進行生物學意義分析的策略1 基于已有的已經(jīng)為實驗證實的所有功能已知的DNA元件的序列特征,預測非蛋白編碼區(qū)中可能含有的功能已知的DNA元件,從而預測其可能的生物學功能,并通過實驗進行驗證;2 通過數(shù)理理論直接探索非蛋白編碼區(qū)的新的未知的序列特征,并從理論上預測其可能的信息含義,最后同樣通過實驗驗證。Bioinformatics 20141.3 基因組整體功能及其調(diào)節(jié)網(wǎng)絡的系統(tǒng)把握基因組整體功能及其調(diào)節(jié)網(wǎng)絡的系統(tǒng)把握 研究生命的本質(zhì),僅僅掌握基因組中部分基因的表達調(diào)控是遠遠不夠的,因為生命現(xiàn)象是基因組中所有功能單元相互作用共同制造出來的。基因芯片基因

55、芯片技術(shù)由于可以監(jiān)測基因組在各種時間斷面上的整體轉(zhuǎn)錄表達狀況,因此成為該領域中一項非常重要和關鍵的實驗技術(shù),對該技術(shù)所產(chǎn)生的大量實驗數(shù)據(jù)進行高效分析,從中獲得基因組運轉(zhuǎn)以及調(diào)控的整體系統(tǒng)的機制或者是網(wǎng)絡機制,便成了生物信息學在該領域中首先要解決的問題。 Bioinformatics 20141.4 基因組進化與物種進化基因組進化與物種進化Bioinformatics 2014 僅依靠某些基因或者分子的進化現(xiàn)象,就想闡明物種整體的演化歷史似乎不太可靠。例如,智人與黑猩猩之間有98%-99%的結(jié)構(gòu)基因和蛋白質(zhì)是相同的,然而表型上卻具有如此巨大的差異,這就不能不使我們聯(lián)想到形形色色千差萬別的建筑樓群

56、,它們的外觀如此不同,但基礎的部件組成卻是幾乎一樣的,差別就在于這些基礎部件的組織方式不同,這就提示我們基因組整體組織方式而不僅僅是個別基因在研究物種進化歷史中的重要作用。Bioinformatics 2014 由于基因組是物種所有遺傳信息的儲藏庫,從根本上決定著物種個體的發(fā)育和生理,因此,從基因組整體從基因組整體結(jié)構(gòu)組織和整體功能調(diào)節(jié)網(wǎng)絡方面,結(jié)合相應的生理表結(jié)構(gòu)組織和整體功能調(diào)節(jié)網(wǎng)絡方面,結(jié)合相應的生理表征現(xiàn)象,進行基因組整體的演化研究,將是揭示物種真征現(xiàn)象,進行基因組整體的演化研究,將是揭示物種真實演化歷史的最佳途徑。實演化歷史的最佳途徑。Bioinformatics 20142、蛋白質(zhì)

57、組、蛋白質(zhì)組 Bioinformatics 2014 基因組對生命體的整體控制必須通過它所表達的基因組對生命體的整體控制必須通過它所表達的全部蛋白質(zhì)來執(zhí)行,由于基因芯片技術(shù)只能反映從基全部蛋白質(zhì)來執(zhí)行,由于基因芯片技術(shù)只能反映從基因組到因組到RNA的轉(zhuǎn)錄水平上的表達情況,從的轉(zhuǎn)錄水平上的表達情況,從RNA到蛋白到蛋白質(zhì)還有許多中間環(huán)節(jié)的影響,因此僅憑基因芯片技術(shù)質(zhì)還有許多中間環(huán)節(jié)的影響,因此僅憑基因芯片技術(shù)我們還不能最終掌握生物功能具體執(zhí)行者我們還不能最終掌握生物功能具體執(zhí)行者蛋白質(zhì)蛋白質(zhì)的整體表達狀況。的整體表達狀況。 Bioinformatics 2014 因此,近幾年在發(fā)展基因芯片的同時

58、,人們也發(fā)展了一套研究基因組所有蛋白質(zhì)產(chǎn)物表達情況蛋白質(zhì)組研究技術(shù),從技術(shù)上來講包括二維凝膠電泳技術(shù)二維凝膠電泳技術(shù)和質(zhì)質(zhì)譜譜測序技術(shù)。 通過二維凝膠電泳技術(shù)可以獲得某一時間截面上蛋白質(zhì)組的表達情況,通過質(zhì)譜測序技術(shù)就可以得到所有這些蛋白質(zhì)的序列組成。 重要的就是如何運用生物信息學理論方法去分析所得到的巨量數(shù)據(jù),從中還原出生命運轉(zhuǎn)和調(diào)控的整體系統(tǒng)的分子機制。 Bioinformatics 2014 蛋白質(zhì)的功能是通過其三維高級結(jié)構(gòu)來執(zhí)行的,蛋白質(zhì)三維結(jié)構(gòu)也不一定蛋白質(zhì)三維結(jié)構(gòu)也不一定是靜態(tài)的,在行使功能的是靜態(tài)的,在行使功能的過程中其結(jié)構(gòu)也會相應的過程中其結(jié)構(gòu)也會相應的有所改變有所改變。目前通

59、過諸如X射線晶體結(jié)構(gòu)分析、多維核磁共振(NMR)波譜分析和電子顯微鏡二維晶體三維重構(gòu)(電子晶體學,EC)等物理方法得到蛋白質(zhì)三維結(jié)構(gòu)。3、蛋白質(zhì)結(jié)構(gòu)、蛋白質(zhì)結(jié)構(gòu) Bioinformatics 2014計算機輔助預測的方法:蛋白質(zhì)的折疊類型只有數(shù)百到數(shù)千種,遠遠小于蛋白質(zhì)所具有的自由度數(shù)目,而且蛋白質(zhì)的折疊類型與其氨基酸序列具有相關性,這樣就有可能直接從蛋白質(zhì)的氨基酸序列通過計算機輔助方法預測出蛋白質(zhì)的三維結(jié)構(gòu) 。Bioinformatics 20144、新藥設計、新藥設計 Bioinformatics 2014 近年來隨著結(jié)構(gòu)生物學的發(fā)展,相當數(shù)量的蛋白質(zhì)以及一些核酸、多糖的三維結(jié)構(gòu)獲得精確測

60、定,基于生物大分子結(jié)構(gòu)知識的藥物設計成為當前的熱點。 生物信息學的研究不僅可提供生物大分子空間結(jié)構(gòu)的信息,還能提供電子結(jié)構(gòu)的信息,如能級、表面電荷分布、分子軌道相互作用等以及動力學行為的信息,如生物化學反應中的能量變化、電荷轉(zhuǎn)移、構(gòu)象變化等。理論模擬還可研究包括生物分子及其周圍環(huán)境的復雜體系和生物分子的量子效應。Bioinformatics 2014生物信息學不僅僅是一門科學學科,生物信息學不僅僅是一門科學學科, 它更是一種重要的研究開發(fā)工具它更是一種重要的研究開發(fā)工具 從科學的角度來講,它是一門研究生物和生物相關系從科學的角度來講,它是一門研究生物和生物相關系統(tǒng)中信息內(nèi)容物和信息流向的綜合系統(tǒng)科學,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論