生物信息學介紹課件_第1頁
生物信息學介紹課件_第2頁
生物信息學介紹課件_第3頁
生物信息學介紹課件_第4頁
生物信息學介紹課件_第5頁
已閱讀5頁,還剩35頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

生物信息學介紹生物信息學介紹1生物信息學:存儲、修復、分析、整合生物數(shù)據(jù)的學科分子生物學與信息技術(shù)的結(jié)合體研究材料與結(jié)果:各種生物學數(shù)據(jù)研究工具:網(wǎng)絡、計算機包括生物學和計算兩部分現(xiàn)代生物研究的核心研究方法:傳統(tǒng)生物學:實驗理論現(xiàn)代生物學:理論實驗驗證生物信息學:2基因和生命的關(guān)系:中心法則

基因傳遞遺傳信息(轉(zhuǎn)錄),并由蛋白質(zhì)表達,構(gòu)成有機體,完成生命的功能DNAmRNA蛋白質(zhì)蛋白質(zhì)組(蛋白質(zhì)protein與基因組genome的雜合)一種基因組所表達的全套蛋白質(zhì),即一種細胞至一種生物所表達的全部蛋白質(zhì)蛋白質(zhì)組學:從蛋白質(zhì)組的水平研究認識生命活動的機理和疾病發(fā)生的分子機制人類基因組計劃(HumanGenomePROJECT,HGP)1986年AmericianRenstoDulbecco《Science》闡明人類基因組的全部核苷酸序列,從整體上破譯人類遺傳信息,在分子水平全面認識自我基因和生命的關(guān)系:中心法則3近期任務大規(guī)?;蚪M測序中的信息分析新基因和新SNPS(單核苷酸多態(tài)性)的發(fā)現(xiàn)與鑒定完整基因組的比較研究大規(guī)?;蚬δ鼙磉_譜的分析生物大分子的結(jié)構(gòu)模擬與藥物設計近期任務大規(guī)?;蚪M測序中的信息分析4遠期任務讀懂人類基因組,發(fā)現(xiàn)人類遺傳語言的根本規(guī)律,從而闡明若干生物學中的重大自然哲學問題,像生命的起源與進化等。這一研究的關(guān)鍵和核心是了解非編碼區(qū)非編碼區(qū)信息結(jié)構(gòu)分析遺傳密碼起源和生物進化的研究遠期任務讀懂人類基因組,發(fā)現(xiàn)人類遺傳語言的根本規(guī)律,從而闡明5生物學世紀的重大生物學課題生命是什么:生物系統(tǒng)運作機理的更深入探索基因組中的信息:讀懂ACGT序列氨基酸序列如何編碼蛋白質(zhì)的特性與活性蛋白質(zhì)的結(jié)構(gòu)和功能預測蛋白質(zhì)怎樣實現(xiàn)細胞和有機體的動力學:生命為什么是蛋白質(zhì)的運動方式個體發(fā)育和系統(tǒng)發(fā)育的法則和機理:肌體如何長成、運作、衰老和進化征服疾?。褐饕h(huán)系統(tǒng)疾病、癌癥、病毒源性疾病、遺傳病和衰老保護和利用生物資源,開發(fā)和發(fā)展生物產(chǎn)業(yè):生物學怎樣造福人類生物學世紀的重大生物學課題生命是什么:生物系統(tǒng)運作機理的更深6現(xiàn)在進行的研究序列比對

系列兩兩比對多系列比對基因組數(shù)據(jù)分析

序列拼接:通過計算分析從EST庫拼接出完整的新基因,即“電子克隆”新基因發(fā)現(xiàn):根據(jù)編碼區(qū)具有的序列特征等通過計算分析從DNA序列中確定基因編碼區(qū)序列同源比較:Smith-Waterman算法FASTABLAST算法現(xiàn)在進行的研究序列比對7大規(guī)?;虮磉_譜數(shù)據(jù)分析重復序列分析編碼區(qū)統(tǒng)計特征分析啟動子分析內(nèi)含子/外顯子剪接位點翻譯起始位點和翻譯終止信號tRNA基因識別DNA序列自身編碼特征分析基因組組織結(jié)構(gòu)和信息結(jié)構(gòu)不同物種、不同進化水平的生物的相關(guān)基因之間進行比較

大規(guī)?;虮磉_譜數(shù)據(jù)分析8

蛋白質(zhì)結(jié)構(gòu)和功能的預測分析

蛋白質(zhì)家族保守序列尋找從氨基酸組成辨識蛋白質(zhì)蛋白質(zhì)二級結(jié)構(gòu)預測

蛋白質(zhì)的三維結(jié)構(gòu)蛋白質(zhì)的物理性質(zhì)預測其他特殊局部信息:其它特殊局部結(jié)構(gòu)包括膜蛋白的跨膜螺旋、信號肽、卷曲螺旋(CoiledCoils)等,具有明顯的序列特征和結(jié)構(gòu)特征,也可以用計算方法加以預測蛋白質(zhì)結(jié)構(gòu)和功能的預測分析9cDNA芯片相關(guān)的數(shù)據(jù)管理和分析

實驗室信息管理系統(tǒng)

基因表達公共數(shù)據(jù)庫

分子進化

cDNA芯片相關(guān)的數(shù)據(jù)管理和分析10研究分類序列分析不基于序列的研究生物芯片的基因表達譜分析全基因組關(guān)聯(lián)分析基因調(diào)控網(wǎng)絡的反向工程研究研究分類序列分析11數(shù)據(jù)挖掘技術(shù)在生物信息學的應用異質(zhì)、分布式基因組數(shù)據(jù)的語義綜合DNA序列的相似性查找和比較關(guān)聯(lián)分析:識別基因序列的共發(fā)生性路徑分析:在疾病發(fā)展的不同階段的相關(guān)基因

可視化工具和基因數(shù)據(jù)分析數(shù)據(jù)挖掘技術(shù)在生物信息學的應用異質(zhì)、分布式基因組數(shù)據(jù)的語義綜12KDD2001年BIOKDD的主題就是“生物信息學中的數(shù)據(jù)挖掘”KDD2001年BIOKDD的主題就是“生物信息學中的數(shù)據(jù)挖13現(xiàn)在的工作數(shù)據(jù)挖掘算法在生物信息學研究中的應用數(shù)據(jù)挖掘算法在生物信息學研究中的改進與發(fā)展生物信息學軟件的開發(fā)現(xiàn)在的工作數(shù)據(jù)挖掘算法在生物信息學研究中的應用14基因芯片(microarray)介紹電子技術(shù)與生物技術(shù)的結(jié)合基因組研究中最實用的部分之一Affymetrix公司:1.6cm240萬位點每點1000萬條探針基因芯片(microarray)介紹電子技術(shù)與生物技術(shù)的結(jié)合15基因芯片流程(一)1.實驗設計2.樣品制備(指mRNA或總RNA樣品,包括對照組和實驗組)3.芯片制備(包括PCR,純化,點樣等步驟)4.芯片雜交(將mRNA或總RNA分別進行逆轉(zhuǎn)錄生成cDNA,在此步驟中將對照組和實驗組cDNA分別標記CY3和CY5熒光信號)5.芯片掃描(采用激光掃描儀,分別用532nm和635nm波長激光掃描芯片,對于每張芯片,得到CY3和CY5通道兩幅圖象)基因芯片流程(一)1.實驗設計16基因芯片流程(二)6.圖象處理(采用專門軟件,對圖象進行分析,提取每個點上的數(shù)字信號),得到原始數(shù)據(jù)表。7.數(shù)據(jù)校正和篩選(對cy5或cy3信號進行校正,消除實驗或掃描等各環(huán)節(jié)因素對數(shù)據(jù)的影響,同時利用篩選規(guī)則對數(shù)據(jù)中的“壞點”,“小點”,“低信號點”進行篩選,并作標記。)8.差異表達基因的確定(采用ratio值對差異基因進行判斷,或采用統(tǒng)計方法如線性回歸、主成分分析、調(diào)整P值算法等對差異基因進行統(tǒng)計推斷)9.生物信息學分析(如cluster算法、差異基因的同源性比對,差異基因的相關(guān)文獻檢索等)基因芯片流程(二)6.圖象處理(采用專門軟件,對圖象進行分17基因芯片應用基因表達檢測特異性相關(guān)的基因:差異表達的基因基因功能研究健康狀況的檢測毒理學研究藥物作用機制的研究定位克隆基因突變和多態(tài)性檢測確定重疊群克隆的排序基因芯片應用基因表達檢測18基因芯片產(chǎn)業(yè)化現(xiàn)狀公司:尖端技術(shù)研究和市場化的混合體美國已有二十多家公司我國:首家為聯(lián)合基因集團南方病蟲害基因白血病檢測基因芯片產(chǎn)業(yè)化現(xiàn)狀公司:尖端技術(shù)研究和市場化的混合體19基因芯片分析所用到的算法聚類分類關(guān)聯(lián)分析時間序列分析異常檢測可視化基因芯片分析所用到的算法聚類20生物信息學介紹生物信息學介紹21生物信息學:存儲、修復、分析、整合生物數(shù)據(jù)的學科分子生物學與信息技術(shù)的結(jié)合體研究材料與結(jié)果:各種生物學數(shù)據(jù)研究工具:網(wǎng)絡、計算機包括生物學和計算兩部分現(xiàn)代生物研究的核心研究方法:傳統(tǒng)生物學:實驗理論現(xiàn)代生物學:理論實驗驗證生物信息學:22基因和生命的關(guān)系:中心法則

基因傳遞遺傳信息(轉(zhuǎn)錄),并由蛋白質(zhì)表達,構(gòu)成有機體,完成生命的功能DNAmRNA蛋白質(zhì)蛋白質(zhì)組(蛋白質(zhì)protein與基因組genome的雜合)一種基因組所表達的全套蛋白質(zhì),即一種細胞至一種生物所表達的全部蛋白質(zhì)蛋白質(zhì)組學:從蛋白質(zhì)組的水平研究認識生命活動的機理和疾病發(fā)生的分子機制人類基因組計劃(HumanGenomePROJECT,HGP)1986年AmericianRenstoDulbecco《Science》闡明人類基因組的全部核苷酸序列,從整體上破譯人類遺傳信息,在分子水平全面認識自我基因和生命的關(guān)系:中心法則23近期任務大規(guī)?;蚪M測序中的信息分析新基因和新SNPS(單核苷酸多態(tài)性)的發(fā)現(xiàn)與鑒定完整基因組的比較研究大規(guī)模基因功能表達譜的分析生物大分子的結(jié)構(gòu)模擬與藥物設計近期任務大規(guī)?;蚪M測序中的信息分析24遠期任務讀懂人類基因組,發(fā)現(xiàn)人類遺傳語言的根本規(guī)律,從而闡明若干生物學中的重大自然哲學問題,像生命的起源與進化等。這一研究的關(guān)鍵和核心是了解非編碼區(qū)非編碼區(qū)信息結(jié)構(gòu)分析遺傳密碼起源和生物進化的研究遠期任務讀懂人類基因組,發(fā)現(xiàn)人類遺傳語言的根本規(guī)律,從而闡明25生物學世紀的重大生物學課題生命是什么:生物系統(tǒng)運作機理的更深入探索基因組中的信息:讀懂ACGT序列氨基酸序列如何編碼蛋白質(zhì)的特性與活性蛋白質(zhì)的結(jié)構(gòu)和功能預測蛋白質(zhì)怎樣實現(xiàn)細胞和有機體的動力學:生命為什么是蛋白質(zhì)的運動方式個體發(fā)育和系統(tǒng)發(fā)育的法則和機理:肌體如何長成、運作、衰老和進化征服疾?。褐饕h(huán)系統(tǒng)疾病、癌癥、病毒源性疾病、遺傳病和衰老保護和利用生物資源,開發(fā)和發(fā)展生物產(chǎn)業(yè):生物學怎樣造福人類生物學世紀的重大生物學課題生命是什么:生物系統(tǒng)運作機理的更深26現(xiàn)在進行的研究序列比對

系列兩兩比對多系列比對基因組數(shù)據(jù)分析

序列拼接:通過計算分析從EST庫拼接出完整的新基因,即“電子克隆”新基因發(fā)現(xiàn):根據(jù)編碼區(qū)具有的序列特征等通過計算分析從DNA序列中確定基因編碼區(qū)序列同源比較:Smith-Waterman算法FASTABLAST算法現(xiàn)在進行的研究序列比對27大規(guī)?;虮磉_譜數(shù)據(jù)分析重復序列分析編碼區(qū)統(tǒng)計特征分析啟動子分析內(nèi)含子/外顯子剪接位點翻譯起始位點和翻譯終止信號tRNA基因識別DNA序列自身編碼特征分析基因組組織結(jié)構(gòu)和信息結(jié)構(gòu)不同物種、不同進化水平的生物的相關(guān)基因之間進行比較

大規(guī)?;虮磉_譜數(shù)據(jù)分析28

蛋白質(zhì)結(jié)構(gòu)和功能的預測分析

蛋白質(zhì)家族保守序列尋找從氨基酸組成辨識蛋白質(zhì)蛋白質(zhì)二級結(jié)構(gòu)預測

蛋白質(zhì)的三維結(jié)構(gòu)蛋白質(zhì)的物理性質(zhì)預測其他特殊局部信息:其它特殊局部結(jié)構(gòu)包括膜蛋白的跨膜螺旋、信號肽、卷曲螺旋(CoiledCoils)等,具有明顯的序列特征和結(jié)構(gòu)特征,也可以用計算方法加以預測蛋白質(zhì)結(jié)構(gòu)和功能的預測分析29cDNA芯片相關(guān)的數(shù)據(jù)管理和分析

實驗室信息管理系統(tǒng)

基因表達公共數(shù)據(jù)庫

分子進化

cDNA芯片相關(guān)的數(shù)據(jù)管理和分析30研究分類序列分析不基于序列的研究生物芯片的基因表達譜分析全基因組關(guān)聯(lián)分析基因調(diào)控網(wǎng)絡的反向工程研究研究分類序列分析31數(shù)據(jù)挖掘技術(shù)在生物信息學的應用異質(zhì)、分布式基因組數(shù)據(jù)的語義綜合DNA序列的相似性查找和比較關(guān)聯(lián)分析:識別基因序列的共發(fā)生性路徑分析:在疾病發(fā)展的不同階段的相關(guān)基因

可視化工具和基因數(shù)據(jù)分析數(shù)據(jù)挖掘技術(shù)在生物信息學的應用異質(zhì)、分布式基因組數(shù)據(jù)的語義綜32KDD2001年BIOKDD的主題就是“生物信息學中的數(shù)據(jù)挖掘”KDD2001年BIOKDD的主題就是“生物信息學中的數(shù)據(jù)挖33現(xiàn)在的工作數(shù)據(jù)挖掘算法在生物信息學研究中的應用數(shù)據(jù)挖掘算法在生物信息學研究中的改進與發(fā)展生物信息學軟件的開發(fā)現(xiàn)在的工作數(shù)據(jù)挖掘算法在生物信息學研究中的應用34基因芯片(microarray)介紹電子技術(shù)與生物技術(shù)的結(jié)合基因組研究中最實用的部分之一Affymetrix公司:1.6cm240萬位點每點1000萬條探針基因芯片(microarray)介紹電子技術(shù)與生物技術(shù)的結(jié)合35基因芯片流程(一)1.實驗設計2.樣品制備(指mRNA或總RNA樣品,包括對照組和實驗組)3.芯片制備(包括PCR,純化,點樣等步驟)4.芯片雜交(將mRNA或總RNA分別進行逆轉(zhuǎn)錄生成cDNA,在此步驟中將對照組和實驗組cDNA分別標記CY3和CY5熒光信號)5.芯片掃描(采用激光掃描儀,分別用532nm和635nm波長激光掃描芯片,對于每張芯片,得到CY3和CY5通道兩幅圖象)基因芯片流程(一)1.實驗設計36基因芯片流程(二)6.圖象處理(采用專門軟件,對圖象進行分析,提取每個點上的數(shù)字信號),得到原始數(shù)據(jù)表。7.數(shù)據(jù)校正和篩選(對cy5或cy3信號進行校正,消除實驗或掃描等各環(huán)節(jié)因素對數(shù)據(jù)的影響,同時利用篩選規(guī)則對數(shù)據(jù)中的“壞點”,“小點”,“低信號點”進行篩選,并作標記。)8.差異表達基因的確定(采用ratio值對差異基因進行判斷,或采用統(tǒng)計方法如線性回歸、主成分分析、調(diào)整P值算法等對差異基因進行統(tǒng)計推斷)9.生物信息學分析(如cluster算法、差異基因的同源性比對,差異基因的相關(guān)文獻檢索等)基

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論