生物信息學(xué)在分子診斷中的應(yīng)用_第1頁
生物信息學(xué)在分子診斷中的應(yīng)用_第2頁
生物信息學(xué)在分子診斷中的應(yīng)用_第3頁
生物信息學(xué)在分子診斷中的應(yīng)用_第4頁
生物信息學(xué)在分子診斷中的應(yīng)用_第5頁
已閱讀5頁,還剩69頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、生物信息學(xué)在分子診斷中的應(yīng)用第一節(jié)第一節(jié) 生物信息學(xué)概論生物信息學(xué)概論 生物信息學(xué)的定義生物信息學(xué)的定義 生物信息學(xué)研究的范疇生物信息學(xué)研究的范疇第一節(jié)第一節(jié) 生物信息學(xué)概論生物信息學(xué)概論一、生物信息學(xué)的定義一、生物信息學(xué)的定義生物信息學(xué)是結(jié)合了生物學(xué)和信息技術(shù),利用生物信息學(xué)是結(jié)合了生物學(xué)和信息技術(shù),利用計(jì)算機(jī)和互聯(lián)網(wǎng)技術(shù),分析海量的并且還在快計(jì)算機(jī)和互聯(lián)網(wǎng)技術(shù),分析海量的并且還在快速積累的生物數(shù)據(jù),從中獲取生物科學(xué)新知識(shí)速積累的生物數(shù)據(jù),從中獲取生物科學(xué)新知識(shí)的一門新的交叉科學(xué)。的一門新的交叉科學(xué)。人類基因組計(jì)劃的意義人類基因組計(jì)劃的意義人類基因研究的意義在于它可以人類基因研究的意義在于它

2、可以支持和推動(dòng)生命科學(xué)中支持和推動(dòng)生命科學(xué)中一系列重要的基礎(chǔ)性研究一系列重要的基礎(chǔ)性研究。如基因組遺傳語言的破譯,。如基因組遺傳語言的破譯,基因的結(jié)構(gòu)與功能關(guān)系,生命的起源和進(jìn)化,細(xì)胞發(fā)育、基因的結(jié)構(gòu)與功能關(guān)系,生命的起源和進(jìn)化,細(xì)胞發(fā)育、生 產(chǎn) 、 分 化 的 分 子 機(jī) 理 , 疾 病 發(fā) 生 的 機(jī) 理 等 。生 產(chǎn) 、 分 化 的 分 子 機(jī) 理 , 疾 病 發(fā) 生 的 機(jī) 理 等 。為推動(dòng)醫(yī)學(xué)長足進(jìn)步帶來前所未有的機(jī)遇為推動(dòng)醫(yī)學(xué)長足進(jìn)步帶來前所未有的機(jī)遇,基因診斷、,基因診斷、基因療法和基因藥物的開發(fā),有可能成為未來醫(yī)學(xué)發(fā)展基因療法和基因藥物的開發(fā),有可能成為未來醫(yī)學(xué)發(fā)展的重要分支。

3、的重要分支。人類基因組計(jì)劃的進(jìn)一步成功將人類基因組計(jì)劃的進(jìn)一步成功將促進(jìn)生命科學(xué)與信息科學(xué)促進(jìn)生命科學(xué)與信息科學(xué)、材料科學(xué)的融合、材料科學(xué)的融合,從而帶動(dòng)一批高技術(shù)產(chǎn)業(yè)的發(fā)展,從而帶動(dòng)一批高技術(shù)產(chǎn)業(yè)的發(fā)展第一節(jié)第一節(jié) 生物信息學(xué)概論生物信息學(xué)概論第一節(jié)第一節(jié) 生物信息學(xué)概論生物信息學(xué)概論二、生物信息學(xué)研究的范疇二、生物信息學(xué)研究的范疇第一、各種生物數(shù)據(jù)庫的建立和管理; 第二、研究高效率的統(tǒng)計(jì)工具,分析算法, 發(fā)展方便、快捷的分析程序; 第三、從海量的原始生物數(shù)據(jù)中發(fā)掘新知識(shí)。第二節(jié)第二節(jié) 計(jì)算機(jī)和互聯(lián)網(wǎng)計(jì)算機(jī)和互聯(lián)網(wǎng) 計(jì)算機(jī)常識(shí)和互聯(lián)網(wǎng)計(jì)算機(jī)常識(shí)和互聯(lián)網(wǎng) 常用搜索引擎常用搜索引擎 文件的壓縮和

4、解壓文件的壓縮和解壓 文件和數(shù)據(jù)的傳送文件和數(shù)據(jù)的傳送 編程和語言編程和語言第二節(jié)第二節(jié) 計(jì)算機(jī)和互聯(lián)網(wǎng)計(jì)算機(jī)和互聯(lián)網(wǎng)一、計(jì)算機(jī)常識(shí):硬件和軟件一、計(jì)算機(jī)常識(shí):硬件和軟件計(jì)算機(jī)的主要硬件由中央處理器(CPU)、存儲(chǔ)器、輸入設(shè)備和輸出設(shè)備組成。 常用的操作系統(tǒng):windows 、UNIX 、Linux 第二節(jié)第二節(jié) 計(jì)算機(jī)和互聯(lián)網(wǎng)計(jì)算機(jī)和互聯(lián)網(wǎng)二、互聯(lián)網(wǎng)和常用搜索引擎二、互聯(lián)網(wǎng)和常用搜索引擎WWW是World Wide Web的縮寫,即通常我們所說的國際互聯(lián)網(wǎng),它的每個(gè)節(jié)點(diǎn)在邏輯上都與任何其他節(jié)點(diǎn)保持聯(lián)系,可以相互交換信息。第二節(jié)第二節(jié) 計(jì)算機(jī)和互聯(lián)網(wǎng)計(jì)算機(jī)和互聯(lián)網(wǎng)二、互聯(lián)網(wǎng)和常用搜索引擎二、互

5、聯(lián)網(wǎng)和常用搜索引擎名稱名稱地址地址特色特色Googlewww.G宜于查詢名詞術(shù)語和專業(yè)網(wǎng)站O宜于查詢名詞術(shù)語和專業(yè)網(wǎng)站Y可按分類搜索S可按分類搜索S可按分類搜索可按分類搜索第二節(jié)第二節(jié) 計(jì)算機(jī)和互聯(lián)網(wǎng)計(jì)算機(jī)和互聯(lián)網(wǎng)三、文件的壓縮和解壓三、文件的壓縮和解壓傳輸或保存較大的數(shù)據(jù)時(shí),常對(duì)文件進(jìn)行壓縮,以減少數(shù)據(jù)量。特別是對(duì)于圖形文件,壓縮尤其重要。在UNIX或Linux系統(tǒng)中,壓縮命令是compress myfile,壓縮后的文件自動(dòng)加上后綴.Z。解壓縮命令是uncompress myfile.Z。 PC機(jī)上的Windows操作系統(tǒng)沒有標(biāo)準(zhǔn)的壓縮和解壓軟件,但網(wǎng)上有許多針對(duì)Windows的免費(fèi)或代免

6、費(fèi)試用期的壓縮軟件,如FreeZip、WinZip等 第二節(jié)第二節(jié) 計(jì)算機(jī)和互聯(lián)網(wǎng)計(jì)算機(jī)和互聯(lián)網(wǎng)四、文件和數(shù)據(jù)的傳送四、文件和數(shù)據(jù)的傳送用戶需要遞交一條或多條核酸或蛋白質(zhì)序列去做數(shù)據(jù)庫查詢或比對(duì)。用戶需要遞交一條或多條核酸或蛋白質(zhì)序列去做數(shù)據(jù)庫查詢或比對(duì)。這時(shí)常用的方法有:這時(shí)常用的方法有:1. 使用視窗系統(tǒng)的剪切、復(fù)制和粘貼的功能使用視窗系統(tǒng)的剪切、復(fù)制和粘貼的功能.對(duì)于不太長的序列,這對(duì)于不太長的序列,這 種方法比較方便;種方法比較方便;2. 網(wǎng)頁的輸入窗口旁常有一個(gè)網(wǎng)頁的輸入窗口旁常有一個(gè)“瀏覽目錄瀏覽目錄”按鈕,點(diǎn)擊該按鈕,會(huì)彈按鈕,點(diǎn)擊該按鈕,會(huì)彈 出一個(gè)對(duì)話框,找到需要上傳的序列文

7、件,再按出一個(gè)對(duì)話框,找到需要上傳的序列文件,再按“提交提交”鈕完成遞鈕完成遞 交。用這種方法可以一次遞交較長的序列;交。用這種方法可以一次遞交較長的序列;3. 有些大型信息中心和研究單位還有遠(yuǎn)程文件傳送服務(wù),即遵從文件有些大型信息中心和研究單位還有遠(yuǎn)程文件傳送服務(wù),即遵從文件 傳輸協(xié)議傳輸協(xié)議 (file transfer protocol,ftp)的服務(wù)器地址,用戶可以無記的服務(wù)器地址,用戶可以無記 名的方式訪問公用的目錄,讀取文件,下載軟件或數(shù)據(jù)。名的方式訪問公用的目錄,讀取文件,下載軟件或數(shù)據(jù)。第二節(jié)第二節(jié) 計(jì)算機(jī)和互聯(lián)網(wǎng)計(jì)算機(jī)和互聯(lián)網(wǎng)五、編程和語言五、編程和語言 在眾多的計(jì)算機(jī)語言中

8、,在眾多的計(jì)算機(jī)語言中,C語言無疑是最常用的,它具有語言無疑是最常用的,它具有 代碼精煉,執(zhí)行效率高的特點(diǎn),網(wǎng)上還有大量的現(xiàn)成模塊代碼精煉,執(zhí)行效率高的特點(diǎn),網(wǎng)上還有大量的現(xiàn)成模塊 供免費(fèi)使用。供免費(fèi)使用。 對(duì)于非計(jì)算機(jī)專業(yè)人員,還可以選擇對(duì)于非計(jì)算機(jī)專業(yè)人員,還可以選擇Visual BASIC(VB) 語言。語言。VB語言具備了高級(jí)語言的特點(diǎn),語句結(jié)構(gòu)類似自然語言具備了高級(jí)語言的特點(diǎn),語句結(jié)構(gòu)類似自然 語言,對(duì)于生物背景的專業(yè)人員可能較容易掌握。語言,對(duì)于生物背景的專業(yè)人員可能較容易掌握。 如果在研究中大量使用網(wǎng)絡(luò)資源,則需要掌握一定的網(wǎng)絡(luò)如果在研究中大量使用網(wǎng)絡(luò)資源,則需要掌握一定的網(wǎng)絡(luò)

9、編程語言,例如:編程語言,例如:Perl語言、語言、PHP語言和語言和JAVA語言等語言等 第三節(jié)第三節(jié) 數(shù)據(jù)的獲得數(shù)據(jù)的獲得 DNA、RNA、蛋白質(zhì)的測序、蛋白質(zhì)的測序 蛋白質(zhì)結(jié)構(gòu)的分析蛋白質(zhì)結(jié)構(gòu)的分析 基因和蛋白質(zhì)的表達(dá)數(shù)據(jù)基因和蛋白質(zhì)的表達(dá)數(shù)據(jù) 蛋白質(zhì)相互作用蛋白質(zhì)相互作用第三節(jié)第三節(jié) 數(shù)據(jù)的獲得數(shù)據(jù)的獲得一、一、DNA、RNA和蛋白質(zhì)的測序和蛋白質(zhì)的測序基因組基因組DNA直接來源于細(xì)胞核基因組,它的組成包括直接來源于細(xì)胞核基因組,它的組成包括 基因和基因間區(qū)域,基因序列中還包括內(nèi)含子和外顯子?;蚝突蜷g區(qū)域,基因序列中還包括內(nèi)含子和外顯子。cDNA是由是由mRNA逆轉(zhuǎn)錄而來,全長逆轉(zhuǎn)

10、錄而來,全長cDNA應(yīng)該包括應(yīng)該包括5端端 非編碼區(qū),非編碼區(qū),3 端的多聚腺苷酸序列和編碼序列。端的多聚腺苷酸序列和編碼序列。重組重組DNA序列序列是基因重組到質(zhì)粒、病毒和是基因重組到質(zhì)粒、病毒和cosmid等載體等載體 后經(jīng)測序得到的后經(jīng)測序得到的DNA序列。序列。2009-4-282009-4-28第三節(jié)第三節(jié) 數(shù)據(jù)的獲得數(shù)據(jù)的獲得一、一、DNA、RNA和蛋白質(zhì)的測序和蛋白質(zhì)的測序2009-4-28C CTGGTTCTG10A T TAC TGTT A20A T GT T G C T A C30TA C TGC TG A C40AAT G C T G C TG50C TG C T T C

11、T C C60T CA C TG T C T C70CA C T T C C T TG80A A CA ATG CG C90CG T CA TG C T T100C T T T T G C C T C110CCG C TG C T C C120C120A G A A A G C TA G130G C C GC AG A T C140A G A A C CA C CA150C A G T CA A T A T160CA C CA C CT T C170CT C T TA T A G A180T T C G G A A T CT190CA T G A T A G G G200G C T CA G

12、C C T C210TG T G C GA G T G220G A G A G A A G T T230T G CA G G C GA G240C TG AAG G A G CA250A T TG CA G G T G260A TA T GA T G T G270C T CG G C T CA A280G A A G C GG G C C290CG G A G A GG A A300G A A G T CG T G C310C GG G G C TAA T320TA T T G G CA A A330A C GA G C T C T T340G T T GT AA A CA350T T G A

13、 T C CA A C360TG G A A T G T CA370CC TA A T G G C GA380A T CA A T A T T C390CA T A A G G CA T400G A T G G T T G C T410CA G A G G CA G G420A G A A G A G CA A430C GA A T A C GA T440C C TA TA A A A G450A T A A A A CA T A460A A TA A A CA G T470CT T G A T TA TA480T T C T G G G TA T490TA A A G C CCA CA500

14、A T CA G A A CA A510A TA T A T G C T T520TG T A T C T T T T530C T T G C C T T C T540T CA T T A C CA A550C T G C T T CC G C560G G C CA CA T TA570A G A G A A C T T G580T G G T A A G A TA590A G A A G A T A T T600T T A T T CG T T C610T G C T GA C T TG620CLane 2Points 2385 to 18997 Base 1: 2385Spacing: 2

15、0.00第三節(jié)第三節(jié) 數(shù)據(jù)的獲得數(shù)據(jù)的獲得一、一、DNA、RNA和蛋白質(zhì)的測序和蛋白質(zhì)的測序2009-4-28第三節(jié)第三節(jié) 數(shù)據(jù)的獲得數(shù)據(jù)的獲得一、一、DNA、RNA和蛋白質(zhì)的測序和蛋白質(zhì)的測序 RNA的序列可以從基因組序列或cDNA序列推導(dǎo)出來;直接 的RNA測序涉及修飾核苷酸的識(shí)別,可通過質(zhì)譜分析獲得。 蛋白質(zhì)的序列可以通過DNA序列推導(dǎo)而來,但從DNA序列 推導(dǎo)的蛋白質(zhì)序列不能反應(yīng)真實(shí)的蛋白質(zhì)序列情況,蛋白質(zhì) 測序主要依靠質(zhì)譜分析(mass spectrometry, MS)技術(shù),基本原 理是通過準(zhǔn)確測定真空中的離子質(zhì)量或電荷量來測算出分 子組成。2009-4-28第三節(jié)第三節(jié) 數(shù)據(jù)的獲

16、得數(shù)據(jù)的獲得二、蛋白結(jié)構(gòu)的分析二、蛋白結(jié)構(gòu)的分析X射線晶體學(xué)技術(shù):射線晶體學(xué)技術(shù):通過研究通過研究X射線對(duì)射線對(duì)蛋白質(zhì)晶體蛋白質(zhì)晶體的掃描后的掃描后產(chǎn)生的衍射模式來測定蛋白質(zhì)的結(jié)構(gòu);產(chǎn)生的衍射模式來測定蛋白質(zhì)的結(jié)構(gòu); 核磁共振譜法核磁共振譜法(NMR) spectroscopy):該方法常用于較小該方法常用于較?。?5kDa)的,可溶性蛋白質(zhì)結(jié)構(gòu)的測定;)的,可溶性蛋白質(zhì)結(jié)構(gòu)的測定; 有些蛋白質(zhì)很難結(jié)晶,不能用有些蛋白質(zhì)很難結(jié)晶,不能用X射線晶體學(xué)技術(shù)測定,又太射線晶體學(xué)技術(shù)測定,又太大而不能用核磁共振譜技術(shù)測定,大而不能用核磁共振譜技術(shù)測定,其它技術(shù)方法其它技術(shù)方法:X射線纖維衍射技術(shù);電子

17、顯微鏡射線纖維衍射技術(shù);電子顯微鏡(electron microscopy);環(huán)形雙色色譜技術(shù)環(huán)形雙色色譜技術(shù)(circular dichroism (CD) spectroscopy)2009-4-28第三節(jié)第三節(jié) 數(shù)據(jù)的獲得數(shù)據(jù)的獲得三、基因和蛋白質(zhì)表達(dá)數(shù)據(jù)三、基因和蛋白質(zhì)表達(dá)數(shù)據(jù) 表達(dá)文庫的測序表達(dá)文庫的測序 基因表達(dá)連續(xù)分析技術(shù)基因表達(dá)連續(xù)分析技術(shù)(serial analysis of gene expression, SAGE) DNA芯片芯片 雙向電泳分析技術(shù)(雙向電泳分析技術(shù)(2D gel electrophoresis) 2009-4-28基因表達(dá)連續(xù)分析技術(shù)原理基因表達(dá)連續(xù)分

18、析技術(shù)原理第三節(jié)第三節(jié) 數(shù)據(jù)的獲得數(shù)據(jù)的獲得三、基因和蛋白質(zhì)表達(dá)數(shù)據(jù)三、基因和蛋白質(zhì)表達(dá)數(shù)據(jù)雙向電泳分析技術(shù)原理雙向電泳分析技術(shù)原理: 1個(gè)方向是個(gè)方向是SDS-聚丙烯酰胺凝膠聚丙烯酰胺凝膠 主要是把蛋白質(zhì)主要是把蛋白質(zhì)按照按照 分子量分開分子量分開 ; 1個(gè)方向是等點(diǎn)聚焦個(gè)方向是等點(diǎn)聚焦 把蛋白質(zhì)按照等電點(diǎn)的不同把蛋白質(zhì)按照等電點(diǎn)的不同分開分開 ,這樣就可以把不同的蛋白質(zhì)盡可能的分開,這樣就可以把不同的蛋白質(zhì)盡可能的分開 。2009-4-28第三節(jié)第三節(jié) 數(shù)據(jù)的獲得數(shù)據(jù)的獲得四、蛋白質(zhì)相互作用四、蛋白質(zhì)相互作用1、遺傳學(xué)方法:、遺傳學(xué)方法: 2、親和性方法:、親和性方法: 親和色譜法(親和色

19、譜法(Affinity chromatography) 免疫共沉淀法免疫共沉淀法(coimmunoprecipitation) 免疫共沉淀基本原理免疫共沉淀基本原理: 細(xì)胞裂解液中加入抗體,與抗原形成特異免疫復(fù)合物,細(xì)胞裂解液中加入抗體,與抗原形成特異免疫復(fù)合物, 經(jīng)過洗脫,收集免疫復(fù)合物,然后進(jìn)行經(jīng)過洗脫,收集免疫復(fù)合物,然后進(jìn)行SDS-PAGE及及 Western blotting分析。分析。2009-4-283、分子和原子法:、分子和原子法:X射線晶體法和核磁共振法射線晶體法和核磁共振法 4、基于文庫法:、基于文庫法: 酵母雙雜交系統(tǒng)(酵母雙雜交系統(tǒng)(yeast two-hybrid (

20、Y2H)system) 第三節(jié)第三節(jié) 數(shù)據(jù)的獲得數(shù)據(jù)的獲得四、蛋白質(zhì)相互作用四、蛋白質(zhì)相互作用酵母雙雜交系統(tǒng)的建立得力于對(duì)真核細(xì)胞調(diào)控轉(zhuǎn)錄起始過程的認(rèn)識(shí)。研究發(fā)現(xiàn),許多真核生物的轉(zhuǎn)錄激活因子都是由兩個(gè)可以分開的、功能上相互獨(dú)立的結(jié)構(gòu)域(domain)組成的。例如,酵母的轉(zhuǎn)錄激活因子GAL4,在N端有一個(gè)由147個(gè)氨基酸組成的DNA結(jié)合域結(jié)合域(DNA binding domain,BD),C端有一個(gè)由113個(gè)氨基酸組成的轉(zhuǎn)錄激活域轉(zhuǎn)錄激活域(transcription activation domain,AD)。當(dāng)GAL4分子的DNA結(jié)合域和上游激活序列(upstream activating

21、 sequence,UAS)結(jié)合,轉(zhuǎn)錄激活域則能激活UAS下游的基因進(jìn)行轉(zhuǎn)錄。但是,單獨(dú)的DNA結(jié)合域不能激活基因轉(zhuǎn)錄,單獨(dú)的轉(zhuǎn)錄激活域也不能激活UAS的下游基因,它們之間只有通過某種方式結(jié)合在一起才具有完整的轉(zhuǎn)錄激活因子的功能。 2009-4-28XYX轉(zhuǎn)化到轉(zhuǎn)化到Y(jié)文庫中文庫中 重要生物信息中心重要生物信息中心 數(shù)據(jù)庫檢索工具數(shù)據(jù)庫檢索工具第四節(jié)第四節(jié) 生物信息數(shù)據(jù)庫生物信息數(shù)據(jù)庫2009-4-28第四節(jié)第四節(jié) 生物信息數(shù)據(jù)庫生物信息數(shù)據(jù)庫一、重要生物信息中心一、重要生物信息中心 美國國家信息中心美國國家信息中心 (National Center of Biotechnology Info

22、rmation, NCBI)的的GenBank (http:/ / /web/GenBank/index.html); 歐洲分子生物學(xué)室驗(yàn)室歐洲分子生物學(xué)室驗(yàn)室(European Molecular Biology Laboratory-European Bioinformatics Institute, EMBL-EBI) 的的EMBL (http:/ www.ebi.ac.uk/databases/index.html); 日本日本 DNA數(shù)據(jù)庫數(shù)據(jù)庫 (DNA Data Bank of Japan, DDBJ) (http:/ / www.ddbj

23、.nig.ac.jp/ ) 2009-4-28第四節(jié)第四節(jié) 生物信息數(shù)據(jù)庫生物信息數(shù)據(jù)庫一、重要生物信息中心一、重要生物信息中心 最重要的蛋白質(zhì)氨基酸序列數(shù)據(jù)庫是瑞士的最重要的蛋白質(zhì)氨基酸序列數(shù)據(jù)庫是瑞士的SWISS- PROT (/sprot/); 蛋白質(zhì)數(shù)據(jù)庫蛋白質(zhì)數(shù)據(jù)庫PIR(Protein Information Resource),包含包含 所有序列已知的自然界中野生型蛋所有序列已知的自然界中野生型蛋 白質(zhì)的信息白質(zhì)的信息 (); PDB蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫:收集由蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫:收集由X射線衍射和核

24、磁共振射線衍射和核磁共振 技術(shù)測定的蛋白質(zhì)大分子三維結(jié)構(gòu)技術(shù)測定的蛋白質(zhì)大分子三維結(jié)構(gòu)(/pdb)。第四節(jié)第四節(jié) 生物信息數(shù)據(jù)庫生物信息數(shù)據(jù)庫二、數(shù)據(jù)庫檢索工具二、數(shù)據(jù)庫檢索工具 Entrez檢索工具:檢索工具:Entrez是美國國家生物技術(shù)信息中心是美國國家生物技術(shù)信息中心(NCBI)提供的集成檢索工具)提供的集成檢索工具 /Entrez/ SRS(Sequence Retrieval System)檢索工具:是歐洲)檢索工具:是歐洲 分子生物學(xué)網(wǎng)分子生物學(xué)網(wǎng)EMBnet的主要數(shù)據(jù)庫檢索工具,可以從的主要

25、數(shù)據(jù)庫檢索工具,可以從 EMBnet的主頁進(jìn)入。的主頁進(jìn)入。 DBGET/LinkDB檢索工具:是日本京都工具大學(xué)建立的檢索工具:是日本京都工具大學(xué)建立的 GenomeNet數(shù)據(jù)庫,該數(shù)據(jù)庫主要針對(duì)代謝途徑。數(shù)據(jù)庫,該數(shù)據(jù)庫主要針對(duì)代謝途徑。 http:/www.genome.ad.jp/dbget/dbget_manual.html。第四節(jié)第四節(jié) 生物信息數(shù)據(jù)庫生物信息數(shù)據(jù)庫二、數(shù)據(jù)庫檢索工具二、數(shù)據(jù)庫檢索工具圖圖16-1: NCBI網(wǎng)頁的網(wǎng)頁的Entrez界面界面第五節(jié)第五節(jié) 核酸序列分析核酸序列分析 核酸序列的基本分析核酸序列的基本分析 核酸序列的比對(duì)分析和功能預(yù)測核酸序列的比對(duì)分析和功

26、能預(yù)測 開放閱讀框的分析開放閱讀框的分析 引物設(shè)計(jì)引物設(shè)計(jì) 向數(shù)據(jù)庫提交序列向數(shù)據(jù)庫提交序列第五節(jié)第五節(jié) 核酸序列分析核酸序列分析一、核酸序列的基本分析一、核酸序列的基本分析 核酸序列的分子量、堿基組成、堿基分布等基本分析:核酸序列的分子量、堿基組成、堿基分布等基本分析: BioEdit (/BioEdit/bioedit.html) DNAMAN (http:/ 限制性酶切分析限制性酶切分析 :限制性酶數(shù)據(jù)庫:限制性酶數(shù)據(jù)庫(Restriction Enzyme DataBase,REBASE) (http:/ ; http:/ 測序峰圖的查看、

27、核實(shí)與修改測序峰圖的查看、核實(shí)與修改 :Chromas,BioEdit,DNAMAN 測序結(jié)果需要識(shí)別與去除測序時(shí)使用的載體序列測序結(jié)果需要識(shí)別與去除測序時(shí)使用的載體序列 : VecScreen ( /VecScreen.html) 第五節(jié)第五節(jié) 核酸序列分析核酸序列分析一、核酸序列的基本分析一、核酸序列的基本分析EST序列進(jìn)行電子延伸序列進(jìn)行電子延伸 : 將待分析的核酸序列(稱為種子序列)采用Blast軟件 搜索GenBank的EST數(shù)據(jù)庫,獲得與種子序列有較高 同源性的EST序列,一般要求在重疊40個(gè)堿基范圍內(nèi) 有95以上的同源性,稱匹配

28、序列; 將匹配序列與種子序列裝配成新序列,即片段重疊 群分析(contig analysis); 再以新產(chǎn)生的序列為種子序列,重復(fù)上述過程,直 至沒有新的匹配序列為止。 EST序列進(jìn)行電子延伸序列進(jìn)行電子延伸種子序列種子序列第五節(jié)第五節(jié) 核酸序列分析核酸序列分析一、核酸序列的基本分析一、核酸序列的基本分析對(duì)核酸序列進(jìn)行電子基因定位對(duì)核酸序列進(jìn)行電子基因定位 :利用序列標(biāo)簽位點(diǎn)利用序列標(biāo)簽位點(diǎn)(Sequence Tagged Site, STS); 利用利用UniGene數(shù)據(jù)庫進(jìn)行基因電子定位數(shù)據(jù)庫進(jìn)行基因電子定位; 直接利用基因組序列進(jìn)行基因電子定位。直接利用基因組序列進(jìn)行基因電子定位。 NC

29、BI網(wǎng)頁的網(wǎng)頁的Map Viewer界面界面程序名稱查詢序列搜索的數(shù)據(jù)庫BLASTN核酸核酸BLASTP蛋白質(zhì)蛋白質(zhì)BLASTX核酸的六讀框蛋白質(zhì)TBLASTN蛋白質(zhì)核酸的6個(gè)讀框TBLASTX核酸的6個(gè)讀框核酸的6個(gè)讀框第五節(jié)第五節(jié) 核酸序列分析核酸序列分析二、核酸序列的比對(duì)分析和功能預(yù)測二、核酸序列的比對(duì)分析和功能預(yù)測BLAST (Basic Local Alignment Search Tool)是)是基本局域聯(lián)配搜索工具;基本局域聯(lián)配搜索工具;Blast 功能有:功能有:NCBI網(wǎng)頁的網(wǎng)頁的BLAST界面界面NCBI網(wǎng)頁的網(wǎng)頁的BLAST2 SEQUENCES界面界面第五節(jié)第五節(jié) 核酸

30、序列分析核酸序列分析二、核酸序列的比對(duì)分析和功能預(yù)測二、核酸序列的比對(duì)分析和功能預(yù)測 FASTA:根據(jù)用戶提交的單個(gè)序列進(jìn)行:根據(jù)用戶提交的單個(gè)序列進(jìn)行 數(shù)據(jù)庫搜索比對(duì)的程序。數(shù)據(jù)庫搜索比對(duì)的程序。 網(wǎng)上服務(wù)器和電子郵件服務(wù):網(wǎng)上服務(wù)器和電子郵件服務(wù): http:/www.ebi.ac.uk/ mailto: fastaebi.ac.uk http:/www.fasta.genome.ad.jp mailto: fastanig.ac.jp第五節(jié)第五節(jié) 核酸序列分析核酸序列分析二、核酸序列的比對(duì)分析和功能預(yù)測二、核酸序列的比對(duì)分析和功能預(yù)測進(jìn)行多序列聯(lián)配進(jìn)行多序列聯(lián)配 :ClustalW: h

31、ttp:/www.ebi.ac.uk/clustalw/index.html, /soft/molbio/align/clustal/, ftp:/ftp.ebi.ac.uk/pub/software/dos/clustalw。ClustalX: CluastalW程序的程序的UNIX版本,它使用版本,它使用X窗口圖形界面,窗口圖形界面, ftp:/ftp.ebi.ac.uk/pub/software ftp:/ftp-igbmc.u-strassbg.fr/pub/clustalX。對(duì)聯(lián)配結(jié)果進(jìn)一步編輯,形成適于發(fā)表的形式,可用的軟件有:

32、對(duì)聯(lián)配結(jié)果進(jìn)一步編輯,形成適于發(fā)表的形式,可用的軟件有:SeaView: ftp:/biom3.univ-lyon1.frBOXSHADE: /software/box_form.html)CINEMA: http:/www.bioinf.man.ac.uk/dbbrowser/cinema2.1/cinema2hdr.html第五節(jié)第五節(jié) 核酸序列分析核酸序列分析三、開讀框的分析三、開讀框的分析GT-AG法則法則:外顯子與內(nèi)含子之間的連接區(qū)序列高度保守,如大部分內(nèi)含子5端起始的兩個(gè)堿基是GT,3端最后兩個(gè)堿基是AG。 基因識(shí)別軟件,常用的有:OR

33、F Finder (/gorf/gorf.html )GRAIL (/grainbin/ )GeneFinder (http:/genomic.sanger.ac.uk )Glimmer (/labs/compbio/glimmer.html/ )GenScan (/genscan.html )GeneLang (/genlang/)用用GeneFinde進(jìn)行開放閱讀框分析進(jìn)行

34、開放閱讀框分析用用GeneFinde進(jìn)行開放閱讀框分析進(jìn)行開放閱讀框分析第五節(jié)第五節(jié) 核酸序列分析核酸序列分析四、引物設(shè)計(jì)四、引物設(shè)計(jì)Primer Premier軟件軟件:http:/ Primer3軟件軟件:/cgi-bin/primer/primer3Oligo、Vector NT、Omiga等等第五節(jié)第五節(jié) 核酸序列分析核酸序列分析五、向數(shù)據(jù)庫提交核酸序列五、向數(shù)據(jù)庫提交核酸序列 向向EMBL提交數(shù)據(jù)的網(wǎng)絡(luò)表格可參見:提交數(shù)據(jù)的網(wǎng)絡(luò)表格可參見: http:/www.ebi.ac.uk/subs/emblsubs.tml 向向GenBa

35、nk數(shù)據(jù)庫提交核酸序列可聯(lián)網(wǎng)進(jìn)行數(shù)據(jù)庫提交核酸序列可聯(lián)網(wǎng)進(jìn)行 /GenBank/index.html 也可用也可用Sequin軟件制作好序列提交文件,向軟件制作好序列提交文件,向NCBI 發(fā)送發(fā)送E-mail()提交提交 第六節(jié)第六節(jié) 蛋白質(zhì)序列分析蛋白質(zhì)序列分析 蛋白質(zhì)基本性質(zhì)分析蛋白質(zhì)基本性質(zhì)分析 蛋白質(zhì)功能預(yù)測蛋白質(zhì)功能預(yù)測 蛋白質(zhì)結(jié)構(gòu)預(yù)測蛋白質(zhì)結(jié)構(gòu)預(yù)測 蛋白質(zhì)分子進(jìn)化分析蛋白質(zhì)分子進(jìn)化分析第六節(jié)第六節(jié) 蛋白質(zhì)序列分析蛋白質(zhì)序列分析一、蛋白質(zhì)基本性質(zhì)分析一、蛋白質(zhì)基本性質(zhì)分析 蛋白質(zhì)的氨基酸組

36、成、分子量、等電點(diǎn)等方面的分析蛋白質(zhì)的氨基酸組成、分子量、等電點(diǎn)等方面的分析 : OMIGA、DNAMAN、BioEdit、MacVector等等 蛋白質(zhì)疏水性分析蛋白質(zhì)疏水性分析 :ProtScale, /cgi-bin/protscale.pl 預(yù)測跨膜區(qū)預(yù)測跨膜區(qū) : http:/genome.cbs.dtu.dk/services/TMHMM-2.0/ /software/TMPRED_form.html http:/www.emblheidelberg.de/services/sander/pred

37、ictprotein ftp:/ftp.biochem.ucl.ac.uk。用用TMHMM 軟件預(yù)測的軟件預(yù)測的SARS-CoV 的的E蛋白的跨膜區(qū)蛋白的跨膜區(qū)第六節(jié)第六節(jié) 蛋白質(zhì)序列分析蛋白質(zhì)序列分析一、蛋白質(zhì)基本性質(zhì)分析一、蛋白質(zhì)基本性質(zhì)分析預(yù)測信號(hào)肽:預(yù)測信號(hào)肽:http:/genome.cbs.dtu.dk/services/SignalP/ 蛋白質(zhì)亞細(xì)胞定位蛋白質(zhì)亞細(xì)胞定位 :http:/predict.sanger.ac.uk/nnpsl/預(yù)測信號(hào)肽預(yù)測信號(hào)肽預(yù)測信號(hào)肽預(yù)測信號(hào)肽蛋白質(zhì)亞細(xì)胞定位蛋白質(zhì)亞細(xì)胞定位蛋白質(zhì)亞細(xì)胞定位蛋白質(zhì)亞細(xì)胞定位第六節(jié)第六節(jié) 蛋白質(zhì)序列分析蛋白質(zhì)序列分析二、蛋白質(zhì)功能預(yù)測二、蛋白質(zhì)功能預(yù)測蛋白質(zhì)序列分析和功能預(yù)測的一般流程蛋白質(zhì)序列分析和功能預(yù)測的一般流程 第六節(jié)第六節(jié) 蛋白質(zhì)序列分析蛋白質(zhì)序列分析二、蛋白質(zhì)功能預(yù)測二、蛋白質(zhì)功能預(yù)測磷酸化位點(diǎn)、糖基化位點(diǎn),特殊的結(jié)構(gòu)區(qū)(磷酸化位點(diǎn)、糖基化位點(diǎn),特殊的結(jié)構(gòu)區(qū)(motif)的分析:)的分析:PROSITE: /prosite/BLOCKS: ht

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論