生物信息學(xué)概論_第1頁
生物信息學(xué)概論_第2頁
生物信息學(xué)概論_第3頁
生物信息學(xué)概論_第4頁
生物信息學(xué)概論_第5頁
已閱讀5頁,還剩8頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

生物信息學(xué)概論武漢大學(xué)生物醫(yī)學(xué)工程系趙旻本章內(nèi)容學(xué)習(xí)目的1、了解生物信息學(xué)的發(fā)展背景2、理解生物信息學(xué)在生命科學(xué)研究中的作用3、理解數(shù)學(xué)、計算機科學(xué)與生物信息學(xué)的關(guān)系4、了解生物信息學(xué)主要技術(shù)方法的原理和應(yīng)用第一節(jié)生物信息學(xué)基礎(chǔ)一、生物信息的特征生命現(xiàn)象是不同層次上的物質(zhì)、能量與信息的交換,不同層次是指核酸、蛋白質(zhì)、細胞、器官、系統(tǒng)、機體,與醫(yī)學(xué)研究密切相聯(lián)生物信息不僅包括基因組信息,如基因的DNA序列、染色體定位,也包括基因產(chǎn)物(蛋白質(zhì)或RNA)的結(jié)構(gòu)和功能;生物種間的進化關(guān)系等其他信息資源。生物體系和生物過程中信息的內(nèi)涵和信息的傳遞生命與信息DNA通過復(fù)制,在生物體的繁衍過程中傳遞遺傳信息DNA本身是否也具有酶活性呢?1994年,G·F·Joyce等人發(fā)現(xiàn)一個人工合成的DNA分子具有一種特殊的磷酸二酯酶活性。又有多例報道人工合成的DNA序列具有各種不同的酶活性。1995年后從多種生物中提取的DNA均具有酯酶活性,能催化乙酸萘酯水解為萘酚和乙酸。這種較弱的酯酶活性并不需要特定序列的DNA編碼,而是非特異性DNA的一般性質(zhì)。DNA分子本身的酯酶活性作為“分子化石”遺跡。(1)遺傳信息的載體——DNA或RNA遺傳信息的載體主要是DNA或RNA分子控制生物體性狀的基因是一系列DNA片段生物體生長發(fā)育的本質(zhì)就是遺傳信息的傳遞和表達(3)DNA分子和蛋白質(zhì)分子都含有進化信息通過比較相似的蛋白質(zhì)序列,如肌紅蛋白和血紅蛋白,可以發(fā)現(xiàn)由于基因復(fù)制而產(chǎn)生的分子進化證據(jù)。通過比較來自于不同種屬的同源蛋白質(zhì),即直系同源蛋白質(zhì),可以分析蛋白質(zhì)甚至種屬之間的系統(tǒng)發(fā)生關(guān)系,推測它們共同的祖先蛋白質(zhì)。進化信息通過比較相似的蛋白質(zhì)序列可以發(fā)現(xiàn)基因的分子進化證據(jù)。通過比較來自于不同種屬的同源蛋白質(zhì),即直系同源蛋白質(zhì),可以分析種屬之間的系統(tǒng)發(fā)生關(guān)系,推測它們共同的祖先蛋白質(zhì)。五、生物信息的特征生物信息數(shù)據(jù)量龐大生物信息復(fù)雜度高:遺傳信息,功能結(jié)構(gòu)信息生物信息之間存在著密切的聯(lián)系存在特定載體:核酸分子和蛋白質(zhì)分子存在不同的層次:分子,細胞,組織器官和機體第一部遺傳密碼已被破譯,但對密碼的轉(zhuǎn)錄過程還不清楚,對大多數(shù)DNA非編碼區(qū)域的功能還知之甚少對于第二部密碼,目前則只能用統(tǒng)計學(xué)的方法進行分析無論是第一部遺傳密碼,還是第二部遺傳密碼,都隱藏在大量的生物分子數(shù)據(jù)之中。改變生物學(xué)的研究方式改變傳統(tǒng)研究方式,引進現(xiàn)代信息學(xué)方法在醫(yī)學(xué)上的重要意義為疾病的診斷和治療提供依據(jù)為設(shè)計新藥提供依據(jù)第二節(jié)生物信息學(xué)的建立和發(fā)展——人類基因組計劃簡介生物信息學(xué)產(chǎn)生的背景海量生物信息需要分析;大量未知基因需要破解其功能GenBank中的DNA堿基數(shù)目呈指數(shù)增加。2000年后其數(shù)目已達110億,它們來自47000種生物;UniGene的數(shù)目約達7萬個。1999年初單核苷酸多態(tài)性(SNP)數(shù)據(jù)庫出現(xiàn)以來,已超過600萬。自全長1.8Mb的嗜血流感桿菌基因組序列于1995年發(fā)表以來,已有54個模型生物的完整基因組完成了測序,包括9個古細菌、31個原核真細菌、14個真核生物的完整基因組或它們的完整染色體,其中包括釀酒酵母和線蟲。還有另外的70余個微生物基因組正在測試當(dāng)中。生物信息學(xué)的發(fā)展歷程20世紀(jì)50年代,生物信息學(xué)開始孕育20世紀(jì)60年代,生物分子信息在概念上將計算生物學(xué)和計算機科學(xué)聯(lián)系起來20世紀(jì)70年代,生物信息學(xué)的真正開端20世紀(jì)70年代到80年代初期,出現(xiàn)了一系列著名的序列比較方法和生物信息分析方法20世紀(jì)80年代以后,出現(xiàn)一批生物信息服務(wù)機構(gòu)和生物信息數(shù)據(jù)庫20世紀(jì)90年代后,HGP促進生物信息學(xué)的迅速發(fā)展生物信息學(xué)的發(fā)展歷程1952年,Sanger根據(jù)胰島素蛋白質(zhì)的測序結(jié)果,推斷蛋白質(zhì)是排列完美的分子。最早的信息論觀點。1955年,Sanger與合作者分別對牛、豬和羊的胰島素蛋白質(zhì)進行了測序并做了序列上的比較。最早的序列比對。1962年,鮑林提出分子進化的理論,推測在人中可能存在50,000~100,000個不同的基因/蛋白質(zhì)。分子進化理論的奠定。1965年,MargaretDayhoff構(gòu)建蛋白質(zhì)序列圖譜1970年,Needleman-Wunsch算法:全局優(yōu)化比對。1981年,Smith-Waterman算法開發(fā):局部優(yōu)化比對。1990年,快速序列相似性搜索工具BLAST的開發(fā)生物信息學(xué)發(fā)展過程中的里程碑性事件人類基因組計劃人類基因組計劃(HumanGenomeProject,HGP)是由美國科學(xué)家RenatoDulbecco在1985年首先提出,美國政府1990年10月正式啟動的,耗資30億美元。目標(biāo)是構(gòu)建詳細的人類基因組遺傳圖和物理圖,確定人類DNA的全部核苷酸序列,定位約3萬基因,以及人類基因的鑒定和分離的內(nèi)容。人類基因組計劃全部測序工作提前到2000年春季完成“工作框架”,即工作草圖。遺傳圖譜、物理圖譜、轉(zhuǎn)錄圖譜和序列圖譜遺傳圖譜是以具有遺傳多態(tài)性的遺傳標(biāo)記為“路標(biāo)”,以遺傳學(xué)距離為圖距的基因組圖。進行基因識別和基因定位物理圖譜是指有關(guān)基因組中特異性序列排列和間距的信息.建立物理圖譜實際上是為全基因組測序建立“路標(biāo)”。轉(zhuǎn)錄圖譜是在識別基因組所包含的蛋白質(zhì)編碼序列的基礎(chǔ)上繪制的結(jié)合有關(guān)基因序列、位置及表達模式等信息的圖譜。研究內(nèi)容1、生物分子數(shù)據(jù)的收集與管理2、數(shù)據(jù)庫搜索及序列比較3、基因組序列分析4、基因表達數(shù)據(jù)的分析與處理5、蛋白質(zhì)結(jié)構(gòu)預(yù)測常見研究領(lǐng)域Alignment(序列比對)ProteinStructurePrediction(蛋白質(zhì)結(jié)構(gòu)預(yù)測)Computer-AidedGeneRecognitions(計算機輔助基因識別)DNALanguage(DNA語言)MolecularEvolution&ComparedGenomics(分子進化和比較基因組學(xué))ContigAssembly(序列重疊群裝配)OriginofGeneticCodes(遺傳密碼的起源)AnalysisofMetabolizeNetwork(代謝網(wǎng)絡(luò)分析)GeneChipDesign(基因芯片設(shè)計)研究方向基因組序列裝配基因識別基因功能預(yù)報基因多態(tài)性分析基因進化mRNA結(jié)構(gòu)預(yù)測基因芯片設(shè)計基因芯片數(shù)據(jù)分析疾病相關(guān)基因分析例:高度自動化的實驗數(shù)據(jù)的獲得、加工和整理各種自動化分子生物學(xué)儀器應(yīng)用上,如DNA測序儀,PCR儀等實驗過程高度自動化,產(chǎn)生的海量數(shù)據(jù),專門的實驗室數(shù)據(jù)管理系統(tǒng)自動完成包括實驗進程和實驗數(shù)據(jù)的紀(jì)錄,常規(guī)數(shù)據(jù)分析,數(shù)據(jù)質(zhì)量檢測和問題的自動查找,常規(guī)的數(shù)據(jù)說明和數(shù)據(jù)輸入數(shù)據(jù)庫。建立分子生物學(xué)數(shù)據(jù)管理系統(tǒng)。DNA序列片段的測序拼接目前DNA自動測序儀每個反應(yīng)只能測序100-1000bp,傳統(tǒng)測序方法是將克隆進行亞克隆并對亞克隆進行排序。自動而高速拼接序列的算法,Lander-Waterman模型(LanderESandWatermanMS,1998)利用鳥槍法進行測序,再將大量隨機測序的片段用計算機進行自動拼接。1.9MbHaemophilusinfluenzae(流感嗜血桿菌)(1995)0.58MbMycoplasmugenitalium(支原體)(1995)0.58Mbjannaschii(甲烷桿菌)(1996)拼接算法需要進一步提高拼接真核基因組的有效性;自動處理自動測序造成的差錯。2、數(shù)據(jù)庫搜索及序列比較搜索同源序列在一定程度上就是通過序列比較尋找相似序列序列比較的一個基本操作就是比對(Alignment),即將兩個序列的各個字符(代表核苷酸或者氨基酸殘基)按照對應(yīng)等同或者置換關(guān)系進行對比排列,其結(jié)果是兩個序列共有的排列順序,這是序列相似程度的一種定性描述多重序列比對研究的是多個序列的共性。序列的多重比對可用來搜索基因組序列的功能區(qū)域,也可用于研究一組蛋白質(zhì)之間的進化關(guān)系。常用序列分析工具CLUSTAL:已知同源的序列間的配比FASTA:全基因數(shù)據(jù)庫的快速搜索PSI-BLAST:非??焖俚娜珨?shù)據(jù)庫搜索HMM:特定蛋白家族的序列模式識別PHYLIPS:基因進化樹序列比較發(fā)現(xiàn)同源分子3、基因組序列分析遺傳語言分析基因組結(jié)構(gòu)分析基因識別基因功能注釋基因調(diào)控信息分析基因組比較基因識別識別基因組編碼區(qū),識別基因結(jié)構(gòu)1、同源比較(DNA序列、EST)2、基因預(yù)測(不是用同源搜索的方法來識別基因) 從頭開始基因預(yù)測,基于知識的基因預(yù)測(密碼子使用,堿基組成,剪切位點特征,PolyA信號,核苷酸頻率,轉(zhuǎn)錄信號,轉(zhuǎn)譯信號,尺寸分布)基因預(yù)測的步驟:1、識別可能的外顯子2、辨別起始/內(nèi)部/終止外顯子3、把外顯子聯(lián)結(jié)起來,形成可能的基因4、確保該可能的基因沒有內(nèi)部的移位或終止密碼子5、leftovers:shadowexons算法:Rule-basedsystem;linguisticsystem;lineardiscriminantanalysis;decisiontree;splicedalignment;fourieranalysisEvaluatingGenePrediction敏感性(Sensitivity)敏感性=預(yù)測基因中確為基因的數(shù)目/待測序列中的基因數(shù)目;Howmanyexonswerecorrectlypredicted?特異性(Specifity)特異性=預(yù)測基因中確為基因的數(shù)目/預(yù)測基因數(shù)目Howmanyexonpredictionsaretrue?生物學(xué)家們一直假設(shè),人類擁有8萬到10萬個基因。但是根據(jù)測序完成的人類基因組第21對、22對染色體的經(jīng)驗,得出的結(jié)論是整個基因組有不多于4萬個基因。比較現(xiàn)有的人類基因序列與淡水河豚基因序列,提出了更低的人類基因數(shù)估計:在27700與34300之間。馬里蘭Rockville的基因組研究所(TIGR)的JohnQuackenbush根據(jù)TIGR的人類基因指數(shù)的估計118259個基因。*生物體的復(fù)雜性并不是簡單地與基因數(shù)量相關(guān)聯(lián)的。生物體的復(fù)雜性來自于基因如何被管理或表達的,而不是基因數(shù)目本身?;蚬δ茴A(yù)測序列同源比較:如果基因A與基因B有相當(dāng)?shù)耐葱裕敲椿駻可能具有類似基因B的功能。公共數(shù)據(jù)庫:GenBank,EMBL,DDBJ功能數(shù)據(jù)庫:dbEST,dbSTS,dbGSS(GenomeSurveySequence),dbHTG(highthroughputGenomicSequence,未完成整理的序列數(shù)據(jù))蛋白質(zhì)序列庫:PIR(proteininformationresource),Swiss-Prot蛋白質(zhì)高級結(jié)構(gòu)數(shù)據(jù)庫PDB(proteindatabank):生物大分子三級結(jié)構(gòu)的數(shù)據(jù)庫。同源比較算法:分為整體對齊(Globalalignment)和局部對齊(localalignment)局部對齊的算法有Smith-Watermann算法;FASTA算法;BLAST算法4、基因表達數(shù)據(jù)的分析與處理基因表達數(shù)據(jù)分析是目前生物信息學(xué)研究的熱點和重點目前對基因表達數(shù)據(jù)的處理主要是進行聚類分析,將表達模式相似的基因聚為一類,在此基礎(chǔ)上尋找相關(guān)基因,分析基因的功能所用方法主要有:相關(guān)分析方法模式識別技術(shù)中的層次式聚類方法人工智能中的自組織映射神經(jīng)網(wǎng)絡(luò)主元分析方法基因表達分析和調(diào)控網(wǎng)絡(luò)研究高通量基因轉(zhuǎn)錄實驗技術(shù)1、mRNAcDNAmicroarrayOligonucleotidechipRT-PCRSAGE2、protein2D、蛋白質(zhì)結(jié)構(gòu)預(yù)測蛋白質(zhì)的生物功能由蛋白質(zhì)的結(jié)構(gòu)所決定,蛋白質(zhì)結(jié)構(gòu)預(yù)測成為了解蛋白質(zhì)功能的重要途徑蛋白質(zhì)結(jié)構(gòu)預(yù)測分為:二級結(jié)構(gòu)預(yù)測空間結(jié)構(gòu)預(yù)測二級結(jié)構(gòu)預(yù)測二級結(jié)構(gòu)的預(yù)測可以歸結(jié)為模式識別問題主要方法有:立體化學(xué)方法圖論方法統(tǒng)計方法最鄰近決策方法基于規(guī)則的專家系統(tǒng)方法分子動力學(xué)方法人工神經(jīng)網(wǎng)絡(luò)方法預(yù)測準(zhǔn)確率超過70%的第一個軟件是基于神經(jīng)網(wǎng)絡(luò)的PHD系統(tǒng)蛋白質(zhì)三級結(jié)構(gòu)預(yù)測同源模型化方法遠程同源模型化方法結(jié)構(gòu)的從頭預(yù)測方法距離幾何分子動力學(xué)同源模型化方法空間結(jié)構(gòu)預(yù)測方面,比較成功的理論方法是同源模型法該方法的依據(jù)是:相似序列的蛋白質(zhì)傾向于折疊成相似的三維空間結(jié)構(gòu),如果具有25-30%的等同序列,可以假設(shè)這兩個蛋白質(zhì)折疊成相似的空間結(jié)構(gòu)運用同源模型方法,借助于數(shù)據(jù)庫搜索和序列的比對排列,可以完成所有蛋白質(zhì)10-30%的空間結(jié)構(gòu)預(yù)測工作可以通過計算(如分子力學(xué)、分子動力學(xué)等)來進行結(jié)構(gòu)預(yù)測可以通過計算(如分子力學(xué)、分子動力學(xué)等)來進行結(jié)構(gòu)預(yù)測:立體作用,空間堆積,靜電作用,氫鍵,疏水作用6比較基因組學(xué)研究研究生命是從哪里起源的?生命是如何進化的?遺傳密碼是如何起源的?估計最小獨立生活的生物至少需要多少基因,這些基因是如何使它們活起來的?鼠和人的基因組大小相似,基因的數(shù)目類似。可是鼠和人為什么差異確如此之大?不同人種間基因組的差別僅為0.01%;人猿間差別約為1%。但表型間的差異十分顯著。生物進化研究1、序列相似性比較。就是將待研究序列與DNA或蛋白質(zhì)序列庫進行比較,用于確定該序列的生物屬性,也就是找出與此序列相似的已知序列是什么。完成這一工作只需要使用兩兩序列比較算法。常用的程序包有BLAST、FASTA等;2、序列同源性分析。是將待研究序列加入到一組與之同源,但來自不同物種的序列中進行多序列同時比較,以確定該序列與其它序列間的同源性大小。這是理論分析方法中最關(guān)鍵的一步。完成這一工作必須使用多序列比較算法。常用的程序包有CLUSTAL等;3、構(gòu)建系統(tǒng)進化樹。根據(jù)序列同源性分析的結(jié)果,重建反映物種間進化關(guān)系的進化樹。為完成這一工作已發(fā)展了多種軟件包,象PYLIP、MEGA等;4、穩(wěn)定性檢驗。為了檢驗構(gòu)建好的進化樹的可靠性,需要進行統(tǒng)計可靠性檢驗,通常構(gòu)建過程要隨機地進行成百上千次,只有以大概率(70%以上)出現(xiàn)的分支點才是可靠的。通用的方法使用Bootstrap算法,相應(yīng)的軟件已包括在構(gòu)建系統(tǒng)進化樹所用的軟件包當(dāng)中。為便于使用者查找表三給出了進化分析相關(guān)軟件的因特網(wǎng)地址。16SrRNA通過比較真核細胞rRNA的核苷酸順序和“真細菌”、“古細菌”的rRNA核苷酸順序,發(fā)現(xiàn)它們之間截然不同,表明真核細胞不是來自原核細胞,而是遠在原核細胞生成之前,真核細胞就已和原核細胞分開而成獨立的一支,即“早真核生物”,它才是現(xiàn)代真核生物的始祖。第四節(jié)生物信息學(xué)的主要任務(wù)對非蛋白編碼區(qū)進行生物學(xué)意義分析的策略1基于已有的已經(jīng)為實驗證實的所有功能已知的DNA元件的序列特征,預(yù)測非蛋白編碼區(qū)中可能含有的功能已知的DNA元件,從而預(yù)測其可能的生物學(xué)功能,并通過實驗進行驗證;2通過數(shù)理理論直接探索非蛋白編碼區(qū)的新的未知的序列特征,并從理論上預(yù)測其可能的信息含義,最后同樣通過實驗驗證。由于基因組是物種所有遺傳信息的儲藏庫,從根本上決定著物種個體的發(fā)育和生理,因此,從基因組整體結(jié)構(gòu)組織和整體功能調(diào)節(jié)網(wǎng)絡(luò)方面,結(jié)合相應(yīng)的生理表征現(xiàn)象,進行基因組整體的演化研究,將是揭示物種真實演化歷史的最佳途徑。因此,近幾年在發(fā)展基因芯片的同時,人們也發(fā)展了一套研究基因組所有蛋白質(zhì)產(chǎn)物表達情況——蛋白質(zhì)組研究技術(shù),從技術(shù)上來講包括二維凝膠電泳技術(shù)和質(zhì)譜測序技術(shù)。通過二維凝膠電泳技術(shù)可以獲得某一時間截面上蛋白質(zhì)組的表達情況,通過質(zhì)譜測序技術(shù)就可以得到所有這些蛋白質(zhì)的序列組成。重要的就是如何運用生物信息學(xué)理論方法去分析所得到的巨量數(shù)據(jù),從中還原出生命運轉(zhuǎn)和調(diào)控的整體系統(tǒng)的分子機制。從工具的角度來講,它是今后幾乎進行所有生物(醫(yī)藥)研究開發(fā)所必需的,只有基于生物信息學(xué)通過對大量已有數(shù)據(jù)資料的分析處理所提供的理論指導(dǎo)和分析,我們才能選擇正確的研發(fā)方向,同樣,只有選擇正確的生物信息學(xué)分析方法和手段,我們才能正確處理和評價新的觀測數(shù)據(jù)并得到準(zhǔn)確的結(jié)論。數(shù)學(xué)(Maths)Statistics統(tǒng)計學(xué)ProbabilityTheory概率論(特別是隨機過程理論)OperationalResearch運籌學(xué)OptimizationTheory&Method最優(yōu)化理論與方法Topology拓?fù)鋵W(xué)(主要是幾何拓?fù)洌〧unctionTheory函數(shù)論InformationTheory信息論ComputationalMathematics計算數(shù)學(xué)GroupTheory群論常用數(shù)學(xué)模型與方法Bayes公式、Bayes統(tǒng)計馬氏鏈(Markovchains)隱馬氏鏈(HiddenMarkovchains)Poisson過程與連續(xù)時間馬氏鏈熵、相對熵與信息增益神經(jīng)網(wǎng)絡(luò)(neuralnetworks(NN)):Multi-layerfeed-forwardNN,self-organizedlearningNN,recurrentNN(HopfieldNN,Bolztmannmachine)計算機科學(xué)(ComputerScience)網(wǎng)絡(luò)技術(shù)數(shù)據(jù)庫(特別是關(guān)系型數(shù)據(jù)庫)數(shù)據(jù)整合和可視化數(shù)據(jù)挖掘基于Unix操作系統(tǒng)的各種軟件包計算機硬件一些重要的算法的復(fù)雜性研究國際著名的生物信息中心國內(nèi)部分生物信息學(xué)服務(wù)器北京大學(xué)生物信息中心中國生物信息/北京大學(xué)物理化學(xué)研究所北京醫(yī)科大學(xué)生物醫(yī)學(xué)信息中國科學(xué)院微生物研究所天津大學(xué)生物信息中心中科院計算所智能信息處理重點實驗室生物信息學(xué)研究組/中國科學(xué)院基因組信息學(xué)中心/例如:北京大學(xué)生物信息中心安裝了70多個數(shù)據(jù)庫,提供200多種軟件下載建立了14個國外著名生物信息中心鏡象提供了數(shù)據(jù)庫和文獻查詢、搜索構(gòu)建了中華民族基因多樣性等專用數(shù)據(jù)庫集成和開發(fā)了基于Web的生物信息軟件工具開展了分子模擬、序列分析等應(yīng)用研究舉辦了國際國內(nèi)培訓(xùn)班、講習(xí)班、討論會開設(shè)了生物信息學(xué)概論研究生課程構(gòu)建二次數(shù)據(jù)庫中華民族基因多樣性數(shù)據(jù)庫轉(zhuǎn)錄因子細胞特異性數(shù)據(jù)庫Cytomer蛋白質(zhì)結(jié)構(gòu)域數(shù)據(jù)庫Domain蛋白質(zhì)回環(huán)數(shù)據(jù)庫Loop水稻矮縮病毒數(shù)據(jù)庫RDV二硫鍵信息數(shù)據(jù)庫Bridge其他數(shù)據(jù)庫DictyDb(DictyosteliumdiscoideumgenomedatabaseDictyosteliumdiscoideum基因組數(shù)據(jù)庫)/others/dsmith/dictydb.htmlEcoCyc(EncyclopediaofE.coligenesandmetabolism

大腸桿菌基因和代謝百科全書)

EcoGene(EscherichiacoliK12genomedatabase

EscherichiacoliK12基因組數(shù)據(jù)庫)/EcoGene/EcoWeb/

FlyBase(Drosophilagenomedatabase

果蠅基因組數(shù)據(jù)庫)/

http://gin.ebi.ac.uk:7081/

HIV(HIVsequencedatabase

HIV序列數(shù)據(jù)庫)/

MaizeDB(Maizegenomedatabase

玉米基因組數(shù)據(jù)庫)/

IMGT(ImMunoGeneTicsdb

免疫基因標(biāo)記數(shù)據(jù)庫)usc.fr:8104/

MAIZE-2DPAGE(Maizegenome2DElectrophoresisdatabase

玉米基因組雙向電泳數(shù)據(jù)庫)http://moulon.moulon.inra.fr/imgd/

Mendel(Mendel-GFDb(Plantgenesfamiliesdatabase)

孟德爾植物基因家族數(shù)據(jù)庫)http://www.mendel.ac.uk

MGD(Mousegenomedatabase

小鼠基因組數(shù)據(jù)庫)/

.au/mgd/

http://bioinformatics.weizmann.ac.il/mgd/

http://mgd.hgmp.mrc.ac.uk/

http://mgd.niai.affrc.go.jp/

MIM(OnlineMendelianInheritanceinMan(OMIM)

人類孟德爾遺傳網(wǎng)上數(shù)據(jù)庫)/omim/

NRSUB(Non-redundantB.subtilisdatabase

無冗余枯草桿菌數(shù)據(jù)庫)http://pbil.univ-lyon1.fr/nrsub/nrsub.html

SGD(SaccharomycesGenomeDatabase

酵母基因組數(shù)據(jù)庫)/Saccharomyces/

SubtiList(Bacillussubtilis168genomedatabase

枯草桿菌168基因組數(shù)據(jù)庫)http://www.pasteur.fr/Bio/SubtiList/

TIGR(Thebacterialdatabase(s)of'TheInstituteofGenomeResearch'

基因組研究所的細菌數(shù)據(jù)庫)/tdb/

TubercuList(MycobacteriumtuberculosisH37Rvgenomedatabase分支結(jié)核桿菌H37Rv基因組數(shù)據(jù)庫)http://www.pasteur.fr/Bio/TubercuList/

GeneCards(GeneCards:humangenes,proteinanddiseases

基因卡:人基因、蛋白和疾?。﹉ttp://bioinformatics.weizmann.ac.il/cards/

ZFIN(ZebrafishInformationNetworkgenomedatabase

斑馬魚信息網(wǎng)基因組數(shù)據(jù)庫)/ZFIN/酵母功能庫http://www.mips.biochem.mpg.de/proj/yeast/pathways/index.htmlExPASy(swissinstituteofSWISS-PROThttp://www.expasy.ch/sprot-top.htmlPIR(ProteinsequencedatabaseoftheProteinInformationResource

蛋白質(zhì)信息資源數(shù)據(jù)庫)/

/pir/GDB/PDB(ProteinDataBank

蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫)/pdb/

http://www2.ebi.ac.uk/pdb/

.au/pdb/

http://pdb.weizmann.ac.il//npdb/SCOP/scop//scop/http://scop.mrc-lmb.cam.ac.uk/scop/BLOCKS(BLOCKS蛋白質(zhì)模塊數(shù)據(jù)庫)/

DOMO(ProteinDomaindatabase

蛋白質(zhì)結(jié)構(gòu)域數(shù)據(jù)庫)biogen.fr/~gracy/domo

ECO2DBASE(Escherichiacoligene-proteindatabase(2Dgelspots)

大腸桿菌基因-蛋白數(shù)據(jù)庫)/eco2dbase/

ENZYME(Enzymesnomenclaturedatabase

酶命名數(shù)據(jù)庫)http://www.expasy.ch/enzyme/

GCRDb(Gprotein-coupledreceptordatabase

G蛋白耦聯(lián)受體數(shù)據(jù)庫)/

HSSP(Homology-derivedsecondarystructureofproteinsdatabase蛋白質(zhì)同源二級結(jié)構(gòu)數(shù)據(jù)庫)http://www.sander.ebi.ac.uk/hssp/Pfam(Pfamproteindomaindatabase

蛋白質(zhì)結(jié)構(gòu)域數(shù)據(jù)庫)/Pfam/

http://www.sanger.ac.uk/Pfam/

PRINTS(ProteinMotiffingerprintdatabase

蛋白質(zhì)模式數(shù)據(jù)庫)http://bioinf.man.ac.uk/bsm/dbbrowser/PRINTS/

ProDom(ProDomProteindomaindatabase

蛋白質(zhì)結(jié)構(gòu)域數(shù)據(jù)庫)http://protein.toulouse.inra.fr/prodom.html

PROSITE(PROSITE:proteindomainsandfamiliesdatabase

蛋白質(zhì)結(jié)構(gòu)域和家族數(shù)據(jù)庫)http://www.expasy.ch/prosite/

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論