生物信息學(xué)題庫_第1頁
生物信息學(xué)題庫_第2頁
生物信息學(xué)題庫_第3頁
生物信息學(xué)題庫_第4頁
生物信息學(xué)題庫_第5頁
已閱讀5頁,還剩10頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

生物信息學(xué)題庫生物信息學(xué)題庫生物信息學(xué)題庫xxx公司生物信息學(xué)題庫文件編號:文件日期:修訂次數(shù):第1.0次更改批準(zhǔn)審核制定方案設(shè)計,管理制度生物信息學(xué)的大體定義是什么其發(fā)展歷程如何

利用應(yīng)用數(shù)學(xué)、信息學(xué)、統(tǒng)計學(xué)和計算機科學(xué)的方法研究生物學(xué)的問題。目前的生物信息學(xué)基本上只是分子生物學(xué)與信息技術(shù)(尤其是互聯(lián)網(wǎng)技術(shù))的結(jié)合體。生物信息學(xué)的研究材料和結(jié)果就是各種各樣的生物學(xué)數(shù)據(jù),其研究工具是計算機,研究方法包括對生物學(xué)數(shù)據(jù)的搜索(收集和篩選)、處理(編輯、整理、管理和顯示)及利用(計算、模擬)。目前主要的研究方向有:序列比對、基因識別、基因重組、蛋白質(zhì)結(jié)構(gòu)預(yù)測、基因表達(dá)、蛋白質(zhì)反應(yīng)的預(yù)測,以及建立進化模型。發(fā)展歷程:20世紀(jì)50年代,生物信息學(xué)開始孕育20世紀(jì)60年代,生物分子信息在概念上將計算生物學(xué)和計算機科學(xué)聯(lián)系起來20世紀(jì)70年代,生物信息學(xué)的真正開端④20世紀(jì)70年代到80年代初期,出現(xiàn)了一系列著名的序列比較方法和生物信息分析方法⑤20世紀(jì)80年代以后,出現(xiàn)一批生物信息服務(wù)機構(gòu)和生物信息數(shù)據(jù)庫

⑥20世紀(jì)90年代后,HGP促進生物信息學(xué)的迅速發(fā)展請論述生物信息學(xué)的研究內(nèi)容有哪些?生物分子數(shù)據(jù)的收集與管理:①基因組數(shù)據(jù)庫(EMBL、GenBank、DDBJ)②蛋白質(zhì)序列數(shù)據(jù)庫(SWTSS-PROT、PIR)③蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫(PDB)數(shù)據(jù)庫搜索及序列比較搜索同源序列在一定程度上就是通過序列比較尋找相似序列

①序列比較的一個基本操作就是比對(Alignment),即將兩個序列的各個字符(代表核苷酸或者氨基酸殘基)按照對應(yīng)等同或者置換關(guān)系進行對比排列,其結(jié)果是兩個序列共有的排列順序,這是序列相似程度的一種定性描述。②多重序列比對研究的是多個序列的共性。序列的多重比對可用來搜索基因組序列的功能區(qū)域,也可用于研究一組蛋白質(zhì)之間的進化關(guān)系?;蚪M序列分析:①遺傳語言分析——天書②基因組結(jié)構(gòu)分析③基因識別④基因功能注釋⑤基因調(diào)控信息分析⑥基因組比較基因表達(dá)數(shù)據(jù)的分析與處理:基因表達(dá)數(shù)據(jù)分析是目前生物信息學(xué)研究的熱點和重點。

目前對基因表達(dá)數(shù)據(jù)的處理主要是進行聚類分析,將表達(dá)模式相似的基因聚為一類,在此基礎(chǔ)上尋找相關(guān)基因,分析基因的功能。

所用方法主要有:①相關(guān)分析方法②模式識別技術(shù)中的層次式聚類方法③人工智能中的自組織映射神經(jīng)網(wǎng)絡(luò)④主元分析方法5)蛋白質(zhì)結(jié)構(gòu)預(yù)測。蛋白質(zhì)的生物功能由蛋白質(zhì)的結(jié)構(gòu)所決定,蛋白質(zhì)結(jié)構(gòu)預(yù)測成為了解蛋白質(zhì)功能的重要途徑。

蛋白質(zhì)結(jié)構(gòu)預(yù)測分為:

(1)二級結(jié)構(gòu)預(yù)測:在一定程度上二級結(jié)構(gòu)的預(yù)測可以歸結(jié)為模式識別問題在二級結(jié)構(gòu)預(yù)測方面主要方法有:立體化學(xué)方法、圖論方法、統(tǒng)計方法、最鄰近決策方法、基于規(guī)則的專家系統(tǒng)方法、分子動力學(xué)方法、人工神經(jīng)網(wǎng)絡(luò)方法預(yù)測準(zhǔn)確率超過70%的第一個軟件是基于神經(jīng)網(wǎng)絡(luò)的PHD系統(tǒng)(2)空間結(jié)構(gòu)預(yù)測在空間結(jié)構(gòu)預(yù)測方面,比較成功的理論方法是同源模型法

該方法的依據(jù)是:相似序列的蛋白質(zhì)傾向于折疊成相似的三維空間結(jié)構(gòu),運用同源模型方法可以完成所有蛋白質(zhì)10-30%的空間結(jié)構(gòu)預(yù)測工作請敘述構(gòu)建系統(tǒng)進化樹的一般步驟。構(gòu)建系統(tǒng)發(fā)生樹的5個步驟:[1]序列選擇:從那些可以輸出FASTA格式的數(shù)據(jù)庫中選擇[2]多序列比對[3]替代模型的選擇[4]生成樹:方式:distance-based;character-based:maximumparsimony;character-andmodel-based:maximumlikelihood;character-andmodel-based:Bayesian基于距離的樹生成軟件:MEGA和PAUPMEGA應(yīng)用算法:UPGMA,基于距離的算法。[5]結(jié)果評估:原則(一致性、效率、和魯棒性);檢測方法:最為常見的方法是引導(dǎo)檢測的分析方法引導(dǎo)檢測法:簡單地講就是把序列的位點都重排,重排后的序列再用相同的辦法構(gòu)樹,如果原來樹的分枝在重排后構(gòu)的樹中也出現(xiàn)了,就給這個分枝打上一分,如果沒出現(xiàn)就給0分,這樣經(jīng)過你給定的repetitions次(至少1000次)重排構(gòu)樹打分后,每個分枝就都得出分值,計算機會給你換算成bootstrap值。重排的序列有很多組合,值越小說明分枝的可信度越低,最好根據(jù)數(shù)據(jù)的情況選用不同的構(gòu)樹方法和模型.歸納前面所講,下面幾點可以幫助我們解釋進化樹:(1)從根節(jié)點到任何一個節(jié)點的惟一路徑和方向代表了進化時間;(2)根是樹中所有物種的共同祖先;(3)根節(jié)點上的物種我們認(rèn)為比樹中其他所有的物種分化更早。如果無法確定根節(jié)點的物種,就使用無根樹進行分析。NCBI的Entrez檢索包含了哪些方面的信息。Entrez是NCBI為用戶提供整合的訪問序列、定位、分類及結(jié)構(gòu)數(shù)據(jù)的搜索和檢索的系統(tǒng),是一個用以整合NCBI數(shù)據(jù)庫中信息的搜尋和檢索的工具,包括核酸序列、蛋白質(zhì)序列、蛋白質(zhì)三維結(jié)構(gòu)、基因組圖譜和通過PubMed檢索的MEDLINE。其中,Entrez可以整合檢索的序列數(shù)據(jù)庫包括GenBank、EMBI—DDBJ、RefSeq、PIR-International、PRF、Swiss—Prot和PDB等。Entrez有兩個顯著的特點:第一是對每個數(shù)據(jù)庫中的記錄都預(yù)先做相似性比較,產(chǎn)生一個列表,包括序列、結(jié)構(gòu)和MEDLINE文獻(xiàn)記錄等信息;第二是對某個數(shù)據(jù)庫的記錄與其他數(shù)據(jù)庫的相關(guān)記錄做了鏈接,使對不同數(shù)據(jù)庫的訪問得以整合。所以Entrez是通過相近性和硬連接來提供集成的信息檢索。Entrez可以用很廣泛的文本方式搜索,比如作者名字、雜志名字、基因或蛋白名、物種、單一的檢索號(如:accessionnumber、序列ID、PubMedID、MEDLNEUID)和其他的術(shù)語,因此,Entrez是一個強大的檢索相關(guān)序列、結(jié)構(gòu)和參考文獻(xiàn)的信息檢索工具。BLAST系列軟件分別用哪些數(shù)據(jù)搜索何種數(shù)據(jù)庫?真核基因結(jié)構(gòu)注釋包括哪些內(nèi)容相關(guān)的軟件所依據(jù)的理論基礎(chǔ)是什么

GENSCAN是美國麻省理工大學(xué)的ChrisBurge于1997年開發(fā)成功的人類(或脊椎動物)基因預(yù)測軟件,它根據(jù)基因的整體結(jié)構(gòu)進行基因預(yù)測,不依賴于已有的蛋白庫,是一種"從頭預(yù)測"軟件;用于ORF識別。通過對特征序列(GT-AG)的分析進行直接的預(yù)測基因預(yù)測軟件(NetGene2),內(nèi)含子/外顯子剪切位點識別。與相應(yīng)的基因組序列比對,分析比對片段的分布位置(Spidey),用于mRNA剪切位點識別。選擇性剪切數(shù)據(jù)庫:ProSplicer。啟動子結(jié)合位點分析:Cister。限制性酶切位點分析:NEBcutter。密碼子使用偏好性分析:CodonW。請概述基因組注釋的大體流程。(1)基因組注釋(Genomeannotation)是利用生物信息學(xué)方法和工具,對基因組所有基因的生物學(xué)功能進行高通量注釋,是當(dāng)前功能基因組學(xué)研究的一個熱點。基因組注釋的研究內(nèi)容包括基因識別和基因功能注釋兩個方面。基因識別的核心是確定全基因組序列中所有基因的確切位置。從基因組序列預(yù)測新基因,現(xiàn)階段主要是3種方法的結(jié)合:(1)分析mRNA和EST數(shù)據(jù)以直接得到結(jié)果;(2)通過相似性比對從已知基因和蛋白質(zhì)序列得到間接證據(jù);(3)基于各種統(tǒng)計模型和算法從頭預(yù)測。對預(yù)測出的基因進行高通量功能注釋可以借助于以下方法,利用已知功能基因的注釋信息為新基因注釋:(1)序列數(shù)據(jù)庫相似性搜索;(2)序列模體(Motif)搜索;(3)直系同源序列聚類分析(Clusteroforthologousgroup,COG).(2)基因組注釋系統(tǒng)是MGAP的核心,整合了許多常用的基因識別和蛋白質(zhì)功能預(yù)測軟件,包括GeneMarks、IPRsearch、BLASTPGP和FASTA3等,以及多個數(shù)據(jù)庫,如非冗余蛋白質(zhì)序列數(shù)據(jù)庫(Nonredun

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論