生物信息學(xué)復(fù)習(xí)資料_第1頁
生物信息學(xué)復(fù)習(xí)資料_第2頁
生物信息學(xué)復(fù)習(xí)資料_第3頁
生物信息學(xué)復(fù)習(xí)資料_第4頁
生物信息學(xué)復(fù)習(xí)資料_第5頁
已閱讀5頁,還剩4頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、-作者xxxx-日期xxxx生物信息學(xué)復(fù)習(xí)資料【精品文檔】一、名詞解釋(31個(gè))1. 生物信息學(xué): 廣義: 應(yīng)用信息科學(xué)的方法和技術(shù),研究生物體系和生物過程中信息的存貯、信息的內(nèi)涵和信息的傳遞,研究和分析生物體細(xì)胞、組織、器官的生理、病理、藥理過程中的各種生物信息,或者也可以說成是生命科學(xué)中的信息科學(xué)。狹義: 應(yīng)用信息科學(xué)的理論、方法和技術(shù),管理、分析和利用生物分子數(shù)據(jù)。2. 二級(jí)數(shù)據(jù)庫:對原始生物分子數(shù)據(jù)進(jìn)行整理、分類的結(jié)果,是在一級(jí)數(shù)據(jù)庫、實(shí)驗(yàn)數(shù)據(jù)和理論分析的基礎(chǔ)上針對特定的應(yīng)用目標(biāo)而建立的。3. 多序列比對:研究的是多個(gè)序列的共性。序列的多重比對可用來搜索基因組序列的功能區(qū)域,也可用于研

2、究一組蛋白質(zhì)之間的進(jìn)化關(guān)系。4. 系統(tǒng)發(fā)育分析:是研究物種進(jìn)化和系統(tǒng)分類的一種方法,其常用一種類似樹狀分支的圖形來概括各種(類)生物之間的親緣關(guān)系,這種樹狀分支的圖形稱為系統(tǒng)發(fā)育樹。5. 直系同源:如果由于進(jìn)化壓力來維持特定模體的話,模體中的組成蛋白應(yīng)該是進(jìn)化保守的并且在其他物種中具有直系同源性。 指的是不同物種之間的同源性,例如蛋白質(zhì)的同源性,DNA序列的同源性。(來自百度)6. 旁系(并系)同源:是那些在一定物種中的來源于基因復(fù)制的蛋白,可能會(huì)進(jìn)化出新的與原來有關(guān)的功能。用來描述在同一物種內(nèi)由于基因復(fù)制而分離的同源基因。(來自百度)7. FASTA序列格式:將一個(gè)DNA或者蛋白質(zhì)序列表示為

3、一個(gè)帶有一些標(biāo)記的核苷酸或氨基酸字符串。8. 開放閱讀框(ORF):是結(jié)構(gòu)基因的正常核苷酸序列,從起始密碼子到終止密碼子的閱讀框可編碼完整的多肽鏈,其間不存在使翻譯中斷的終止密碼子。(來自百度)9. 結(jié)構(gòu)域:大分子蛋白質(zhì)的三級(jí)結(jié)構(gòu)常可分割成一個(gè)或數(shù)個(gè)球狀或纖維狀的區(qū)域,折疊得較為緊密,各行其功能,稱為結(jié)構(gòu)域。10. 空位罰分:序列比對分析時(shí)為了反映核酸或氨基酸的插入或缺失等而插入空位并進(jìn)行罰分,以控制空位插入的合理性。(來自百度)11. 表達(dá)序列標(biāo)簽:通過從cDNA文庫中隨機(jī)挑選的克隆進(jìn)行測序所獲得的部分cDNA的3或5端序列。(來自文獻(xiàn))12. Gene Ontology 協(xié)會(huì):13. HM

4、M 隱馬爾可夫模型:將核苷酸序列看成一個(gè)隨機(jī)序列,DNA序列的編碼部分與非編碼部分在核苷酸的選用頻率上對應(yīng)著不同的Markov模型。14. 一級(jí)數(shù)據(jù)庫:數(shù)據(jù)庫中的數(shù)據(jù)直接來源于實(shí)驗(yàn)獲得的原始數(shù)據(jù),只經(jīng)過簡單的歸類整理和注釋 15. 序列一致性:指同源DNA順序的同一堿基位置的相同的堿基成員, 或者蛋白質(zhì)的同一氨基酸位置的相同的氨基酸成員, 可用百分比表示。16. 序列相似性:指同源蛋白質(zhì)的氨基酸序列中一致性氨基酸和可取代氨基酸所占的比例。17. Blastn:是核酸序列到核酸庫中的一種查詢。庫中存在的每條已知序列都將同所查序列作一對一地核酸序列比對。(來自百度)18. Blastp:是蛋白序列

5、到蛋白庫中的一種查詢。庫中存在的每條已知序列將逐一地同每條所查序列作一對一的序列比對。(來自百度)19. Blastx:是核酸序列到蛋白庫中的一種查詢。先將核酸序列翻譯成蛋白序列(一條核酸序列會(huì)被翻譯成可能的六條蛋白),再對每一條作一對一的蛋白序列比對。(來自百度)20. Tblastn:是蛋白序列到核酸庫中的一種查詢。與BLASTX相反,它是將庫中的核酸序列翻譯成蛋白序列,再同所查序列作蛋白與蛋白的比對。(來自百度)21. Tblastx:是核酸序列到核酸庫中的一種查詢。此種查詢將庫中的核酸序列和所查的核酸序列都翻譯成蛋白(每條核酸序列會(huì)產(chǎn)生6條可能的蛋白序列),這樣每次比對會(huì)產(chǎn)生36種比對

6、陣列。(來自百度)22. KEGG:京都基因與基因組百科全書,是系統(tǒng)分析基因功能、基因組信息的數(shù)據(jù)庫,它整合了基因組學(xué)、生物化學(xué)以及系統(tǒng)功能組學(xué)的信息,有助于研究者把基因及表達(dá)信息作為一個(gè)整體網(wǎng)絡(luò)進(jìn)行研究。23. ChIP-Seq:就是通過高通量測序?qū)hIP所得到的序列進(jìn)行測序,從而進(jìn)行蛋白和DNA相互作用相關(guān)研究。24. 分子生物網(wǎng)絡(luò):25. 蛋白質(zhì)相互作用(PPI):是指蛋白質(zhì)分子之間的相關(guān)性,并從生物化學(xué)、信號(hào)轉(zhuǎn)導(dǎo)和遺傳網(wǎng)絡(luò)的角度研究這種相關(guān)性。26. 高通量測序:一次性對幾百萬到十億條DNA分子進(jìn)行并行測序,又稱為下一代測序技術(shù),其使得可對一個(gè)物種的轉(zhuǎn)錄組和基因組進(jìn)行深入、細(xì)致、全貌

7、的分析,所以又被稱為深度測序。 27. 比較蛋白質(zhì)組學(xué):即對模式生物或重要生命過程的蛋白質(zhì)組學(xué)特征進(jìn)行比較。28. NCBInr:29. GT-AG結(jié)構(gòu):30. Entrez檢索系統(tǒng):面向生物學(xué)家的數(shù)據(jù)庫查詢系統(tǒng),其特點(diǎn)之一是使用十分方便。它把序列、結(jié)構(gòu)、文獻(xiàn)、基因組、系統(tǒng)分類等不同類型的數(shù)據(jù)庫有機(jī)地結(jié)合在一起,通過超文本鏈接,用戶可以從一個(gè)數(shù)據(jù)庫直接轉(zhuǎn)入另一個(gè)數(shù)據(jù)庫。31. 系統(tǒng)生物學(xué):是從系統(tǒng)水平來理解生物學(xué)系統(tǒng),利用一系列的原理與方法學(xué)來研究分子行為與系統(tǒng)特性與功能的關(guān)系,通過計(jì)算生物學(xué)來定量闡明和預(yù)測生物的功能、表型和行為。二、選擇題(30個(gè))1. 下面哪種數(shù)據(jù)庫源于mRNA信息(A)

8、: A. dbEST、B. PDB、C. OMIM、D. HTGS2. 、3. 、4. 以下哪一項(xiàng)不屬于啟動(dòng)子研究范圍?()A.CpG 島預(yù)測、5. HTGS的含義是(C、6. 、7. HGP是(C、8、下列中屬于一級(jí)蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫的是:()A. EMBL、 B. DDBJ、C. PDB、9BLAST教案所程序中,哪個(gè)方法是不存在的?()A. BLASTP、 B. BLASTN、C. BLASTX、D. BLASTQ10人類基因組的結(jié)構(gòu)特點(diǎn)不包括:()A. 基因進(jìn)化、B. 基因數(shù)目、C.基因重復(fù)序列、D. 基因組復(fù)制11、下列哪個(gè)選項(xiàng)不是微陣列實(shí)驗(yàn)設(shè)計(jì)的內(nèi)容?()A. 貝葉斯網(wǎng)絡(luò)法、B. 對

9、照組的選擇、C. 重復(fù)樣本的使用、D. 隨機(jī)化原則12、構(gòu)建序列進(jìn)化樹的一般步驟不包括. ()A. 建立DNA文庫、B. 建立數(shù)據(jù)模型、C. 建立取代模型、D. 建立進(jìn)化樹13、在Genbank數(shù)據(jù)庫中,生物學(xué)工作者向其提交數(shù)據(jù)有兩種方式,其中用于提交少量數(shù)據(jù)的是基于Web方式的()。 A. BankIt、B. Sequin、C. Version、D. Matrix 14、序列數(shù)據(jù)庫包括核酸序列數(shù)據(jù)庫和蛋白序列數(shù)據(jù)庫。下列哪個(gè)不屬于蛋白質(zhì)序列數(shù)據(jù)庫?() A. PIR 、B. Uniprot、 C. SWISS-PROT、 D. OMIM15、序列數(shù)據(jù)庫包括核酸序列數(shù)據(jù)庫和蛋白序列數(shù)據(jù)庫。下列

10、哪個(gè)不屬于核酸列數(shù)據(jù)庫?() A. Genbank、B. GenPept、C. EMBL、D. DDBJ16、()是NCBI提供的集成檢索工具,通過一次檢索可查詢NCBI多個(gè)子數(shù)據(jù)庫中的相關(guān)信息。 A. Retrieve、B. SRS、C. Entrez、D. PIR17、 、18、蛋白質(zhì)信號(hào)肽的預(yù)測工具有()。、19、Bioinformatics的含義是()。A. 生物信息學(xué)、B. 基因組學(xué)、C. 蛋白質(zhì)組學(xué)、D. 表觀遺傳學(xué)20、目前應(yīng)用于基因芯片表達(dá)數(shù)據(jù)統(tǒng)計(jì)分析的主要方法是()。A. 卡方檢驗(yàn)、B. 相關(guān)分析、C. 聚類分析、D. 正態(tài)性分布檢驗(yàn)21、NCBI中人類無冗余基因數(shù)據(jù)庫是()

11、。A. UniGene、B. UniPro、C. UniRef、D. URF22、基本局部比對搜素工具是()。A. Mega、B. ClustalW、C. BLAST、D. GCG23、根據(jù)研究發(fā)現(xiàn),人類基因組中真正編碼蛋白質(zhì)的區(qū)域僅占DNA 序列的()。A.1-2%、B.3-5%、C.5-10%、D.10-20%24、被譽(yù)為“生物信息學(xué)之父”的科學(xué)家是()。A. Dulbecco、B. Sanger、D. 林華安25、多序列比對工具是()。A. BLAST、B. ClustalW、C. Mega、D. GCG26、生物芯片分析中使用的聚類分析輸出圖形主要以下列哪種方式表現(xiàn)?()A. 以彩色小

12、方塊陣列表示、B. 以蜂窩形狀表示、C. 以黑白圓點(diǎn)表示、D. 以彩色線條表示、29、()是歐洲分子生物學(xué)網(wǎng)EMBLnet的主要檢索工具,也是一個(gè)開放的數(shù)據(jù)查詢系統(tǒng)。 A. Query 、B. SRS、C. PDB、D. PIR30、數(shù)據(jù)挖掘的四個(gè)步驟不包括下列哪個(gè). ()A. 數(shù)據(jù)選擇、B. 數(shù)據(jù)轉(zhuǎn)換、C. 數(shù)據(jù)記錄、D. 結(jié)果分析三、是非題(16個(gè))1、生物學(xué)就是實(shí)驗(yàn)科學(xué),所有的研究結(jié)論從實(shí)驗(yàn)中來,于實(shí)驗(yàn)中得到驗(yàn)證。2、比較是科學(xué)研究中最常見的方法,在生物信息學(xué)研究中,比對是最常用和最經(jīng)典的研究手段。 3、兩個(gè)蛋白質(zhì)序列相似性超過30%就是同源蛋白。4、蛋白質(zhì)序列相似性指一級(jí)序列中氨基酸殘

13、基相同。 5、蛋白質(zhì)序列相似性指氨基酸殘基具有相似特性. 側(cè)鏈基團(tuán)大小電荷性、疏水性等相同。6、核酸序列相似性指序列中相同堿基所占的比例。 7、對一段未知功能DNA片段進(jìn)行功能預(yù)測需對其進(jìn)行3位翻譯。8、對一段未知功能DNA片段進(jìn)行功能預(yù)測需對其進(jìn)行6位翻譯。9、相似性是指一種很直接的數(shù)量關(guān)系,無需實(shí)驗(yàn)驗(yàn)證。10、相似性是指一種很直接的數(shù)量關(guān)系,也需實(shí)驗(yàn)驗(yàn)證。11、不同種屬間的同源序列稱為直向同源序列。12、不同種屬間的同源序列稱為共生同源序列。 13、所謂局部比對,即分析兩個(gè)序列是否有局部序列的相似。14、所謂整體比對,即找出兩個(gè)序列全長的最優(yōu)比對結(jié)果。15、PSI-BLAST是BLAST程

14、序家族中敏感性最高的子程序。16、PHI-BLAST是BLAST程序家族中敏感性最高的子程序。四、問答題(15個(gè))1、生物信息學(xué)的發(fā)展經(jīng)歷了哪幾個(gè)階段2、序列的相似性與同源性有什么區(qū)別與聯(lián)系?3、BLAST套件的blastn、blastp、blastx、tblastn和tblastx子工具的用途什么?4、生物信息學(xué)的主要研究領(lǐng)域。5、初級(jí)數(shù)據(jù)庫、二級(jí)數(shù)據(jù)庫的概念,說出幾個(gè)數(shù)據(jù)并說明包含什么數(shù)據(jù)。6、簡述高通量測序的應(yīng)用范圍7、簡述系統(tǒng)發(fā)生分析步驟8、說出至少一種蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫和一種可視化工具。9、 Entrez集成于哪個(gè)數(shù)據(jù)庫平臺(tái)?主要功能是什么?在應(yīng)用中可以訪問哪些子數(shù)據(jù)庫(請列舉5個(gè)以上)?10、試述SWISS-PROT中的數(shù)據(jù)來源11、分子生物網(wǎng)絡(luò)可以分成哪幾類?簡單介紹。12、常用的蛋白質(zhì)互作數(shù)據(jù)庫有哪些?13、試述

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論