信息生物學課件_第1頁
信息生物學課件_第2頁
信息生物學課件_第3頁
信息生物學課件_第4頁
信息生物學課件_第5頁
已閱讀5頁,還剩40頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

現(xiàn)代生物學實驗技術

生物信息與數(shù)據(jù)處理本課件在安裝微軟雅黑字體后有最好效果【詳細說明見jiaoan.htm】機房注意事項不得做課堂以外的事情,一經(jīng)發(fā)現(xiàn),立刻驅(qū)逐并記錄通報。嚴禁隨意設置、升級系統(tǒng)。將自己產(chǎn)生的垃圾帶走;愛護機房設備。有問題通報老師。部分鼠標不好使,下面墊張白紙就可以了。注意腳不要踢到下面的線。仔細閱讀教案,提問前先在本教案上找答案。2電腦操作相關事項登錄開機自動進入Ubuntu系統(tǒng)(Linux的一個版本)后,輸入用戶名"owner"和密碼"buxudong!"登錄。復制教案(可選)點擊菜單欄上的“Places/HomeFolder”打開文件查看器(;相當于Windows的資源管理器),如果沒有看到jiaoan.ppt(或jiaoan.htm)文件,按照下列步驟復制。3本課目錄生物數(shù)據(jù)查詢分子進化與系統(tǒng)分析5一、生物數(shù)據(jù)查詢6網(wǎng)上查資料Google(“谷歌”)

7查中文生物文獻9查英文生物文獻PubMed()可編程10關鍵詞的選擇不是特殊情況,盡量使用名詞原形,不使用復數(shù)、所有格等盡量使用專業(yè)用語,不使用the,of,and,research等常用詞作為關鍵詞為了減少遺漏,使用盡可能少而精的關鍵詞11PubMed查詢結果(2)–綜述文章保存搜索結果查看該文摘要13增加搜索選項14精確使用PubMed查找(高級搜索)標簽(tag)字段(field)關鍵詞(keyword)操作符(operator)檢索條件(searchterms)15查找?guī)椭?2)17NCBI美國國家生物技術信息中心(NationalCenterforBiotechnologyInformation)前身是NIH所屬的一個研究所的計算生物學研究室,1988年獨立為NCBI,形式上屬于國家醫(yī)學圖書館(NationalLibraryofMedicine/NLM)管理著許多著名數(shù)據(jù)庫,如GenBank、Medline、dbSNP、COG、OMIM等提供Entrez、BLAST等服務

18國際核苷酸序列數(shù)據(jù)庫聯(lián)盟InternationalNucleotideSequenceDatabaseCollaboration(INSDC)包括GenBank [美]EMBL [歐]DDBJ [日]每天這三個數(shù)據(jù)庫作數(shù)據(jù)同步操作在任何一個數(shù)據(jù)庫操作(查找、投遞數(shù)據(jù)等)是等效的19GenBank結構GenBank包括三個子數(shù)據(jù)庫CoreNucleotidedbESTdbGSS其中CoreNucleotide還分為更小的BLAST數(shù)據(jù)庫nrhtgswgsenv_nt21GenBank查詢(1)已知收錄號(accessionnumber)的情況選數(shù)據(jù)庫輸入收錄號查詢結果摘要點擊查看詳細結果不知收錄號時,如要搜索人體中的解旋酶,可以在下拉框中選擇“Nucleotide”后,輸入“helicaseANDhuman[orgn]”(不要輸入引號)22作業(yè)【作業(yè)一般性的要求參見附錄一,本作業(yè)具體的要求見下?!款}目用PubMed搜索你感興趣的課題相關的序列或

綜述文獻(review)。要求將搜到的文獻/序列的基本信息(文獻包括標題、雜志名、卷、期、頁碼、時間、作者,注意不要摘要;序列只要簡單注釋)上交。文獻總篇數(shù)/序列總條數(shù)限制在20以內(nèi)。如果超過20不列出超出的部分,只列出實際的總數(shù)。在步驟中說明你選擇關鍵詞和限制條件的理由。23FASTA序列格式也叫Pearson格式簡單使用最多例子(單序列)>NameofthesequencectgcgagNcgcgcgatgatagMMM-NNNnnnnatgancgcggcgagcatgtagcatgctagctgtcgcgagcactUUUURRRrrrrrrrcggccgagatcaggcgatgcatgcgcagggagcagcgagcgacgagcacagcatgctagctagatgcatgctaVvvvcgtaggcagccgcc“-”表示間隔25多序列FASTA>sequence1,E.colictgcgagNcgcgcgatgatagMMM-NNNngnnatgancgcggcgagcatgtagcatgctagctgtcgcgagcactUgaURRRrrrtrrrcggccgagatcaggcgatgcatgcgcagggagcagcgagcgacgagcacagcatgctagctagatgcatgctaVagvcgtaggcagccgcc>sequence2,B.subtilisctgcgagNcgcgcgatgatagctgactNntnatganncgcggcgagcatgtagcatgctagctgtcgcgagcactUctURRRrrrcrrrcggccgagatcaggcgatgcatgcgcagggagcagcgagcgacgagcacagcatgctagctagatgcatgctaVcgvcgtaggcagccgcc>sequence3,B.nattoctgcgagNcgcgcgatgatagMcgatcccnatgannncgcggcgagcatgtagcatgctagctgtcgcgagcactUggURRRrrrggrrcggccgagatcaggcgatgcatgcgcagggagcagcgagcgacgagcacagcatgctagctagatgcatgctaVaavcgtaggcagccgcc26如何用PubMed找蛋白(BLAST第一步)選Protein輸入關鍵詞選一個蛋白29blastp(1)–BLAST主頁點此進入blastp起始頁30blastp(2)–blastp起始頁在這里輸入要搜索的蛋白質(zhì)的收錄號(accessionnumber)或序列點此開始搜索如果要限制搜索的物種(如水稻),可在"Organism"處輸入"Oryzasativa"(水稻的拉丁名)31點此看結果blastp(3)–提交后頁面32blastp(4)–結果頁(1.基本信息)33blastp(5)–結果頁(2.比對圖)34blastp(6)–結果頁(3.高分序列)35blastp

(7)–結果頁(4.高分序列詳細結果)consensus36比對(MEGA)37比對38比對39建樹(MEGA)關閉比對窗口后自動彈出對話框40建樹41作業(yè)【作業(yè)一般性的要求參見附錄一,本作業(yè)具體的要求見下?!克阉髂闼信d趣的蛋白及其同源物的序列(序列不超過20條),分析這些序列之間的進化關系,建立系統(tǒng)樹。將樹輸出為(;相當于另存為)Newick格式,將輸出的nwk文件的內(nèi)容(例子見下)復制在作業(yè)正文內(nèi)(不要貼圖)。并對結果進行解釋。

【Newick樹例子】((gi|42673|emb|CAA23618.1|_recA_gene_pr...,gi|86449963|gb|ABC96175.1|_RecA_prote...)0.18,(gi|37362719|gb|AAQ91336.1|_RecA_Esche...,gi|86449965|gb|ABC96176.1|_RecA_prote...)0.21,gi|86449967|gb|ABC96177.1|_RecA_prote...);42附錄一作業(yè)一般性的要求請嚴格按照要求(包括一般性和具體要求)做作業(yè),這些要求將作為打分的重要依據(jù)。任選以上作業(yè)之一上交。作業(yè)要包括詳細完成步驟,其中的所有引用或用到的網(wǎng)頁/文獻請注明網(wǎng)址或出處。作業(yè)請在第8周(4月19日)之前在上交。43附錄二常見問題集什么是文件的擴展名?怎樣才能看到擴展名?擴展名是文件名末尾點號(.)后面的部分,如文件"實驗報告.doc"的擴展名是doc。缺省情況下,WindowsXP會(Linux一般不會)隱藏已知的文件擴展名。要想看到擴展名,打開資源管理器,點擊菜單項"工具/文件夾選項",選擇"查看"標簽,去掉"隱藏已知文件類型的擴展名"復選框即可。什么是純文本文件?什么是二進制文件?純文本文件一般也叫文本文件。一個簡單的判斷文本文件的方法:用記事本(Windows下)或gedit(Linux下)打開這個文件,能夠閱讀的為純文本文件,不能閱讀的為二進制文件。另一個方法,由擴展名判斷。常見的純文本文件有:文本文件(txt)、網(wǎng)頁文件(htm,html)等;常見的二

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論