生物信息學技術_第1頁
生物信息學技術_第2頁
生物信息學技術_第3頁
生物信息學技術_第4頁
生物信息學技術_第5頁
已閱讀5頁,還剩57頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

生物信息學技術第1頁/共62頁2生物信息學概論

生物信息學的定義生物信息學研究的范疇第2頁/共62頁3一、生物信息學的定義生物信息學是結合了生物學和信息技術,利用計算機和互聯(lián)網技術,分析海量的并且還在快速積累的生物數(shù)據(jù),從中獲取生物科學新知識的一門新的交叉科學。第3頁/共62頁Halfdayontheweb,halfmonthinthelab.savesyou-AlanBleasbyBioinformatics第4頁/共62頁5第5頁/共62頁6人類基因組計劃的意義人類基因研究的意義在于它可以支持和推動生命科學中一系列重要的基礎性研究。如基因組遺傳語言的破譯,基因的結構與功能關系,生命的起源和進化,細胞發(fā)育、生產、分化的分子機理,疾病發(fā)生的機理等。為推動醫(yī)學長足進步帶來前所未有的機遇,基因診斷、基因療法和基因藥物的開發(fā),有可能成為未來醫(yī)學發(fā)展的重要分支。人類基因組計劃的進一步成功將促進生命科學與信息科學、材料科學的融合,從而帶動一批高技術產業(yè)的發(fā)展第6頁/共62頁7二、生物信息學研究的范疇第一、各種生物數(shù)據(jù)庫的建立和管理;第二、研究高效率的統(tǒng)計工具,分析算法,發(fā)展方便、快捷的分析程序;第三、從海量的原始生物數(shù)據(jù)中發(fā)掘新知識。第7頁/共62頁8

重要生物信息中心重要生物信息數(shù)據(jù)庫第一節(jié)生物信息數(shù)據(jù)庫2009-4-28第8頁/共62頁數(shù)據(jù)庫的建設和發(fā)展GenomicGenomicExperimentalDataWarehousePrepareddataPatternsKnowledgeExpertKnowledgeOftennotexplicitlyimplemented第9頁/共62頁10NCBIGenBankEBIEMBLNIGDDBJ核酸生物信息中心&數(shù)據(jù)庫第10頁/共62頁11重要生物信息中心&數(shù)據(jù)庫

美國國家信息中心(NationalCenterofBiotechnologyInformation,NCBI)的GenBank

(http:///web/GenBank/index.html);

歐洲分子生物學室驗室(EuropeanMolecularBiologyLaboratory-EuropeanBioinformaticsInstitute,EMBL-EBI)

的EMBL(http://www.ebi.ac.uk/databases/index.html);

日本DNA數(shù)據(jù)庫(DNADataBankofJapan,DDBJ)

(http://www.ddbj.nig.ac.jp/)

第11頁/共62頁12

最重要的蛋白質氨基酸序列數(shù)據(jù)庫是瑞士的SWISS-PROT(/sprot/);

蛋白質數(shù)據(jù)庫PIR(ProteinInformationResource),包含所有序列已知的自然界中野生型蛋白質的信息

();PDB蛋白質結構數(shù)據(jù)庫:收集由X射線衍射和核磁共振技術測定的蛋白質大分子三維結構(/pdb)。蛋白生物信息中心&數(shù)據(jù)庫第12頁/共62頁

第13頁/共62頁14第14頁/共62頁數(shù)據(jù)庫查詢與檢索15第二節(jié)第15頁/共62頁16數(shù)據(jù)庫檢索工具Entrez檢索工具:Entrez是美國國家生物技術信息中心(NCBI)提供的集成檢索工具

/Entrez/SRS(SequenceRetrievalSystem)檢索工具:是歐洲分子生物學網EMBnet的主要數(shù)據(jù)庫檢索工具,可以從

EMBnet的主頁進入。

DBGET/LinkDB檢索工具:是日本京都工具大學建立的

GenomeNet數(shù)據(jù)庫,該數(shù)據(jù)庫主要針對代謝途徑。

http://www.genome.ad.jp/dbget/dbget_manual.html。第16頁/共62頁17數(shù)據(jù)庫檢索工具NCBI網頁的Entrez界面第17頁/共62頁PubMed數(shù)據(jù)庫檢索文獻檢索第18頁/共62頁文獻檢索PubMed是美國國家醫(yī)學圖書館(NLM)下屬的國家生物技術信息中心(NCBI)開發(fā)的、基于WWW的醫(yī)學數(shù)據(jù)庫查詢系統(tǒng)。PubMed的網址:/pubmed特點:收錄范圍廣、內容全、檢索途徑多、檢索體系完備,可少部分獲取原文。第19頁/共62頁文獻檢索第20頁/共62頁核酸數(shù)據(jù)分析21第三節(jié)第21頁/共62頁22OUTLINE

核酸序列的基本分析核酸序列的比對分析和功能預測開放閱讀框的分析引物設計向數(shù)據(jù)庫提交序列第22頁/共62頁23一、核酸序列的基本分析

核酸序列的分子量、堿基組成、堿基分布等基本分析:

BioEdit(/BioEdit/bioedit.html)

★DNAMAN(/)

限制性酶切分析:限制性酶數(shù)據(jù)庫(RestrictionEnzymeDataBase,REBASE)(;

/rebase)

測序峰圖的查看、核實與修改:Chromas,BioEdit,DNAMAN

測序結果需要識別與去除測序時使用的載體序列:

VecScreen(/VecScreen.html)第23頁/共62頁24一、核酸序列的基本分析對核酸序列進行電子基因定位:利用序列標簽位點(SequenceTaggedSite,STS);利用UniGene數(shù)據(jù)庫進行基因電子定位;直接利用基因組序列進行基因電子定位。第24頁/共62頁25★

NCBI網頁的MapViewer界面第25頁/共62頁程序名稱查詢序列搜索的數(shù)據(jù)庫BLASTN核酸核酸BLASTP蛋白質蛋白質BLASTX核酸的六讀框蛋白質TBLASTN蛋白質核酸的6個讀框TBLASTX核酸的6個讀框核酸的6個讀框26二、核酸序列的比對分析和功能預測BLAST(BasicLocalAlignmentSearchTool)是基本局域聯(lián)配搜索工具;Blast功能有:第26頁/共62頁27第27頁/共62頁28NCBI網頁的BLAST界面第28頁/共62頁29第29頁/共62頁30第30頁/共62頁31第31頁/共62頁32NCBI網頁的BLAST2SEQUENCES界面第32頁/共62頁33第33頁/共62頁34第34頁/共62頁35二、核酸序列的比對分析和功能預測FASTA:根據(jù)用戶提交的單個序列進行數(shù)據(jù)庫搜索比對的程序。網上服務器和電子郵件服務:

http://www.ebi.ac.uk/mailto:fasta@ebi.ac.ukhttp://www.fasta.genome.ad.jpmailto:fasta@nig.ac.jp第35頁/共62頁36二、核酸序列的比對分析和功能預測進行多序列聯(lián)配:ClustalW:http://www.ebi.ac.uk/clustalw/index.html,

/soft/molbio/align/clustal/,

ftp://ftp.ebi.ac.uk/pub/software/dos/clustalw。ClustalX:CluastalW程序的UNIX版本,它使用X窗口圖形界面,

ftp://ftp.ebi.ac.uk/pub/software

ftp://ftp-igbmc.u-strassbg.fr/pub/clustalX。對聯(lián)配結果進一步編輯,形成適于發(fā)表的形式,可用的軟件有:SeaView:ftp://biom3.univ-lyon1.frBOXSHADE:/software/box_form.html)CINEMA:

http://www.bioinf.man.ac.uk/dbbrowser/cinema2.1/cinema2hdr.html第36頁/共62頁37第五節(jié)核酸序列分析三、開讀框的分析GT-AG法則:外顯子與內含子之間的連接區(qū)序列高度保守,如大部分內含子5’端起始的兩個堿基是GT,3’端最后兩個堿基是AG?;蜃R別軟件,常用的有:★ORFFinder(/gorf/gorf.html)GRAIL(/grainbin/)GeneFinder(http://genomic.sanger.ac.uk)Glimmer(/labs/compbio/glimmer.html/)GenScan(/genscan.html)GeneLang(/genlang/)第37頁/共62頁38用GeneFinde進行開放閱讀框分析第38頁/共62頁39用GeneFinde進行開放閱讀框分析第39頁/共62頁40四、引物設計PrimerPremier軟件:

Primer5軟件:/cgi-bin/primer/primer5Oligo、VectorNT、Omiga等第40頁/共62頁41五、向數(shù)據(jù)庫提交核酸序列

向EMBL提交數(shù)據(jù)的網絡表格可參見:

http://www.ebi.ac.uk/subs/emblsubs.tml

向GenBank數(shù)據(jù)庫提交核酸序列可聯(lián)網進行

/GenBank/index.html

也可用Sequin軟件制作好序列提交文件,向NCBI

發(fā)送E-mail(gb-sub@)提交

第41頁/共62頁42第42頁/共62頁43第六節(jié)蛋白質序列分析★

蛋白質基本性質分析蛋白質功能預測蛋白質結構預測蛋白質分子進化分析第43頁/共62頁44一、蛋白質基本性質分析

蛋白質的氨基酸組成、分子量、等電點等方面的分析:OMIGA、DNAMAN、BioEdit、MacVector等蛋白質疏水性分析:ProtScale,

/cgi-bin/protscale.pl

預測跨膜區(qū):

http://genome.cbs.dtu.dk/services/TMHMM-2.0/

/software/TMPRED_form.html

http://www.emblheidelberg.de/services/sander/predictprotein

ftp://ftp.biochem.ucl.ac.uk。第44頁/共62頁45第45頁/共62頁46第46頁/共62頁47第47頁/共62頁48第48頁/共62頁49用TMHMM軟件預測的SARS-CoV的E蛋白的跨膜區(qū)第49頁/共62頁50第六節(jié)蛋白質序列分析一、蛋白質基本性質分析預測信號肽:http://genome.cbs.dtu.dk/services/SignalP/

蛋白質亞細胞定位:http://predict.sanger.ac.uk/nnpsl/第50頁/共62頁51預測信號肽第51頁/共62頁52預測信號肽第52頁/共62頁53蛋白質亞細胞定位第53頁/共62頁54蛋白質亞細胞定位第54頁/共62頁55二、蛋白質功能預測蛋白質序列分析和功能預測的一般流程第55頁/共62頁

56二、蛋白質功能預測磷酸化位點、糖基化位點,特殊的結構區(qū)(motif)的分析:PROSITE:/prosite/

BLOCKS:/blocks/PFAM:http://www.sanger.ac.uk/software/pfam/PESCAN:http://www.isrec.isb-sib.ch/software/pfscanInterProScan:http://www.ebi.ac.uk/interpro/scan.htmlSMART:http://smart.embl-heidberg.de/

第56頁/共62頁57三、蛋白質結構預測

蛋白質的立體結構數(shù)據(jù)庫PDB(ProteinDataBank):(/microbio/rasmol)PDBFinder(http://www.sander.embl-heideberg.de/pdbfinder)

蛋白質分子模型數(shù)據(jù)庫(MolecularModelingDatabase);

三維結構顯示程序Cn3D(/structure)第57頁/共62頁58

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論