生物信息學(xué)軟件及使用技巧_第1頁
生物信息學(xué)軟件及使用技巧_第2頁
生物信息學(xué)軟件及使用技巧_第3頁
生物信息學(xué)軟件及使用技巧_第4頁
生物信息學(xué)軟件及使用技巧_第5頁
已閱讀5頁,還剩57頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、內(nèi)容概要一. 生物信息學(xué)的概念二. 生物信息學(xué)軟件的主要功能簡介1.1.分析和處理實(shí)驗(yàn)數(shù)據(jù)和公共數(shù)據(jù),加快研究進(jìn)度,縮分析和處理實(shí)驗(yàn)數(shù)據(jù)和公共數(shù)據(jù),加快研究進(jìn)度,縮短科研時(shí)間短科研時(shí)間2.2.提示、指導(dǎo)、替代實(shí)驗(yàn)操作,利用對(duì)實(shí)驗(yàn)數(shù)據(jù)的分析提示、指導(dǎo)、替代實(shí)驗(yàn)操作,利用對(duì)實(shí)驗(yàn)數(shù)據(jù)的分析所得的結(jié)論設(shè)計(jì)下一階段的實(shí)驗(yàn)所得的結(jié)論設(shè)計(jì)下一階段的實(shí)驗(yàn)3.3.用計(jì)算機(jī)管理實(shí)驗(yàn)數(shù)據(jù)用計(jì)算機(jī)管理實(shí)驗(yàn)數(shù)據(jù)4.4.尋找、預(yù)測新基因及預(yù)測其結(jié)構(gòu)、功能尋找、預(yù)測新基因及預(yù)測其結(jié)構(gòu)、功能5.5.蛋白高級(jí)結(jié)構(gòu)預(yù)測蛋白高級(jí)結(jié)構(gòu)預(yù)測三. 生物學(xué)軟件部分常見功能使用技巧PCR PCR 引物設(shè)計(jì)引物設(shè)計(jì)DNADNA、蛋白質(zhì)序列同源

2、分析及進(jìn)化樹構(gòu)建、蛋白質(zhì)序列同源分析及進(jìn)化樹構(gòu)建ContigContig Express-DNA Express-DNA 序列片斷拼接序列片斷拼接DNA DNA 模擬電泳模擬電泳重要生物數(shù)據(jù)庫簡介重要生物數(shù)據(jù)庫簡介四. 生物信息學(xué)服務(wù)一. 生物信息學(xué)的概念生物信息學(xué)的概念:生物信息學(xué)的概念: 生物信息學(xué)是一門新興的交叉學(xué)科,它將數(shù)學(xué)和計(jì)算機(jī)知識(shí)應(yīng)用于生物學(xué),以獲取、加工、存儲(chǔ)、分類、檢索與分析生物大分子的信息,從而理解這些信息的生物學(xué)意義。二. 生物信息學(xué)軟件的主要功能簡介1. 分析和處理實(shí)驗(yàn)數(shù)據(jù)和公共數(shù)據(jù),加快研究進(jìn)度,縮短科研時(shí)間2. 提示、指導(dǎo)、替代實(shí)驗(yàn)操作,利用對(duì)實(shí)驗(yàn)數(shù)據(jù)的分析所得的結(jié)

3、論設(shè)計(jì)下一階段的實(shí)驗(yàn)3. 實(shí)驗(yàn)數(shù)據(jù)的自動(dòng)化管理4. 尋找、預(yù)測新基因及其結(jié)構(gòu)、功能5. 蛋白質(zhì)高級(jí)結(jié)構(gòu)及功能預(yù)測(三維建模,目前研究的焦點(diǎn)和難點(diǎn))功能功能1. 分析和處理實(shí)驗(yàn)數(shù)據(jù)和公共數(shù)據(jù),分析和處理實(shí)驗(yàn)數(shù)據(jù)和公共數(shù)據(jù),加快研究進(jìn)度,縮短科研時(shí)間加快研究進(jìn)度,縮短科研時(shí)間 核酸:序列同源性比較,分子進(jìn)化樹構(gòu)建,結(jié)構(gòu)信息分析,包括基元(Motif)、酶切點(diǎn)、重復(fù)片斷、堿基組成和分布、開放閱讀框(ORF),蛋白編碼區(qū)(CDS)及外顯子預(yù)測、RNA二級(jí)結(jié)構(gòu)預(yù)測、DNA片段的拼接 蛋白:序列同源性比較,結(jié)構(gòu)信息分析(包括Motif,限制酶切點(diǎn),內(nèi)部重復(fù)序列的查找,氨基酸殘基組成及其親水性及疏水性分析)

4、,等電點(diǎn)及二級(jí)結(jié)構(gòu)預(yù)測等等 本地序列與公共序列的聯(lián)接,成果擴(kuò)大網(wǎng)上數(shù)據(jù)庫的運(yùn)用(成果擴(kuò)大) http:/ IRACE (基因拉長功能) BLAST同源序列檢索 ENTREZ SYSTEM (集成信息檢索系統(tǒng))ENTREZ 集成檢索示意圖Vector NTI Suit 同源比較主窗口Vector NTI Suit 同源比較進(jìn)化樹Antheprot 5.0 Dot Plot 點(diǎn)陣圖Peptool Lite- Dot Plot 點(diǎn)陣圖DNASIS 2.5 蛋白二級(jí)結(jié)構(gòu)預(yù)測DNASIS 2.5 RNA 二級(jí)結(jié)構(gòu)預(yù)測DNASIS 2.5 tRNA 二級(jí)結(jié)構(gòu)預(yù)測RNAStructure 3.5 RNA 二

5、結(jié)構(gòu)預(yù)測Omiga 2.0 ORF MapDnaStar 之 Protean 對(duì)氨基酸的親疏水性分析:helical wheel 圖功能功能2. 提示、指導(dǎo)、替代實(shí)驗(yàn)操作,利用對(duì)實(shí)提示、指導(dǎo)、替代實(shí)驗(yàn)操作,利用對(duì)實(shí)驗(yàn)數(shù)據(jù)的分析所得的結(jié)論設(shè)計(jì)下一階段的實(shí)驗(yàn)驗(yàn)數(shù)據(jù)的分析所得的結(jié)論設(shè)計(jì)下一階段的實(shí)驗(yàn) 用軟件設(shè)計(jì)PCR引物,測序引物或雜交探針,設(shè)計(jì)克隆策略,構(gòu)建載體,做模擬電泳實(shí)驗(yàn),即模擬核酸內(nèi)切酶或內(nèi)肽酶對(duì)相應(yīng)的底物分子切割后的電泳行為。蛋白跨膜區(qū)域分析,信號(hào)肽潛在斷裂點(diǎn)預(yù)測。Vector NTI Suit 5.5 模擬電泳Gene Construction Kit 2.0 模擬電泳W(wǎng)inplas

6、2.6 質(zhì)粒構(gòu)建OLIGO 5.0 PCR 引物設(shè)計(jì)Atheprot 5.0 預(yù)測蛋白跨膜區(qū)域Antheprot 5.0 預(yù)測信號(hào)肽斷裂點(diǎn)功能功能3. 用計(jì)算機(jī)管理實(shí)驗(yàn)室數(shù)據(jù)及文獻(xiàn)資料用計(jì)算機(jī)管理實(shí)驗(yàn)室數(shù)據(jù)及文獻(xiàn)資料 實(shí)驗(yàn)室結(jié)果的儲(chǔ)存,管理和申報(bào)工作 從網(wǎng)絡(luò)數(shù)據(jù)庫獲得的序列文件(由ENTREZ集成檢索系統(tǒng)所得的數(shù)據(jù)文件可以進(jìn)入EndNote 或者Reference Manager 儲(chǔ)存管理)或資料文獻(xiàn)的管理v軟件: EndNote, Reference Manager Reference Manager 9 界面功能功能4. 用計(jì)算機(jī)預(yù)測新基因及其結(jié)構(gòu)和功能用計(jì)算機(jī)預(yù)測新基因及其結(jié)構(gòu)和功能 對(duì)

7、CDS(Coding Sequence)蛋白編碼區(qū)的預(yù)測準(zhǔn)確率已達(dá)到90%以上 對(duì)整個(gè)基因結(jié)構(gòu)的預(yù)測存在一定難度vPWM(位置權(quán)重矩陣)算法由物化原理技術(shù)開發(fā),側(cè)重于找基因表達(dá)系統(tǒng)和核酸相互作用的位點(diǎn)。給信號(hào)序列各個(gè)位置每種可能出現(xiàn)的核苷酸分配一個(gè)分?jǐn)?shù),將各位置分?jǐn)?shù)相加后得出該序列作為潛在作用位點(diǎn)的分?jǐn)?shù)。DNASIS 2.5 對(duì)蛋白編碼區(qū)的預(yù)測A. (Codon Bias)DNASIS 2.5 對(duì)蛋白編碼區(qū)的預(yù)測B. (Rare Codon)DNASIS 2.5 對(duì)蛋白編碼區(qū)的預(yù)測C. (ORF List)DNASTAR 之 GeneQuest 預(yù)測CDS功能5.蛋白高級(jí)結(jié)構(gòu)預(yù)測 該項(xiàng)技術(shù)算法

8、十分復(fù)雜,尚未成熟。PDB及MMDB數(shù)據(jù)庫目前仍然禁止收錄軟件預(yù)測出來的蛋白高級(jí)結(jié)構(gòu)模型。 X射線晶體學(xué)技術(shù)和多維核磁共振技術(shù)是當(dāng)前人們認(rèn)識(shí)蛋白高級(jí)結(jié)構(gòu)的主要手段,但兩種技術(shù)都有不足之處。前者要求必需得到高標(biāo)準(zhǔn)的蛋白晶體,后者對(duì)分子量大于3萬的大蛋白不能測定。因此理論模擬和結(jié)構(gòu)預(yù)測顯得十分重要。 序列與結(jié)構(gòu)關(guān)系的根源在于“蛋白質(zhì)折疊的問題”,這是近期研究關(guān)注的焦點(diǎn)。1.同源預(yù)測(一級(jí)結(jié)構(gòu)決定高級(jí)結(jié)構(gòu))2.結(jié)構(gòu)與結(jié)構(gòu)相對(duì)比(DALI算法)3.當(dāng)前最先進(jìn)的結(jié)構(gòu)預(yù)測方法:結(jié)構(gòu)類識(shí)別(fold recognition) 先建立一個(gè)已知的結(jié)構(gòu)類數(shù)據(jù)庫(fold library),將待測序列“穿過”該數(shù)據(jù)

9、庫構(gòu)成的座標(biāo),并根據(jù)事先確定的物理限制,逐個(gè)位置移動(dòng)(threading, sequence-structure alignment) ,并用一個(gè)函數(shù)(sequence-structure fitness alignment) 判斷序列與結(jié)構(gòu)類的符合程度,找出未知序列在目標(biāo)結(jié)構(gòu)上的能量最優(yōu)和構(gòu)象最穩(wěn)固的比對(duì)位置。對(duì)計(jì)算機(jī)要求很高。Cn3D 2.5 顯示 1EQF A鏈三維結(jié)構(gòu)RasMol 2.7 顯示1EQF A鏈三維結(jié)構(gòu)PDB與MMDB結(jié)構(gòu)圖比較三. 生物學(xué)軟件部分常見功能使用技巧PCR 引物設(shè)計(jì)引物設(shè)計(jì)的原則引物設(shè)計(jì)的原則 首先引物要跟模板緊密結(jié)合,其次引物與引物之間不能有穩(wěn)定的二聚體或發(fā)

10、夾結(jié)構(gòu)存在,最后引物不能在別的非目的位點(diǎn)引起高效DNA聚合反應(yīng)(即錯(cuò)配)。圍繞這幾條基本原則,設(shè)計(jì)引物需要考慮諸多因素,如引物長度(primer length),產(chǎn)物長度(product length),序列Tm值 (melting temperature),G值(internal stability),引物二聚體及發(fā)夾結(jié)構(gòu)(duplex formation and hairpin),錯(cuò)誤引發(fā)位點(diǎn)(false priming site),引物及產(chǎn)物GC含量(composition),有時(shí)還要對(duì)引物進(jìn)行修飾,如增加限制酶切點(diǎn),引進(jìn)突變等。引物設(shè)計(jì)要點(diǎn) 一般引物的長度為16-23bp,常用的長度為

11、18-21bp,過長或過短都不合適。 引物3端的堿基一般不用A,因?yàn)锳在錯(cuò)誤引發(fā)位點(diǎn)的引發(fā)效率相對(duì)比較高,而其它三種堿基的錯(cuò)誤引發(fā)效率相對(duì)小一些。 引物的GC含量一般為45-55%,過高或過低都不利于引發(fā)反應(yīng)。上下游引物的GC含量不能相差太大。 引物所對(duì)應(yīng)模板序列的Tm值最好在72左右,當(dāng)然由于模板序列本身的組成決定其Tm值可能偏低或偏高,可根據(jù)具體情況靈活運(yùn)用。 G值反映了引物與模板結(jié)合的強(qiáng)弱程度,也是一個(gè)重要的引物評(píng)價(jià)指標(biāo),一般情況下,在Oligo 5.0軟件的G值窗口中,引物的G值最好呈正弦曲線形狀,即5端和中間部分G值較高,而3端G值相對(duì)較低,且不要超過9(G值為負(fù)值,這里取絕對(duì)值),

12、如此則有利于正確引發(fā)反應(yīng)而可防止錯(cuò)誤引發(fā)。分析其原理,引物與模板應(yīng)具有較高的結(jié)合能量,這樣有利于引物與模板序列的整合,因此5端與中間段的G值應(yīng)較高,而3端G值影響DNA聚合酶對(duì)模板DNA的解鏈,過高則不利于這一步驟。 可能的錯(cuò)誤引發(fā)位點(diǎn)決定于引物序列組成與模板序列組成的相似性,相似性高則錯(cuò)誤引發(fā)率高,錯(cuò)誤引發(fā)的引發(fā)率一般不要高過100,最好沒有錯(cuò)誤引發(fā)位點(diǎn),如此可以保證不出非目的產(chǎn)物的假帶。 引物二聚體及發(fā)夾結(jié)構(gòu)的能量一般不要超過4.5,否則容易產(chǎn)生引物二聚體帶而且會(huì)降低引物濃度從而導(dǎo)致PCR正常反應(yīng)不能進(jìn)行。 對(duì)引物的修飾一般是增加酶切位點(diǎn),應(yīng)參考載體的限制酶識(shí)別序列確定,常常對(duì)上下游引物修

13、飾的序列選用不同限制酶的識(shí)別序列,以有利于以后的工作。 關(guān)于引物的自動(dòng)搜索和評(píng)價(jià)分析 推薦使用自動(dòng)搜索軟件:Primer Premier 5.0 推薦使用引物評(píng)價(jià)軟件:Oligo 5/6DNA、蛋白質(zhì)序列同源分析及進(jìn)化樹構(gòu)建相似性與同源性 相似性是指一種很直接的數(shù)量關(guān)系,比如部分相同或相似的百分比或其它一些合適的度量??蛇M(jìn)行自身局部比較。如 Dot Plot (點(diǎn)陣序列比較) 同源性指從一些數(shù)據(jù)中推斷出的兩個(gè)基因或蛋白質(zhì)序列具而共同祖先的結(jié)論,屬于質(zhì)的判斷。如 Alignment (同源性分析)推薦軟件 相似性分析 Peptool Lite 同源性分析Vector NTI Suit 6-Ali

14、gnXContig Express-DNA 序列片斷拼接推薦軟件 DNA序列片斷拼接Vector NTI Suit 6-ContigExpress ProjectDNA 模擬電泳一點(diǎn)體會(huì) DNA模擬電泳具有一定實(shí)驗(yàn)預(yù)示功能, 模擬電泳不能作為實(shí)驗(yàn)結(jié)果或依據(jù)重要生物數(shù)據(jù)庫簡介三大數(shù)據(jù)庫 NCBI (美國) DDBJ (日本)http:/www.ddbj.nig.ac.jp EBI (歐洲)http:/www.ebi.ac.uk/index.html其他重要數(shù)據(jù)庫 酵母基因組數(shù)據(jù)庫(SGD) 酵母蛋白質(zhì)數(shù)據(jù)庫(YPD) 擬南芥數(shù)據(jù)庫(AtDB) 醫(yī)學(xué)數(shù)據(jù)庫(OMIM) 線蟲數(shù)據(jù)庫(ACEDB)四. 生物信息學(xué)服務(wù)服務(wù)內(nèi)容1. PCR引物、測序引物及雜交探針的設(shè)計(jì)及評(píng)價(jià)2. DNA,蛋白質(zhì)序列同源分析及進(jìn)化樹構(gòu)建3. 生物大分子二級(jí)結(jié)構(gòu)模擬顯示及基本序列分析4. 有關(guān)蛋白質(zhì)親

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論