生物信息學(xué)軟件使用技巧_第1頁(yè)
生物信息學(xué)軟件使用技巧_第2頁(yè)
生物信息學(xué)軟件使用技巧_第3頁(yè)
生物信息學(xué)軟件使用技巧_第4頁(yè)
生物信息學(xué)軟件使用技巧_第5頁(yè)
已閱讀5頁(yè),還剩47頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、生物信息學(xué)軟件的主要功能簡(jiǎn)介1.1. 分析和處理實(shí)驗(yàn)數(shù)據(jù)和公共數(shù)據(jù),加快研究分析和處理實(shí)驗(yàn)數(shù)據(jù)和公共數(shù)據(jù),加快研究進(jìn)度,縮短科研時(shí)間進(jìn)度,縮短科研時(shí)間2.2. 提示、指導(dǎo)、替代實(shí)驗(yàn)操作,利用對(duì)實(shí)驗(yàn)數(shù)提示、指導(dǎo)、替代實(shí)驗(yàn)操作,利用對(duì)實(shí)驗(yàn)數(shù)據(jù)的分析所得的結(jié)論設(shè)計(jì)下一階段的實(shí)驗(yàn)據(jù)的分析所得的結(jié)論設(shè)計(jì)下一階段的實(shí)驗(yàn)3.3. 用計(jì)算機(jī)管理實(shí)驗(yàn)數(shù)據(jù)用計(jì)算機(jī)管理實(shí)驗(yàn)數(shù)據(jù)4.4. 尋找、預(yù)測(cè)新基因及預(yù)測(cè)其結(jié)構(gòu)、功能尋找、預(yù)測(cè)新基因及預(yù)測(cè)其結(jié)構(gòu)、功能5.5. 蛋白高級(jí)結(jié)構(gòu)預(yù)測(cè)蛋白高級(jí)結(jié)構(gòu)預(yù)測(cè)二.生物學(xué)軟件部分常見(jiàn)功能使用技巧PCR PCR 引物設(shè)計(jì)引物設(shè)計(jì)DNADNA、蛋白質(zhì)序列同源分析及進(jìn)化樹(shù)構(gòu)建、蛋白質(zhì)序列

2、同源分析及進(jìn)化樹(shù)構(gòu)建ContigContig Express-DNA Express-DNA 序列片斷拼接序列片斷拼接DNA DNA 模擬電泳模擬電泳重要生物數(shù)據(jù)庫(kù)簡(jiǎn)介重要生物數(shù)據(jù)庫(kù)簡(jiǎn)介3生物信息學(xué)服務(wù) 生物信息學(xué)是一門(mén)新興的交叉學(xué)科,它將數(shù)學(xué)和計(jì)算機(jī)知識(shí)應(yīng)用于生物學(xué),以獲取、加工、存儲(chǔ)、分類(lèi)、檢索與分析生物大分子的信息,從而理解這些信息的生物學(xué)意義。lhttp:/ IRACE (基因拉長(zhǎng)功能)lBLAST同源序列檢索lENTREZ SYSTEM (集成信息檢索系統(tǒng))1.分析和處理實(shí)驗(yàn)數(shù)據(jù)和公共數(shù)據(jù),加快研究進(jìn)度,縮短科研時(shí)間2.提示、指導(dǎo)、替代實(shí)驗(yàn)操作,利用對(duì)實(shí)驗(yàn)數(shù)據(jù)的分析所得的結(jié)論設(shè)計(jì)下一

3、階段的實(shí)驗(yàn)3.實(shí)驗(yàn)數(shù)據(jù)的自動(dòng)化管理4.尋找、預(yù)測(cè)新基因及其結(jié)構(gòu)、功能5.蛋白質(zhì)高級(jí)結(jié)構(gòu)及功能預(yù)測(cè)(三維建模,目前研究的焦點(diǎn)和難點(diǎn))核酸:序列同源性比較,分子進(jìn)化樹(shù)構(gòu)建,結(jié)構(gòu)信息分析,包括基元(Motif)、酶切點(diǎn)、重復(fù)片斷、堿基組成和分布、開(kāi)放閱讀框(ORF),蛋白編碼區(qū)(CDS)及外顯子預(yù)測(cè)、RNA二級(jí)結(jié)構(gòu)預(yù)測(cè)、DNA片段的拼接蛋白:序列同源性比較,結(jié)構(gòu)信息分析(包括Motif,限制酶切點(diǎn),內(nèi)部重復(fù)序列的查找,氨基酸殘基組成及其親水性及疏水性分析),等電點(diǎn)及二級(jí)結(jié)構(gòu)預(yù)測(cè)等等本地序列與公共序列的聯(lián)接,成果擴(kuò)大 用軟件設(shè)計(jì)PCR引物,測(cè)序引物或雜交探針,設(shè)計(jì)克隆策略,構(gòu)建載體,做模擬電泳實(shí)驗(yàn),即

4、模擬核酸內(nèi)切酶或內(nèi)肽酶對(duì)相應(yīng)的底物分子切割后的電泳行為。蛋白跨膜區(qū)域分析,信號(hào)肽潛在斷裂點(diǎn)預(yù)測(cè)。l實(shí)驗(yàn)室結(jié)果的儲(chǔ)存、管理和申報(bào)工作l從網(wǎng)絡(luò)數(shù)據(jù)庫(kù)獲得的序列文件(由ENTREZ集成檢索系統(tǒng)所得的數(shù)據(jù)文件可以進(jìn)入EndNote 或者Reference Manager 儲(chǔ)存管理)或資料文獻(xiàn)的管理v軟件: EndNote,Reference Manager l對(duì)CDS(Coding Sequence)蛋白編碼區(qū)的預(yù)測(cè)準(zhǔn)確率已達(dá)到90%以上l對(duì)整個(gè)基因結(jié)構(gòu)的預(yù)測(cè)存在一定難度vPWM(位置權(quán)重矩陣)算法由物化原理技術(shù)開(kāi)發(fā),側(cè)重于找基因表達(dá)系統(tǒng)和核酸相互作用的位點(diǎn)。給信號(hào)序列各個(gè)位置每種可能出現(xiàn)的核苷酸分配

5、一個(gè)分?jǐn)?shù),將各位置分?jǐn)?shù)相加后得出該序列作為潛在作用位點(diǎn)的分?jǐn)?shù)。l該項(xiàng)技術(shù)算法十分復(fù)雜,尚未成熟。PDB及MMDB數(shù)據(jù)庫(kù)目前仍然禁止收錄軟件預(yù)測(cè)出來(lái)的蛋白高級(jí)結(jié)構(gòu)模型。lX射線(xiàn)晶體學(xué)技術(shù)和多維核磁共振技術(shù)是當(dāng)前人們認(rèn)識(shí)蛋白高級(jí)結(jié)構(gòu)的主要手段,但兩種技術(shù)都有不足之處。前者要求必需得到高標(biāo)準(zhǔn)的蛋白晶體,后者對(duì)分子量大于3萬(wàn)的大蛋白不能測(cè)定。因此理論模擬和結(jié)構(gòu)預(yù)測(cè)顯得十分重要。l序列與結(jié)構(gòu)關(guān)系的根源在于“蛋白質(zhì)折疊的問(wèn)題”,這是近期研究關(guān)注的焦點(diǎn)。1.同源預(yù)測(cè)(一級(jí)結(jié)構(gòu)決定高級(jí)結(jié)構(gòu))2.結(jié)構(gòu)與結(jié)構(gòu)相對(duì)比(DALI算法)3.當(dāng)前最先進(jìn)的結(jié)構(gòu)預(yù)測(cè)方法:結(jié)構(gòu)類(lèi)識(shí)別(fold recognition) 先建立

6、一個(gè)已知的結(jié)構(gòu)類(lèi)數(shù)據(jù)庫(kù)(fold library),將待測(cè)序列“穿過(guò)”該數(shù)據(jù)庫(kù)構(gòu)成的坐標(biāo),并根據(jù)事先確定的物理限制,逐個(gè)位置移動(dòng)(threading, sequence-structure alignment) ,由一個(gè)函數(shù)(sequence-structure fitness alignment) 判斷序列與結(jié)構(gòu)類(lèi)的符合程度,找出未知序列在目標(biāo)結(jié)構(gòu)上的能量最優(yōu)和構(gòu)象最穩(wěn)固的比對(duì)位置。對(duì)計(jì)算機(jī)要求很高。l引物設(shè)計(jì)的原則引物設(shè)計(jì)的原則l 首先引物要跟模板緊密結(jié)合;l 其次引物與引物之間不能有穩(wěn)定的二聚體或發(fā)夾結(jié)構(gòu)存在;l最后引物不能在別的非目的位點(diǎn)引起高效DNA聚合反應(yīng)(即錯(cuò)配)。圍繞這幾條基本

7、原則,設(shè)計(jì)引物需要考慮諸多因素,如:l引物長(zhǎng)度(primer length),l產(chǎn)物長(zhǎng)度(product length),l序列Tm值 (melting temperature),lG值(internal stability),l引物二聚體及發(fā)夾結(jié)構(gòu)(duplex formation and hairpin),l錯(cuò)誤引發(fā)位點(diǎn)(false priming site),l引物及產(chǎn)物GC含量(composition),有時(shí)還要對(duì)引物進(jìn)行修飾,如增加限制酶切點(diǎn),引進(jìn)突變等。l一般引物的長(zhǎng)度為16-23bp,常用的長(zhǎng)度為18-21bp,過(guò)長(zhǎng)或過(guò)短都不合適。l引物3端的堿基一般不用A,因?yàn)锳在錯(cuò)誤引發(fā)位點(diǎn)

8、的引發(fā)效率相對(duì)比較高,而其它三種堿基的錯(cuò)誤引發(fā)效率相對(duì)小一些。l引物的GC含量一般為45-55%,過(guò)高或過(guò)低都不利于引發(fā)反應(yīng)。上下游引物的GC含量不能相差太大。l引物所對(duì)應(yīng)模板序列的Tm值最好在72左右,當(dāng)然由于模板序列本身的組成決定其Tm值可能偏低或偏高,可根據(jù)具體情況靈活運(yùn)用。 lG值反映了引物與模板結(jié)合的強(qiáng)弱程度,也是一個(gè)重要的引物評(píng)價(jià)指標(biāo),一般情況下,在Oligo 5.0軟件的G值窗口中,引物的G值最好呈正弦曲線(xiàn)形狀,即5端和中間部分G值較高,而3端G值相對(duì)較低,且不要超過(guò)9(G值為負(fù)值,這里取絕對(duì)值),如此則有利于正確引發(fā)反應(yīng)而可防止錯(cuò)誤引發(fā)。分析其原理,引物與模板應(yīng)具有較高的結(jié)合能

9、量,這樣有利于引物與模板序列的整合,因此5端與中間段的G值應(yīng)較高,而3端G值影響DNA聚合酶對(duì)模板DNA的解鏈,過(guò)高則不利于這一步驟。l可能的錯(cuò)誤引發(fā)位點(diǎn)決定于引物序列組成與模板序列組成的相似性,相似性高則錯(cuò)誤引發(fā)率高,錯(cuò)誤引發(fā)的引發(fā)率一般不要高過(guò)100,最好沒(méi)有錯(cuò)誤引發(fā)位點(diǎn),如此可以保證不出非目的產(chǎn)物的假帶。l引物二聚體及發(fā)夾結(jié)構(gòu)的能量一般不要超過(guò)4.5,否則容易產(chǎn)生引物二聚體帶而且會(huì)降低引物濃度從而導(dǎo)致PCR正常反應(yīng)不能進(jìn)行。l對(duì)引物的修飾一般是增加酶切位點(diǎn),應(yīng)參考載體的限制酶識(shí)別序列確定,常常對(duì)上下游引物修飾的序列選用不同限制酶的識(shí)別序列,以有利于以后的工作。 l推薦使用自動(dòng)搜索軟件:P

10、rimer Premier 5.0 l推薦使用引物評(píng)價(jià)軟件:Oligo 5/6l相似性是指一種很直接的數(shù)量關(guān)系,比如部分相同或相似的百分比或其它一些合適的度量??蛇M(jìn)行自身局部比較。如 Dot Plot (點(diǎn)陣序列比較)l同源性指從一些數(shù)據(jù)中推斷出的兩個(gè)基因或蛋白質(zhì)序列具而共同祖先的結(jié)論,屬于質(zhì)的判斷。如 Alignment (同源性分析)l相似性分析相似性分析l Peptool Litel同源性分析同源性分析Vector NTI 6-AlignXlContig Express-DNA 序列序列片斷拼接片斷拼接一點(diǎn)體會(huì)lDNA模擬電泳具有一定實(shí)驗(yàn)預(yù)示功能,l模擬電泳不能作為實(shí)驗(yàn)結(jié)果或依據(jù)Vect

11、or NTI Suit 5.5 模擬電泳三大數(shù)據(jù)庫(kù)lNCBI (美國(guó))lDDBJ (日本)http:/www.ddbj.nig.ac.jplEBI (歐洲)http:/www.ebi.ac.uk/index.htmll酵母基因組數(shù)據(jù)庫(kù)(SGD)l酵母蛋白質(zhì)數(shù)據(jù)庫(kù)(YPD)l擬南芥數(shù)據(jù)庫(kù)(AtDB)l醫(yī)學(xué)數(shù)據(jù)庫(kù)(OMIM)l線(xiàn)蟲(chóng)數(shù)據(jù)庫(kù)(ACEDB)1. PCR引物、測(cè)序引物及雜交探針的設(shè)計(jì)及評(píng)價(jià)2. DNA,蛋白質(zhì)序列同源分析及進(jìn)化樹(shù)構(gòu)建3. 生物大分子二級(jí)結(jié)構(gòu)模擬顯示及基本序列分析4. 有關(guān)蛋白質(zhì)親疏水性,等電點(diǎn),抗原性,跨膜蛋白,信號(hào)肽等分析以及Dot Plot服務(wù)5. 質(zhì)粒載體構(gòu)建及克隆策略6.

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論