啟動(dòng)子生物信息學(xué)分析軟件_第1頁(yè)
啟動(dòng)子生物信息學(xué)分析軟件_第2頁(yè)
啟動(dòng)子生物信息學(xué)分析軟件_第3頁(yè)
啟動(dòng)子生物信息學(xué)分析軟件_第4頁(yè)
啟動(dòng)子生物信息學(xué)分析軟件_第5頁(yè)
已閱讀5頁(yè),還剩2頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、 1.Promoter Prediction/seq_tools/promoter.html2. PlantCARE(plant cis-acting regulatory elements), a database of plant cis-acting regulatory elementshttp:/bioinformatics.psb.ugent.be/webtools/plantcare/html/3. promoter 2.0 prediction server http:/www.cbs.dtu.dk/se

2、rvices/Promoter/4.啟動(dòng)子分析網(wǎng)址:1 /seq_tools/promoter.html2 http:/alggen.lsi.upc.es/recerca/menu_recerca.html3 http:/www.cbs.dtu.dk/services/Promoter/4 /molb470/ . s/solorz/index.html5 /molbio/proscan/http:/bip.weizmann.ac.il/toolbo . t

3、ers.html#databases/seq_tools/promoter.html.sg/promoter/CGrich1_0/CGRICH.htmhttp:/www.gene-.hk/b400559/arraysoft_pathway.html#Promoterhttp:/www.dna.affrc.go.jp/PLACE/signalup.htmlhttp:/intra.psb.ugent.be:8080/PlantCARE/http:/www.cbs.dtu.dk/s

4、ervices/Promoter//molbio/proscan//molbio/signal/常用啟動(dòng)子分析網(wǎng)址:http:/bip.weizmann.ac.il/toolbox/seq_analysis/promoters.html#databases/seq_tools/promoter.html.sg/promoter/CGrich1_0/CGRICH.htmhttp:/www.gene-http:/ihome.cuh

5、.hk/b400559/arraysoft_pathway.html#Promoterhttp:/www.dna.affrc.go.jp/PLACE/signalup.htmlhttp:/intra.psb.ugent.be:8080/PlantCARE/http:/www.cbs.dtu.dk/services/Promoter//molbio/proscan//molbio/signal/ 首先就是想直接查找有沒(méi)有人做過(guò)這條基因的啟動(dòng)子,在pubmed中輸入genename+pro

6、moter 接著就想看看有沒(méi)有數(shù)據(jù)庫(kù)可以直接給出啟動(dòng)子序列的,很幸運(yùn)竟然發(fā)現(xiàn)一個(gè)極好的啟動(dòng)子搜索講義網(wǎng)站,如下,.il/workshops/bgu/promoterworkshop.html 第一步就是要找到基因確定基因所在基因組區(qū)域,其中列出很多網(wǎng)站,不過(guò)偶還是習(xí)慣genbank,在gene欄中search某個(gè)基因,不要搞錯(cuò)基因種 屬!進(jìn)入后即可看到該基因的詳細(xì)條目,別眼花,就點(diǎn)擊右側(cè)link欄的Map viewer鏈接,進(jìn)入即可看到該基因在染色體上的形象定位,鼠標(biāo)懸停在基因的起始位點(diǎn)時(shí),即可在瀏覽器下方的狀態(tài)欄中顯示該位點(diǎn)在染色體上的明確定位,

7、 比如110997788,結(jié)合給出的基因跨度,比如110778899-117708899,即可大概確定該啟動(dòng)子在基因組中的大概定位,即 110778899-110997788; 第二步搞清楚基因組狀態(tài),我沒(méi)搞太清楚,不過(guò)其中給的一個(gè)鏈接來(lái)查出啟動(dòng)子所在克?。ú槌隹寺√?hào)可以購(gòu)買(mǎi))/genome/guide/mouse/該鏈接中的clonefinder工具可以做到,只要提交你要查找的基因officialname就可以返回一個(gè)clonelist; 第三步搜索啟動(dòng)子,其中可以用啟動(dòng)子數(shù)據(jù)庫(kù)和啟動(dòng)子預(yù)測(cè)軟件,當(dāng)然如果啟動(dòng)子數(shù)據(jù)庫(kù)中有

8、最好,但很失望給出的數(shù)據(jù)庫(kù)均不能查到!只好用啟動(dòng)子預(yù)測(cè)軟件,使用了幾個(gè)在線預(yù)測(cè)工具后覺(jué)得下面這個(gè)速度賊快,推薦http:/www.cbs.dtu.dk/services/Promoter/我把該基因的dna序列submit之后返回了很多個(gè)PolII識(shí)別位點(diǎn),到底哪個(gè)是呢?我個(gè)人理解啟動(dòng)子應(yīng)該是翻譯起始位點(diǎn)附近,所以在這個(gè)dna序列 中定位翻譯起始位點(diǎn)即可找到最近的Highly likely prediction,那么怎么定位呢?利用blast2這個(gè)利器,只要把dna和mrna序列粘貼進(jìn)去提交就ok,正好在翻譯起始位點(diǎn)上游幾百bp有個(gè) 識(shí)別位點(diǎn),ok!啟動(dòng)子序列就是翻譯起始位點(diǎn)上游大概1kb長(zhǎng)度

9、的序列了!直接用ensemble數(shù)據(jù)庫(kù)的話,可以直接知道基因外顯子和起始位點(diǎn)的位置,然后直接可以查到之前的序列,再選3k-4k的長(zhǎng)度預(yù)測(cè)就比較方便了。啟動(dòng)子及轉(zhuǎn)錄因子結(jié)合位點(diǎn)數(shù)據(jù)庫(kù)及預(yù)測(cè)工具 (2009-05-14 23:54:56)轉(zhuǎn)載忽然感覺(jué)很GUILTY的,BLOG里竟然不放一點(diǎn)點(diǎn)和研究有關(guān)的重要工具。換了電腦之后才發(fā)現(xiàn),很多有用的鏈接都沒(méi)有COPY下來(lái),于是,從頭開(kāi)始做吧。這是Andrew給我的他的PAPER里的有關(guān)轉(zhuǎn)錄因子結(jié)合位點(diǎn)的數(shù)據(jù)庫(kù),還有其他網(wǎng)友整理的,都很有用,這個(gè)星期有空再核下幾個(gè)重要基因的SNP。 PROMOTER FINDING AND ANALYS

10、IS PROGRAMS ON THE INTERNET-TRANSPLORER (TRANScription exPLORER)Dnanalyze (TF mapping)Dragon Promoter Finder 1.2 (TSS finder and promoter region analysis)FunSiteP 2.1HCtata (TATA signal prediction)McPromoter Ver.3MatInspector (Search for TF binding sites)ModelGenerator and ModelInspectorNNPP2.1 (TSS

11、 finder)PromoterInspector (Strand non-specific promoter region finder)Promoter2.0 (TSS finder)Promoter Scan II (Promoter region prediction)RGSiteScanSignal Scan (Search for Eukaryotic Transcriptional Elements)TESS (Search for Transcription Elements)TFSEARCH (Predicts TF binding sites based on TRANSF

12、AC data)TRANSFAC (TF database and a number of associated programs)TSSG and TSSWPROMOTER 2.0  http:/www.cbs.dtu.dk/services/Promoter/通常確定啟動(dòng)子的算法可以分成兩種,一種根據(jù)啟動(dòng)子區(qū)各種轉(zhuǎn)錄信號(hào),如TATA 盒、CCAAT 盒,結(jié)合對(duì)這些保守信號(hào)及信號(hào)間保守的空間排列順序的識(shí)別進(jìn)行預(yù)測(cè)。如PROMOTER 2.0, 用神經(jīng)網(wǎng)絡(luò)方法確定TATA 盒、CCAAT盒、加帽位點(diǎn)(cap site) 和GC 盒(GCbox) 的位置和距離, 識(shí)別含TATA 盒的啟

13、動(dòng)子。PROMOTER SCAN      /molbio/proscan/根據(jù)轉(zhuǎn)錄因子結(jié)合部位在基因組中分布的不平衡性,將轉(zhuǎn)錄因子結(jié)合部位分布密度與TATA 盒的權(quán)重矩陣(weight matrix) 結(jié)合起來(lái),從基因組DNA中識(shí)別出啟動(dòng)子區(qū)3 。但上述程序預(yù)測(cè)的假陽(yáng)性率較高,PROMOTER 210 每23kb 出現(xiàn)一個(gè)假陽(yáng)性;PRO2MOTER SCAN 平均每19kb 出現(xiàn)一個(gè)假陽(yáng)性。PromoterInspector  http:/www.genomatix.de/products/

14、PromoterInspector/PromoterInspector2.html另一種方法根據(jù)啟動(dòng)子區(qū)序列的特征進(jìn)行預(yù)測(cè)。Promo2terInspector 從一組訓(xùn)練序列中提取出啟動(dòng)子區(qū)的環(huán)境特征,并將外顯子、內(nèi)含子和3端非翻譯區(qū)的特征與啟動(dòng)子區(qū)加以區(qū)分,從而在基因組中確定啟動(dòng)子位置FirstEF   /tools/FirstEF/近來(lái)還有一些程序?qū)⑸鲜龇椒ㄅcCpG 島(CpG islands) 信息相結(jié)合。CpG島是一段200 bp 或更長(zhǎng)的DNA 序列,核苷酸G + C 的含量較高,并且CpG雙核苷酸的出現(xiàn)頻率占G+ C 含

15、量的50 %以上。許多脊椎動(dòng)物的啟動(dòng)子區(qū)都與CpG島的位置重合。FirstEF ( http :/ / rulai1cshl1org/ tools/ FirstEF/ ) 搜索通過(guò)5UTR 定位技術(shù)構(gòu)建的第一外顯子數(shù)據(jù)庫(kù),識(shí)別第一剪切點(diǎn)(first splicing donor site) ,結(jié)合CpG 島信息,確定啟動(dòng)子區(qū)。這種方法使預(yù)測(cè)的敏感性和特異性都明顯提高。該程序預(yù)測(cè)含CpG島的啟動(dòng)子的敏感性和特異性都高于90 % ,預(yù)測(cè)不含CpG島的啟動(dòng)子的精確性相對(duì)略低。TRRD 數(shù)據(jù)庫(kù) http:/wwwmgs.bionet.nsc.ru/mgs/dbases/trrd4/  收錄了

16、真核基因調(diào)控區(qū)結(jié)構(gòu)和基因表達(dá)方式的信息,每個(gè)條目對(duì)應(yīng)一個(gè)基因。應(yīng)用權(quán)重矩陣數(shù)據(jù)庫(kù)搜索轉(zhuǎn)錄因子結(jié)合部位的程序包括SIGNAL SCAN  /molbio/signal/MatInspector  http:/www.genomatix.de/products/index.html轉(zhuǎn)錄因子搜索程序( transcriptional factor search ,TF2 SEARCH ) http:/www.cbrc.jp/research/db/TFSEARCH.html等等。盡管基于PWM 的搜索比較敏感,但它最大的缺點(diǎn)就是假陽(yáng)性率過(guò)

17、高,在預(yù)測(cè)的結(jié)果中有很多結(jié)合部位并不真正具有生物學(xué)功能。COMPEL 數(shù)據(jù)庫(kù)  http:/compel.bionet.nsc.ru/new/index.html經(jīng)實(shí)驗(yàn)確定的復(fù)合元件不多,COMPEL 數(shù)據(jù)庫(kù)中收錄了近200 條經(jīng)實(shí)驗(yàn)確定的復(fù)合元件的信息。如果轉(zhuǎn)錄因子結(jié)合部位的預(yù)測(cè)結(jié)果中包含復(fù)合元件,顯然比單個(gè)元件更有可能具有生物學(xué)功能。Co - Bind 程序通過(guò)建立兩個(gè)轉(zhuǎn)錄因子結(jié)合部位的PWM 及其復(fù)合作用的模型,可以預(yù)測(cè)序列中的復(fù)合元件。還有一些程序利用COMPEL 數(shù)據(jù)庫(kù)中已知的復(fù)合元件去搜索基因組序列。Consensus /p

18、ub/consensus/AlignACE /cgi-bin/alignace.pl等是用來(lái)搜索高含量基序(overrepresented motif finding) 的一些算法,可以對(duì)一組基因簇中的基因調(diào)控區(qū)進(jìn)行比較,以發(fā)現(xiàn)其中存在的高含量的基序,調(diào)控元件可能就存在于這些基序之中。摘自tjogzt's的BLOG,有些挺好的收錄  1. NCBI上的Finding Promoter (NCBI推薦的)      (http:/www.ncbi.nlm.

19、/Class/NAWBIS/Modules/DNA/dna21b.html)      Promoter Scan from the Bioinformatics and Molecular Analysis section of      NIH.      TFSearch from the Computational Biology Research Center of Japan. &

20、#160;    DRAGON Gene Start Finder from the DRAGON Genome Explorer site.      2. Promoter 2.0 Prediction Server      (http:/www.cbs.dtu.dk/services/Promoter/)      Promoter2.0 predicts transc

21、ription start sites of vertebrate PolII      promoters in DNA sequences. It has been developed as an evolution of      simulated transcription factors that interact with sequences in promoter      regions. It b

22、uilds on principles that are common to neural networks and      genetic algorithms.      3. TFSEARCH (http:/www.cbrc.jp/research/db/TFSEARCH.html)      Searching Transcription Factor Binding Sites (ver 1.3)      4. Neural Net

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論