啟動子生物信息學分析軟件_第1頁
啟動子生物信息學分析軟件_第2頁
啟動子生物信息學分析軟件_第3頁
啟動子生物信息學分析軟件_第4頁
啟動子生物信息學分析軟件_第5頁
已閱讀5頁,還剩2頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、 1.Promoter Prediction/seq_tools/promoter.html2. PlantCARE(plant cis-acting regulatory elements), a database of plant cis-acting regulatory elementshttp:/bioinformatics.psb.ugent.be/webtools/plantcare/html/3. promoter 2.0 prediction server http:/www.cbs.dtu.dk/se

2、rvices/Promoter/4.啟動子分析網(wǎng)址:1 /seq_tools/promoter.html2 http:/alggen.lsi.upc.es/recerca/menu_recerca.html3 http:/www.cbs.dtu.dk/services/Promoter/4 /molb470/ . s/solorz/index.html5 /molbio/proscan/http:/bip.weizmann.ac.il/toolbo . t

3、ers.html#databases/seq_tools/promoter.html.sg/promoter/CGrich1_0/CGRICH.htmhttp:/www.gene-.hk/b400559/arraysoft_pathway.html#Promoterhttp:/www.dna.affrc.go.jp/PLACE/signalup.htmlhttp:/intra.psb.ugent.be:8080/PlantCARE/http:/www.cbs.dtu.dk/s

4、ervices/Promoter//molbio/proscan//molbio/signal/常用啟動子分析網(wǎng)址:http:/bip.weizmann.ac.il/toolbox/seq_analysis/promoters.html#databases/seq_tools/promoter.html.sg/promoter/CGrich1_0/CGRICH.htmhttp:/www.gene-http:/ihome.cuh

5、.hk/b400559/arraysoft_pathway.html#Promoterhttp:/www.dna.affrc.go.jp/PLACE/signalup.htmlhttp:/intra.psb.ugent.be:8080/PlantCARE/http:/www.cbs.dtu.dk/services/Promoter//molbio/proscan//molbio/signal/ 首先就是想直接查找有沒有人做過這條基因的啟動子,在pubmed中輸入genename+pro

6、moter 接著就想看看有沒有數(shù)據(jù)庫可以直接給出啟動子序列的,很幸運竟然發(fā)現(xiàn)一個極好的啟動子搜索講義網(wǎng)站,如下,.il/workshops/bgu/promoterworkshop.html 第一步就是要找到基因確定基因所在基因組區(qū)域,其中列出很多網(wǎng)站,不過偶還是習慣genbank,在gene欄中search某個基因,不要搞錯基因種 屬!進入后即可看到該基因的詳細條目,別眼花,就點擊右側(cè)link欄的Map viewer鏈接,進入即可看到該基因在染色體上的形象定位,鼠標懸停在基因的起始位點時,即可在瀏覽器下方的狀態(tài)欄中顯示該位點在染色體上的明確定位,

7、 比如110997788,結(jié)合給出的基因跨度,比如110778899-117708899,即可大概確定該啟動子在基因組中的大概定位,即 110778899-110997788; 第二步搞清楚基因組狀態(tài),我沒搞太清楚,不過其中給的一個鏈接來查出啟動子所在克?。ú槌隹寺√柨梢再徺I)/genome/guide/mouse/該鏈接中的clonefinder工具可以做到,只要提交你要查找的基因officialname就可以返回一個clonelist; 第三步搜索啟動子,其中可以用啟動子數(shù)據(jù)庫和啟動子預(yù)測軟件,當然如果啟動子數(shù)據(jù)庫中有

8、最好,但很失望給出的數(shù)據(jù)庫均不能查到!只好用啟動子預(yù)測軟件,使用了幾個在線預(yù)測工具后覺得下面這個速度賊快,推薦http:/www.cbs.dtu.dk/services/Promoter/我把該基因的dna序列submit之后返回了很多個PolII識別位點,到底哪個是呢?我個人理解啟動子應(yīng)該是翻譯起始位點附近,所以在這個dna序列 中定位翻譯起始位點即可找到最近的Highly likely prediction,那么怎么定位呢?利用blast2這個利器,只要把dna和mrna序列粘貼進去提交就ok,正好在翻譯起始位點上游幾百bp有個 識別位點,ok!啟動子序列就是翻譯起始位點上游大概1kb長度

9、的序列了!直接用ensemble數(shù)據(jù)庫的話,可以直接知道基因外顯子和起始位點的位置,然后直接可以查到之前的序列,再選3k-4k的長度預(yù)測就比較方便了。啟動子及轉(zhuǎn)錄因子結(jié)合位點數(shù)據(jù)庫及預(yù)測工具 (2009-05-14 23:54:56)轉(zhuǎn)載忽然感覺很GUILTY的,BLOG里竟然不放一點點和研究有關(guān)的重要工具。換了電腦之后才發(fā)現(xiàn),很多有用的鏈接都沒有COPY下來,于是,從頭開始做吧。這是Andrew給我的他的PAPER里的有關(guān)轉(zhuǎn)錄因子結(jié)合位點的數(shù)據(jù)庫,還有其他網(wǎng)友整理的,都很有用,這個星期有空再核下幾個重要基因的SNP。 PROMOTER FINDING AND ANALYS

10、IS PROGRAMS ON THE INTERNET-TRANSPLORER (TRANScription exPLORER)Dnanalyze (TF mapping)Dragon Promoter Finder 1.2 (TSS finder and promoter region analysis)FunSiteP 2.1HCtata (TATA signal prediction)McPromoter Ver.3MatInspector (Search for TF binding sites)ModelGenerator and ModelInspectorNNPP2.1 (TSS

11、 finder)PromoterInspector (Strand non-specific promoter region finder)Promoter2.0 (TSS finder)Promoter Scan II (Promoter region prediction)RGSiteScanSignal Scan (Search for Eukaryotic Transcriptional Elements)TESS (Search for Transcription Elements)TFSEARCH (Predicts TF binding sites based on TRANSF

12、AC data)TRANSFAC (TF database and a number of associated programs)TSSG and TSSWPROMOTER 2.0  http:/www.cbs.dtu.dk/services/Promoter/通常確定啟動子的算法可以分成兩種,一種根據(jù)啟動子區(qū)各種轉(zhuǎn)錄信號,如TATA 盒、CCAAT 盒,結(jié)合對這些保守信號及信號間保守的空間排列順序的識別進行預(yù)測。如PROMOTER 2.0, 用神經(jīng)網(wǎng)絡(luò)方法確定TATA 盒、CCAAT盒、加帽位點(cap site) 和GC 盒(GCbox) 的位置和距離, 識別含TATA 盒的啟

13、動子。PROMOTER SCAN      /molbio/proscan/根據(jù)轉(zhuǎn)錄因子結(jié)合部位在基因組中分布的不平衡性,將轉(zhuǎn)錄因子結(jié)合部位分布密度與TATA 盒的權(quán)重矩陣(weight matrix) 結(jié)合起來,從基因組DNA中識別出啟動子區(qū)3 。但上述程序預(yù)測的假陽性率較高,PROMOTER 210 每23kb 出現(xiàn)一個假陽性;PRO2MOTER SCAN 平均每19kb 出現(xiàn)一個假陽性。PromoterInspector  http:/www.genomatix.de/products/

14、PromoterInspector/PromoterInspector2.html另一種方法根據(jù)啟動子區(qū)序列的特征進行預(yù)測。Promo2terInspector 從一組訓(xùn)練序列中提取出啟動子區(qū)的環(huán)境特征,并將外顯子、內(nèi)含子和3端非翻譯區(qū)的特征與啟動子區(qū)加以區(qū)分,從而在基因組中確定啟動子位置FirstEF   /tools/FirstEF/近來還有一些程序?qū)⑸鲜龇椒ㄅcCpG 島(CpG islands) 信息相結(jié)合。CpG島是一段200 bp 或更長的DNA 序列,核苷酸G + C 的含量較高,并且CpG雙核苷酸的出現(xiàn)頻率占G+ C 含

15、量的50 %以上。許多脊椎動物的啟動子區(qū)都與CpG島的位置重合。FirstEF ( http :/ / rulai1cshl1org/ tools/ FirstEF/ ) 搜索通過5UTR 定位技術(shù)構(gòu)建的第一外顯子數(shù)據(jù)庫,識別第一剪切點(first splicing donor site) ,結(jié)合CpG 島信息,確定啟動子區(qū)。這種方法使預(yù)測的敏感性和特異性都明顯提高。該程序預(yù)測含CpG島的啟動子的敏感性和特異性都高于90 % ,預(yù)測不含CpG島的啟動子的精確性相對略低。TRRD 數(shù)據(jù)庫 http:/wwwmgs.bionet.nsc.ru/mgs/dbases/trrd4/  收錄了

16、真核基因調(diào)控區(qū)結(jié)構(gòu)和基因表達方式的信息,每個條目對應(yīng)一個基因。應(yīng)用權(quán)重矩陣數(shù)據(jù)庫搜索轉(zhuǎn)錄因子結(jié)合部位的程序包括SIGNAL SCAN  /molbio/signal/MatInspector  http:/www.genomatix.de/products/index.html轉(zhuǎn)錄因子搜索程序( transcriptional factor search ,TF2 SEARCH ) http:/www.cbrc.jp/research/db/TFSEARCH.html等等。盡管基于PWM 的搜索比較敏感,但它最大的缺點就是假陽性率過

17、高,在預(yù)測的結(jié)果中有很多結(jié)合部位并不真正具有生物學功能。COMPEL 數(shù)據(jù)庫  http:/compel.bionet.nsc.ru/new/index.html經(jīng)實驗確定的復(fù)合元件不多,COMPEL 數(shù)據(jù)庫中收錄了近200 條經(jīng)實驗確定的復(fù)合元件的信息。如果轉(zhuǎn)錄因子結(jié)合部位的預(yù)測結(jié)果中包含復(fù)合元件,顯然比單個元件更有可能具有生物學功能。Co - Bind 程序通過建立兩個轉(zhuǎn)錄因子結(jié)合部位的PWM 及其復(fù)合作用的模型,可以預(yù)測序列中的復(fù)合元件。還有一些程序利用COMPEL 數(shù)據(jù)庫中已知的復(fù)合元件去搜索基因組序列。Consensus /p

18、ub/consensus/AlignACE /cgi-bin/alignace.pl等是用來搜索高含量基序(overrepresented motif finding) 的一些算法,可以對一組基因簇中的基因調(diào)控區(qū)進行比較,以發(fā)現(xiàn)其中存在的高含量的基序,調(diào)控元件可能就存在于這些基序之中。摘自tjogzt's的BLOG,有些挺好的收錄  1. NCBI上的Finding Promoter (NCBI推薦的)      (http:/www.ncbi.nlm.

19、/Class/NAWBIS/Modules/DNA/dna21b.html)      Promoter Scan from the Bioinformatics and Molecular Analysis section of      NIH.      TFSearch from the Computational Biology Research Center of Japan. &

20、#160;    DRAGON Gene Start Finder from the DRAGON Genome Explorer site.      2. Promoter 2.0 Prediction Server      (http:/www.cbs.dtu.dk/services/Promoter/)      Promoter2.0 predicts transc

21、ription start sites of vertebrate PolII      promoters in DNA sequences. It has been developed as an evolution of      simulated transcription factors that interact with sequences in promoter      regions. It b

22、uilds on principles that are common to neural networks and      genetic algorithms.      3. TFSEARCH (http:/www.cbrc.jp/research/db/TFSEARCH.html)      Searching Transcription Factor Binding Sites (ver 1.3)      4. Neural Net

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論