版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、一步一步教你使用 NCBI 查找DNA、mRNA、cDNA、Protein、promoter、引物設(shè)計、BLAST 序列比對等最近看到很多戰(zhàn)友在論壇上詢問如何查詢基因序列、如何進行引物設(shè)計、如何使用BLAST 進行序列比對,這些問題在 NCBI 上都可以方便的找到答案?,F(xiàn)在我就結(jié)合我自己使用 NCBI的一些經(jīng)歷(經(jīng)驗)跟大家交流一下 BCBI 的使用。希望大家都能發(fā)表自己的使用心得,讓我們共同進步! 我分以下幾個部分說一下 NCBI 的使用: Part one 如何查找基因序列、mRNA、Promoter Part two 如何查找連續(xù)的 mRNA、cDNA、蛋白序列 Part three 運
2、用 STS 查找已經(jīng)公布的引物序列 Part four 如何運用 BLAST 進行序列比對、檢驗引物特異性 特別感謝本版版主,將這個帖子置頂! 從發(fā)帖到現(xiàn)在,很多戰(zhàn)友對該帖給與了積極的關(guān)注,在此向給我投票的(以及想給我投票卻暫時不能投票的)各位戰(zhàn)友表示真誠的感謝,謝謝各位戰(zhàn)友! 請大家對以下我發(fā)表的內(nèi)容提出自己的意見。關(guān)于NCBI 其他方面的使用也請水平較高的戰(zhàn)友給予補充 First of all,還是讓我們從查找基因序列開始。 第一部分 利用Map viewer 查找基因序列、mRNA 序列、啟動子(Promoter) 下面以人的 IL6(白細(xì)胞介素 6)為例講述一下具體的操作步驟 1 打開
3、Map viewer 頁面, 網(wǎng)址為: 在 search 的下拉菜單里選擇物種,for 后面填寫你的目的基因。操作完畢如圖所示: 2點擊“GO”出現(xiàn)如下頁面: 3 在步驟二圖示的右下角有一個Quick Filter,下面是讓你選擇的幾個復(fù)選框, 在Gene前面的小方框里打勾,然后點擊Filter. 出現(xiàn)下圖: 說明一下:1、染色體的紅色區(qū)域即為你的目的基因所處位置。2、下面參考序列給出了三個,是不同的部門做出來的,經(jīng)我驗證,序列有微小的差異,但總體來說基本相同。盡管你分別點擊后,序列代碼、序列代碼等有所差異,但堿基基本一致,不影響大家研究分析序列。現(xiàn)在普遍采用的是最上面的那個序列,這一條是世界
4、范圍的生物科學(xué)家用計算機合成的一個序列。我也推薦大家使用這個序列。4點擊上述三條序列第一條序列(即 reference)對應(yīng)的"Genes seq",出現(xiàn)新的頁面,頁面下方為:5點擊上圖出現(xiàn)的“Download/View Sequence/Evidence ”,即下載查看序列等功能,結(jié)果如圖所示:先對上面這張圖做點簡要的說明,在 Sequence Format(序列輸出格式)后面是一個下拉式選擇菜單,默認(rèn)的為 FASTA 格式,還有一個是 GenBank 格式。我推薦大家選擇 GenBnak格式,因為這個格式提供了很多該基因的信息,而 FASTA格式只有基因序列。 6在 S
5、equence Format 后選擇 GenBank,然后點擊下面的 Display,目的基因的相關(guān)信息和序列就出現(xiàn)在眼前了。點擊后如圖所示(網(wǎng)頁較大,只抓取一小部分以作示范) :在上述打開的網(wǎng)頁中,你可以看到基因長度,基因序列,以及這個基因是如何被報道出來的等各種信息。 你會看到: mRNA join(3598.3678,3841.4031,5090.5203,5911.6057, 7803.8394) 這代表了從基因的 3598位開始就是轉(zhuǎn)錄區(qū)了, 即我們常說的 mRNA 片斷, 由于內(nèi)含子的存在,所以 mRNA 在DNA 序列上分成了幾段。 CDS join(3660.3678,3841
6、.4031,5090.5203,5911.6057, 7803.7970) CDS 代表編碼序列,即蛋白編碼區(qū)是從 3660 開始的(ATG) ,由于剪接作用所以 CDS 區(qū)也是不連續(xù)的。 說到這里,可能很多朋友都已經(jīng)明白了 promoter 即啟動子區(qū)域在哪里了。但我還是再嘮叨幾句:轉(zhuǎn)錄起始位點前面是基因的調(diào)控區(qū),啟動子區(qū)沒有明顯的位置定義,大家也只是猜測它的大體位置,如果你要研究 promoter 區(qū)的話,建議你選擇轉(zhuǎn)錄起始位點前的 2000個堿基進行研究,一般默認(rèn)的是這樣。當(dāng)然你如果覺得長度太長不好研究的話,也可以只研究-1000 到0這一千個堿基,因為一般情況下,啟動子區(qū)的變異都在這個
7、區(qū)域內(nèi)。 這樣大家就可以找到自己的目的基因序列和啟動子了,這種方法可能使用的人不是很多,但我個人比較喜歡,因為它最大的優(yōu)點是可以找到啟動子區(qū)域和其他調(diào)控區(qū)域。希望大家可以發(fā)帖交流,讓我們把 NCBI 用的更好! 6 第二部分 如何查找連續(xù)的mRNA、cDNA、蛋白序列(依然以人類的 IL6 為例) 1進入NCBI 主頁: 在 search 后面選擇 Gene,在 for 后面填寫需要查找的基因的名字。如圖所示: 出現(xiàn)了很多基因序列,在每個序列的右邊還有“Order cDNA clone” 的鏈接,這些序列中有些序列是跟你的目的基因同名的,有些是別名(Other Aliases)與你的目的基因一
8、致,根據(jù)每個序列的介紹認(rèn)真選擇你的目的基因。上圖中我需要的 IL6 是標(biāo)號為2的序列。 2.1 查找 cDNA 序列 2.1.1 點擊Order cDNA clone, 出現(xiàn)目的頁面如圖所示:2.1.2 點擊Clone Sequence 后面的鏈接即可得到cDNA 序列。點擊后如圖所示(只抓取其中一部分)2.2 查找 mRNA、蛋白序列 回到步驟 1 點擊“Go”之后出現(xiàn)的頁面,點擊目的基因的名字,出現(xiàn)以下頁面 (只抓取相關(guān)部分):頁面的下半部分,即可以獲取 mRNA和蛋白序列的部分:找到“NCBI Reference Sequences (RefSeq)”,它分為幾個板塊,第一個“mRNA
9、and Protein ”區(qū)可以讓我們找到連續(xù)的編碼 mRNA 序列和蛋白序列。在 mRNA and Protein下面有兩個序列代碼(中間劃有一個箭頭) ,這代表了 mRNA序列和蛋白序列。分別點擊就可以得到相應(yīng)的序列頁面。點擊后如圖所示,mRNA 序列:NCBI Reference Sequences (RefSeq)的第二個板塊是 Reference assembly,它下面顯示的是 Genomic ,點擊 Genomic 下面Reference assembly 對應(yīng)的 Genbank 或 FASTA 即可出現(xiàn)編碼的 DNA 序列(注意:只是編碼序列,其中包括內(nèi)含子,但一般沒有 5非編
10、碼區(qū)) 。一步就不做貼圖演示了吧, 呵呵。 這樣我們就可以找到基因的 cDNA 序列、連續(xù)的編碼 mRNA 序列、蛋白序列以及含有內(nèi)含子的編碼DNA 序列了。相信這些操作對很多戰(zhàn)友還是有用的。 如果大家有更好的方法,歡迎發(fā)帖交流! 友情提示:在 NCBI 里打開的每一個頁面都會給我們提供大量的信息,大家不妨好好看看,可能會有令我們驚喜的收獲! 最后嘮叨一句: 最近我實驗比較忙, 只能在深夜發(fā)帖, 可能要過幾天再發(fā)第三部分Part three 運用STS 查找已經(jīng)公布的引物序列,希望“期待下集”的朋友可以理解。第三部分 運用STS 查找已經(jīng)公布的引物序列 STS,序列標(biāo)簽位點(Sequence
11、Tagged Site):一段短的DNA 序列(200500 個堿基對),這種序列在染色體上只出現(xiàn)一次,其位置和堿基順序都是已知的。在PCR 反應(yīng)中可以檢測處STS 來,STS 適宜于作為人類基因組的一種地標(biāo),據(jù)此可以判定DNA 的方向和特定序列的相對位置。以上內(nèi)容基本是STS 的定義,我主張活學(xué)活用,下面就介紹一下我個人用STS 數(shù)據(jù)庫查找引物的一點經(jīng)驗。還是使用人的IL6 基因為例,呵呵1 打開 NCBI 主頁,在 Search 后面的下拉菜單選擇 UniSTS,在 FOR 后面填寫目的基因。 操作完畢如圖所示這是你會發(fā)現(xiàn) NCBI 又提供了很多序列,下面我們還是要初步篩選我們需要的序列。
12、2根據(jù)物種、目的引物所在染色體的位置等選擇相應(yīng)序列(可能不只一個) ,點擊。 下面以點擊第一個進入的畫面為例。 你會發(fā)現(xiàn)這個頁面直接就給出了引物序列,PCR之后的片段長度也是給了的(247bp) 。下面還有很多相關(guān)的信息 3點擊GeneBank Accession 后面的代碼,進入下一個頁面。??!前后引物都呈現(xiàn)在眼前了,還有反應(yīng)體系和反應(yīng)條件!其中 Primer A 是前引物序列,Primer B 則是后引物序列,并且給出了他們在 DNA 序列中的位置。有興趣的朋友可以在序列中找一下,是可以找到的, 不過要注意,PCR 是雙鏈擴增,在序列中可以直接找到的是 Primer A 的原序列 和 Pr
13、imer B的互補序列。 在步驟二里面我只點開了一個序列,繼續(xù)打開其他的可能還會有對自己有用的引物,不過這要你自己慢慢發(fā)掘了。 這種尋找引物的方法有點投機取巧的味道,實用程度不是很高,但如果這里面恰好有你想 P 的片段的話,恭喜你,這些引物都是很成熟的引物,可以直接拿過來使用了。 如果想尋找引物,大家可以查閱相關(guān)論文,已經(jīng)報道的引物我們?yōu)槭裁床挥媚??!既省時間,可靠性又強。 如果這兩種方法都不能找到你需要的引物的話, 那就自己設(shè)計吧, 建議使用 Primer 5 和 Oligo。引物設(shè)計的詳細(xì)內(nèi)容我在這里就不多說了,推薦兩個帖子給大家看一下,第一個是本版版主 liuzeyi2002 發(fā)起的,內(nèi)
14、容很豐富,很值得學(xué)習(xí),另一個則是我發(fā)的。 bs/post/view?bid=64&id=9517792&sty=1&tpg=1&age=0 第四部分 如何運用 BLAST 進行序列比對、檢驗引物特異性 提到序列比對,絕大多數(shù)戰(zhàn)友都會想到 BLAST,但 BLAST 的使用確實又是一個很大的難題, 因為他的功能比較強悍, 里面涉及到的知識比較多, 而且比對結(jié)束后輸出的結(jié)果參數(shù) (指標(biāo))又很多。如果把 BLAST 的使用詳細(xì)的都講出來,我想我發(fā)帖發(fā)到明天也發(fā)不完,更何況我自己也不是完全懂得 BLAST 的使用。 所以我在這里也就“畫龍點睛”以比對核酸序列為例來給大家
15、介紹一下 BLAST 的使用, 也算是 BLAST 的入門課程吧。 請看帖的戰(zhàn)友好好體會,如果你用心看,在看帖完畢之后 BLAST 的基本使用(包括其他序列的比對)應(yīng)該沒有問題了。1打開BLAST 頁面, 打開后如圖所示:對上面這個頁面進行一下必要的介紹: BLAST 的這個頁面主體部分(左面)包括了三部分:BLAST Assembled Genomes、Basic BLAST、Specialized BLAST。相信大家可以看懂這三個短語的意思,我就不多說了;我要說的是,可以認(rèn)為這是三種序列比對的方法,或者說是 BLAST 的三條途徑。 第一部分 BLAST Assembled Genome
16、s 就是讓你選擇你要比對的物種,點擊相應(yīng)物種之后即可進入比對頁面。 第二部分 Basic BLAST 包含了 5 個常用的 BLAST,每一個都附有簡短的介紹。 第三部分 Specialized BLAST 是一些特殊目的的 BLAST,如 IgBLAST、SNP 等等,這個時候你就需要在 Specialized BLAST部分做出適當(dāng)?shù)倪x擇了。 總之, 這是一個導(dǎo)航頁面, 它的目的是讓你根據(jù)自己的比對目的選擇相應(yīng)的 BLAST 途徑。 下面以最基本的核酸序列比對來談一下 BLAST的使用, 期間我也會含沙射影的說一下其他序列比對的方法。2 點擊Basic BLAST部分的nucleotide
17、 blast 鏈接到一個新的頁面。打開后如圖所示:介紹一下上述頁面: Enter Query Sequence 部分是讓我們輸入序列的,你可以直接把序列粘貼進去,也可以上傳序列,還可以選擇你要比對的序列的范圍(留空就代表要比對你要輸入的整個序列) 。Job Title 部分還可以為本次工作命一個名字。 Choose Search Set 部分是讓我們選擇要與目的序列比對的物種或序列種類(genome DNA、mRNA 等等) 。如果是人或老鼠的話,就可以直接選擇了如果是其他物種就要選擇“others”了,這時候網(wǎng)頁會主動跳出一個下拉對話框和一個輸入式對話框,你可以分別選擇和輸入要跟你的序列比對
18、的序列種類和物種。下面的 Entrez Query 可以對比對結(jié)果進行適當(dāng)?shù)南拗啤?Program Selection 部分其實是讓我們選擇本次比對的精確度,種內(nèi)種間等等。 在 BLAST 按鈕下面有一個“Algorithm parameters” ,這是參數(shù)設(shè)置選項,一般用戶使用不到此項,所以它比較隱蔽,點擊,原網(wǎng)頁下方即可增加了 Algorithm parameters 的內(nèi)容。大部分戰(zhàn)友都用不到更改這里面的選項,我也不多說了,有興趣的朋友可以自己研究一下。3依次填寫上述網(wǎng)頁必須部分,點擊 BLAST 按鈕后,出現(xiàn)如下界面(只截取其中一部分) :出現(xiàn)的這個結(jié)果頁面信息含量非常大,如果我們用心觀察,還是可以發(fā)現(xiàn)其中的一些主要指標(biāo)的。列舉上圖也是為了給大家展示一下這些評價標(biāo)準(zhǔn)。其中 Description 部分推
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 長沙商貿(mào)旅游職業(yè)技術(shù)學(xué)院《機械制圖與實驗》2023-2024學(xué)年第一學(xué)期期末試卷
- 配電網(wǎng)數(shù)據(jù)采集與分析
- 述職報告:技術(shù)領(lǐng)先之道模板
- 職業(yè)導(dǎo)論-2020年房地產(chǎn)經(jīng)紀(jì)人《職業(yè)導(dǎo)論》真題匯編
- 名畫欣賞與創(chuàng)作模板
- 公司年年會主持稿
- 二零二五年電子商務(wù)平臺入駐合作協(xié)議范本3篇
- 二零二五版北京車牌租賃市場推廣合作合同規(guī)范范本9篇
- 二零二五版基站建設(shè)場地使用權(quán)及通信網(wǎng)絡(luò)優(yōu)化合同2篇
- 吉林油田十二中2024-2025學(xué)年七年級上學(xué)期期末語文試卷(含答案)
- 分期還款協(xié)議書
- 小區(qū)住戶手冊范本
- ??低?視頻監(jiān)控原理培訓(xùn)教材課件
- 《鄭伯克段于鄢》-完整版課件
- 土壤肥料全套課件
- 畢業(yè)生延期畢業(yè)申請表
- 學(xué)校6S管理制度
- 肽的健康作用及應(yīng)用課件
- T.C--M-ONE效果器使用手冊
- 8小時等效A聲級計算工具
- 人教版七年級下冊數(shù)學(xué)計算題300道
評論
0/150
提交評論