前列腺癌遺傳易感基因的數(shù)據(jù)庫查找比對分析_第1頁
前列腺癌遺傳易感基因的數(shù)據(jù)庫查找比對分析_第2頁
前列腺癌遺傳易感基因的數(shù)據(jù)庫查找比對分析_第3頁
前列腺癌遺傳易感基因的數(shù)據(jù)庫查找比對分析_第4頁
前列腺癌遺傳易感基因的數(shù)據(jù)庫查找比對分析_第5頁
已閱讀5頁,還剩5頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、前列腺癌遺傳易感基因的數(shù)據(jù)庫查找比對分析年級:2005 姓名:呂曉敏應(yīng)用生物信息學(xué)的方法對國人和歐美人的前列腺癌易感基因之間的異同點進(jìn)行分析,從而找出前列腺癌發(fā)病的可能發(fā)病機制。方法:我們首先在OMIM 數(shù)據(jù)庫中查找得到歐美人的前列腺癌相關(guān)基因的基因序列,然后將其與中國人的基因組序列進(jìn)行BLAST 同源序列比對,找出這些序列之間具體的堿基的相同點與不同,用于研究國人和歐美人在前列腺癌發(fā)病率的不同。一. 實驗背景1前列腺癌的研究現(xiàn)狀前列腺癌是老年男性常見的惡性腫瘤。在我國,前列腺癌的發(fā)病率雖遠(yuǎn)低于西方國家,但近年來隨著飲食結(jié)構(gòu)和生活方式的西化,其發(fā)病率呈明顯上升趨勢 。由于大規(guī)模PSA (Pro

2、state Specific Antigen,PSA )普查未能廣泛接受和使用,血清PSA 水平在前列腺癌診斷方面的局限性,以及個體之間自然病程的差異,前列腺癌臨床確診患者以進(jìn)展期為主。內(nèi)分泌治療仍為前列腺癌的主要治療方式,內(nèi)分泌治療最終將導(dǎo)致前列腺癌發(fā)展為激素非依賴性。由于前列腺癌發(fā)病機制尚不清楚,目前臨床上對于前列腺癌發(fā)病預(yù)測和治療仍然存在著一定的滯后和盲目性。前列腺癌的發(fā)生發(fā)展與遺傳因素和生活方式密切相關(guān)。在我國,生活方式西化和脂肪攝入量的持續(xù)增加導(dǎo)致前列腺癌危險因素和保護(hù)因素失衡是前列腺癌發(fā)病的重要環(huán)境因素,而個體遺傳學(xué)上的差異是前列腺癌發(fā)生的必要條件。北歐一項關(guān)于443,788對雙胞

3、胎的研究表明,遺傳因素對前列腺癌發(fā)生的影響度達(dá)42。對歐美人前列腺癌的全基因組關(guān)聯(lián)研究(Genome-Wide Association Studies,GWAS 發(fā)現(xiàn),有多個基因位點與前列腺癌的發(fā)病相關(guān),這些位點分別位于第3, 6, 7, 10, 11, 19 和 X 染色體。有研究者選擇2893例瑞典前列腺癌患者和1781例正常人對照的基因組進(jìn)行研究,分析了5個染色體區(qū)(3個位于8q24,2個位于17q )中與前列腺癌發(fā)病有關(guān)的16個SNP (Single Nucleotide Polymorphisms, SNP),發(fā)現(xiàn),聯(lián)合應(yīng)用其中5個SNP 與家族史可以預(yù)測前列腺癌發(fā)病的危險程度。而且

4、這種預(yù)測與PSA 值無關(guān),也就是說,即使血清PSA 水平很低,只要他攜帶一個或多個前列腺癌相關(guān)的基因型,就存在前列腺癌發(fā)病的高危險性。全基因組關(guān)聯(lián)研究表明,遺傳性的易患前列腺癌體質(zhì)是由較低外顯性基因引起的。有報道指出,亞裔美國人前列腺癌的發(fā)病率顯著高于本國人,但總的前列腺癌發(fā)病率仍僅為美國白人的一半。提示,前列腺癌發(fā)病不僅與環(huán)境因素有關(guān),遺傳因素同樣發(fā)揮著重要作用。因此,明確前列腺癌的遺傳易感基因?qū)η傲邢侔┑陌l(fā)病預(yù)測和預(yù)后判斷具有重要意義。盡管年齡、種族和家族史是三個明確的前列腺癌發(fā)病危險因素,但是我國前列腺癌發(fā)病中具有種族特點的遺傳基因卻尚未得到確認(rèn)。從1971年美國總統(tǒng)尼克松發(fā)起對“對癌癥

5、的戰(zhàn)爭(War on Cancer)”以來,癌癥研究雖然取得了重要進(jìn)展,但是我們并沒有贏得這場戰(zhàn)爭。一個重要原因就是我們尚缺乏以證據(jù)為基礎(chǔ)的癌癥預(yù)防戰(zhàn)略。尋找前列腺癌遺傳易感基因是前列腺癌研究的重要戰(zhàn)略之一。目前,人類疾病的基因組學(xué)研究已進(jìn)入到多基因疾病這一難點。由于多基因疾病不遵循孟德爾遺傳規(guī)律,難以從一般的家系遺傳連鎖分析取得突破。這方面的研究需要在人群和遺傳標(biāo)記的選擇、數(shù)學(xué)模型的建立、統(tǒng)計方法的 改進(jìn)等方面進(jìn)行艱苦的努力。近來也有學(xué)者提出,用比較基因表達(dá)譜的方法來識別疾病狀態(tài)下基因的激活或受抑。實際上,“癌腫基因組解剖學(xué)計劃(Cancer Genome Anatomy Project,

6、CGAP)”就代表了在這方面的嘗試。從上述情況可以發(fā)現(xiàn),國人和歐美人在前列腺癌發(fā)病率上的巨大差異, 遺傳因素可能是產(chǎn)生這一差異的重大影響因素。所以,我們有必要利用人類基因組計劃的成果,從基因的水平上對國人和歐美人的前列腺癌遺傳相關(guān)基因進(jìn)行比較,以得出前列腺癌的可能的遺傳影響機制。二. 實驗原理GCG 及EMBOSS 等軟件包中包含有五種BLAST :BLASTP 是蛋白序列到蛋白庫中的一種查詢。庫中存在的每條已知序列將逐一地同每條所查序列作一對一的序列比對。BLASTX 是核酸序列到蛋白庫中的一種查詢。先將核酸序列翻譯成蛋白序列(一條核酸序列會被翻譯成可能的六條蛋白),再對每一條作一對一的蛋白

7、序列比對。BLASTN 是核酸序列到核酸庫中的一種查詢。庫中存在的每條已知序列都將同所查序列作一對一地核酸序列比對。TBLASTN 是蛋白序列到核酸庫中的一種查詢。與BLASTX 相反,它是將庫中的核酸序列翻譯成蛋白序列,再同所查序列作蛋白與蛋白的比對。TBLASTX 是核酸序列到核酸庫中的一種查詢。此種查詢將庫中的核酸序列和所查的核酸序列都翻譯成蛋白(每條核酸序列會產(chǎn)生6條可能的蛋白序列),這樣每次比對會產(chǎn)生36種比對陣列。通常根據(jù)查詢序列的類型(蛋白或核酸)來決定選用何種BLAST 。假如是作核酸核酸查詢,有兩種BLAST 供選擇,通常默認(rèn)為BLASTN 。如要用TBLASTX 也可,但記

8、住此時不考慮缺口。BLAST 適用于本地查詢??梢韵螺d公共數(shù)據(jù)庫,對于該數(shù)據(jù)庫的更新和維護(hù)是必不可少的。如果要直接到網(wǎng)上查詢也可以(即Net Blast),但記住如果你認(rèn)為自己的序列很有價值的話,還是謹(jǐn)慎為宜。我們在實驗中用到的BLAST 比對就是BLASTN ,即為核酸-核酸查詢,通過對國人和歐美人同一基因的BLAST 比對可以找出兩條序列間的不同位點及各位點不同堿基的個數(shù)。三實驗步驟1. 前列腺遺傳相關(guān)基因的查找在OMIM 數(shù)據(jù)庫中查找前列腺相關(guān)基因,以prostate cancer為檢索詞,并將查詢范圍限定在titles 上,便可以找到相應(yīng)的前列腺遺傳相關(guān)基因,如圖1 圖1 OMIM搜索

9、歐美人前列腺癌遺傳相關(guān)基因結(jié)果將所查找得到的序列列表顯示如表1,表中包括基因的名字,MIM 號以及該基因所在的基因位置。表1 歐美人前列腺癌相關(guān)基因序號基因名 MIM 號 基因位置序號 基因名 MIM 號 基因位置1TMEM16G 605096 2q37.3 14 SYT7 604146 11q13 2STEAP2 605094 7q21 15 HPC1 601518 1q25 3PCA3 604845 9q21-q2216 HPC7 610321 15q12 4PSMP 612191 9p13.3 17 HPC4 608658 7p11-q21 5HPC11 611955 17q12 18

10、HPC8 602759 1q42.2-q436HPC13 611928 10q11.2 19 HPCX1 300147 Xq27-q287HPC12 611868 2p15 20 HPC15 311959 19q13.4 8PDZD2 610697 5p13.2 21 HPC14 611958 11q13 9ALKBH3 610603 11p11.1222 HPC9 610997 17q21-q2210TBC1D3B 610144 17q12 23 HPC6 609558 22q12.3 11HPC3 608656 20q13 24 HPC5 609299 3p2612ELAC2 605367

11、 17q11 25 HPC3 608656 20q13 13 SLC45A3 605097 1q32.1 26 HPCX2 300704 Xp11.22 在表1所示的序列中,只有15條序列完成了序列比對,如表2所示: 表2-2 完成比對的前列腺癌相關(guān)基因 序號 基因名 MIM號 基因位置1 TMEM16G 605096 2q37.3 2 STEAP2 605094 7q21 3 PCA3 604845 9q21-q22 4 PSMP 612191 9p13.3 5 HPC11 611955 17q12 6 HPC13 611928 10q11.2 7 HPC12 611868 2p15 8 P

12、DZD2 610697 5p13.2 9 ALKBH3 610603 11p11.12 10 TBC1D3B 610144 17q12 11 HPC3 608656 20q13 12 ELAC2 605367 17q11 13 SLC45A3 605097 1q32.1 14 SYT7 604146 11q13 15 HPC1 601518 1q25 除以上序列外,還有其他部分基因由于序列比對上的困難而沒有完成比對,將這些基因列舉如表3所示: 表3 比對不完全的前列腺癌相關(guān)基因總結(jié) 序號 基因名 MIM號 基因位置1 HPC7 610321 15q12 2 HPC4 608658 7p11-q

13、21 3 HPC8 602759 1q42.2-q43 4 HPCX1 300147 Xq27-q28 5 HPC15 311959 19q13.4 6 HPC14 611958 11q13 7 HPC9 610997 17q21-q22 8 HPC6 609558 22q12.3 9 HPC5 609299 3p26 10 HPC3 608656 20q13 11 HPCX2 300704 Xp11.222 基因序列比對在表1所示的各個基因序列中選出兩個基因STEAP2與PCA3按前述的BLAST 序列比對方法進(jìn)行序列比對,尋找國人和歐美人各基因的不同點。1) STEAP2在NCBI 上查找

14、歐美人的STEAP2的基因序列,圖2,并將其與國人基因組序列進(jìn)行BLAST 序列比對。 圖2 歐美STEAP2基因序列序列比對的結(jié)果如圖3所示: 圖3 國人和歐美人STEAP2基因序列比對結(jié)果從圖3中可以發(fā)現(xiàn),兩條序列共有9處不同,結(jié)果見表4。2)PCA3在NCBI 上查找歐美人的PCA3基因序列,見圖4,并將其與國人的基因序列進(jìn)行BLAST 序列比對。 圖4 歐美人PCA3的基因序列序列比對的結(jié)果如圖5所示: 圖 5 國人和歐美人 PCA 基因序列的比對結(jié)果 從圖 5 中可以發(fā)現(xiàn),兩條序列間共有 9 處不同,結(jié)果見表 4。 3 實驗結(jié)果 通過序列的 BLAST 比對, 我們得出了國人和歐美人兩個基因序列不同的具體情況, 并總結(jié)這些差異得到結(jié)果,如表 4 所示。 表 4 國人和歐美人前列腺癌相關(guān)基因序列異同點總結(jié) 序號 2 STEAP2 基因名 9 差異位點 個數(shù) 差異位點序列

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論