下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、基于基因組學(xué)的日本血吸蟲序列分析平臺的構(gòu)建及應(yīng)用 08-11-07 13:15:00 編輯:studa20 作者:劉穩(wěn)升, 胡斐, 呂志躍, 鄭煥欽, 袁衡新, 吳忠道 【摘要】 【目的】 構(gòu)建基于基因組學(xué)的日本血吸蟲序列分析平臺?!痉椒ā?基于工作站和Linux操作系統(tǒng),利用
2、公開的日本血吸蟲或相關(guān)資源,收集有關(guān)生物信息學(xué)序列分析工具,并自行編寫相關(guān)軟件實現(xiàn)多種資源的有機整合?!窘Y(jié)果】 構(gòu)建了本地化的日本血吸蟲序列分析平臺,在此基礎(chǔ)上,自主設(shè)計了日本血吸蟲EST序列的電子延伸系統(tǒng)、基于日本血吸蟲EST數(shù)據(jù)庫的同源全長cDNA序列檢索系統(tǒng)和序列自動注釋系統(tǒng)等?!窘Y(jié)論】 所構(gòu)建的序列分析平臺不僅可以完成常規(guī)的序列分析工作,還可成功地完成EST序列的電子延伸,同源全長cDNA序列的檢索以及序列的自動注釋,它可對大規(guī)模日本血吸蟲序列進行快速、方便、高效的分析,為充分利用血吸蟲基因組開展疫苗研究和新藥開發(fā)提供了有效的技術(shù)手段。 【關(guān)鍵詞】 日本血吸蟲; 基因組;
3、序列分析系統(tǒng) J SUN Yat-sen Univ(Med Sci), 2007, 28(3):348-352 繼人類基因組計劃(Human Genome Project,HGP)之后,血吸蟲基因組計劃(Schistosome Genome Project,SGP)于1992年正式啟動,并得到了美國基因組研究所(The Institute for Genomic Research,TIGR)的技術(shù)支持,1994年WHO/UNDP/TDR和多個國家的實驗室參與了此項計劃,其最終目標(biāo)是找到新的候選疫苗分
4、子和治療藥物以及完全的基因組圖譜。1999年,在WHO/Word Bank/UNDP血吸蟲基因組網(wǎng)絡(luò)會議上,確定了WHO資助SGP的主要內(nèi)容,包括曼氏血吸蟲新基因的發(fā)現(xiàn)、日本血吸蟲新基因的發(fā)現(xiàn)、物理圖譜的制作、cDNA微型矩陣的制作、線粒體基因的測序以及生物信息學(xué)的研究,也確定了未來80%的TDR基因組資助獎金將用于后基因組計劃。經(jīng)過多年的努力,在cDNA文庫、EST序列分析、基因差異表達(dá)的研究、基因組文庫和基因組圖譜、血吸蟲信息學(xué)和數(shù)據(jù)庫管理等多方面取得了重要進展1-3。目前,WHO血吸蟲基因組協(xié)作組是最廣泛的國際合作組織之一,其成員國美國、英國、埃及、巴西等多參與曼氏血吸蟲基因研究計劃,而
5、中國重點開展日本血吸蟲基因組的研究工作, 研究單位包括中國南方基因組中心,中國疾病預(yù)防控制中心寄生蟲病預(yù)防控制所和中山大學(xué)中山醫(yī)學(xué)院等。最近,我國在日本血吸蟲功能基因組和蛋白質(zhì)組的工作取得了階段性重大成果4。2006年5月17日,上海市生命科學(xué)與生物技術(shù)數(shù)據(jù)中心向全世界公布了由我國自主測序的日本血吸蟲基因組工作框架圖,共計300多萬條的DNA序列5,為全球科學(xué)工作者提供服務(wù)。由于血吸蟲基因組計劃的實施,綜合利用現(xiàn)階段的大量生物信息,并從中快速挖掘有用信息,應(yīng)用于血吸蟲病的免疫診斷、疫苗研發(fā)和新藥靶點篩選等已成為可能。為此,本課題組在前期工作基礎(chǔ)上,開展了本項研究工作,旨在有力推動我國血吸蟲病的
6、科學(xué)研究和防治技術(shù)創(chuàng)新。 1 材料與方法 1.1 工作站的配置 1.2 核酸及蛋白質(zhì)序列數(shù)據(jù)庫 通過互聯(lián)網(wǎng)訪問公開數(shù)據(jù)庫,在許可的條件下下載數(shù)據(jù)信息,并進行相關(guān)的解壓縮、安裝,構(gòu)建序列分析的本地化數(shù)據(jù)庫。現(xiàn)將本實驗室收集的主要序列分析數(shù)據(jù)庫列表如表1。 1.3 核酸及蛋白質(zhì)序列分析工具
7、 通過互聯(lián)網(wǎng),下載相關(guān)基于GNU通用許可證(GPL)的,可免費使用的生物信息學(xué)分析軟件或通過與軟件作者聯(lián)系,取得相關(guān)的軟件,應(yīng)用于學(xué)術(shù)研究。本實驗平臺所安裝的軟件主要包括綜合序列分析軟件包Staden package7,EMBOSS8;兩序列比對分析軟件包BLAST 9,F(xiàn)ASTA 10;多序列比對軟件包ClustalW11,DIALIGN-T12;序列組裝拼接軟件Phrap,CAP313;重復(fù)序列屏蔽工具RepeatMasker14;基因預(yù)測軟件GenScan15;序列進化分析軟件Phylip16;綜合蛋白序列分析平臺InterProScan17。 1.4
8、 自主設(shè)計三大序列分析系統(tǒng) 2 結(jié) 果 2.1 日本血吸蟲序列分析平臺實現(xiàn)的基本功能 由表1的數(shù)據(jù)資源和所列的生物信息學(xué)分析工具搭建的序列分析平臺,可完成大多數(shù)日本血吸蟲序列分析的常規(guī)任務(wù)(具體可參考相關(guān)安裝軟件的使用文檔,說明書或參考文獻)。包括數(shù)據(jù)庫的相似性搜索(包括非冗余核酸和蛋白質(zhì)數(shù)據(jù)庫,以及日本血吸蟲EST,基因組等數(shù)據(jù)庫)、序列的比對(兩兩比對或多重比對)、蛋白質(zhì)或核酸motif,
9、 pattern等的分析、分子進化樹的構(gòu)建、密碼子使用頻率分析、B淋巴細(xì)胞抗原表位的預(yù)測、PCR引物的設(shè)計、蛋白質(zhì)二級結(jié)構(gòu)的預(yù)測、蛋白質(zhì)信號肽的預(yù)測、計算蛋白質(zhì)的等電點和相對分子量、酶切位點的識別、繪制質(zhì)粒圖譜、測序峰圖的閱讀、序列片段的組裝拼接,開放讀碼框的預(yù)測或基因結(jié)構(gòu)的預(yù)測、GO分類等。 2.2 日本血吸蟲EST序列的電子延伸系統(tǒng)的組成與應(yīng)用 此系統(tǒng)主要由相似性序列檢索模塊、序列拼接模塊、種子序列挑選模塊三部分組成,其中相似性序列檢索模塊完成日本血吸蟲EST數(shù)據(jù)庫中相似性序列的檢索,序列拼接模
10、完成相似性EST序列的拼接工作,種子序列挑選模塊則是挑選出序列拼接模塊結(jié)果中生成的包含有種子序列的contigs。最后系統(tǒng)判斷是否對種子序列進行了一次有效的延伸。通過對本實驗組獲得的552條EST進行電子延伸和自動分析,顯示487條得到不同程序的延伸,其中延伸比例超過100%的有251條,延伸前EST平均長度552 bp(中位數(shù)),延伸后序列平均長度931 bp(中位數(shù)),延伸效率為168.66%。將延伸后序列對非冗余蛋白質(zhì)序列數(shù)據(jù)庫(nr)進行檢索,可得到更多參考信息19-21。 2.3 基于日本血吸蟲EST數(shù)據(jù)庫的同源cDNA序列
11、檢索系統(tǒng)的組成與應(yīng)用 此系統(tǒng)主要由相似性序列檢索模塊、序列拼接模塊、文件拆分模塊、電子延伸模塊四部分構(gòu)成。其中相似性序列檢索模塊主要完成日本血吸蟲EST數(shù)據(jù)庫中與感興趣序列相似的EST的檢索,序列拼接模完成相似性EST序列的電子拼接,文件拆分模塊完成對電子拼接后生成的contigs 和 singlets文件拆分為單序列文件。電子延伸模塊則對上面生成的單序列文件中的序列作為種子序列,進行電子延伸,得到假想的全長cDNA。以已知的人類信號轉(zhuǎn)導(dǎo)分子序列2226條作為種子序列,對所建的系統(tǒng)進行測試,同時得到相關(guān)的生物學(xué)信息。分析結(jié)果顯示:待分析的2226條人類信號轉(zhuǎn)導(dǎo)分子cDNA序列中,有202條序列可以在血吸蟲的EST數(shù)據(jù)庫中可以找到同源性的序列,將所得同源性序列電子拼接后所得的序列
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 企業(yè)定制辦公臺式機采購合同
- 承包合同轉(zhuǎn)讓協(xié)議的變更
- 白酒二批經(jīng)銷商合同協(xié)議范本
- 居間及法律服務(wù)合同糾紛
- 街邊店鋪轉(zhuǎn)讓合同模板
- 環(huán)保廢鋼采購協(xié)議
- 項目設(shè)計招標(biāo)文件模板設(shè)計心得分享
- 網(wǎng)站故障排查服務(wù)合同
- 電梯設(shè)備運營服務(wù)合同
- 質(zhì)物借款責(zé)任
- 安徽省職工帶薪年休假實施細(xì)則完整版
- 低壓送電施工方案
- 2022-2023學(xué)年四川省眉山市小學(xué)語文三年級上冊期末提升模擬題
- 廣州中醫(yī)藥大學(xué)2022學(xué)年第一學(xué)期《護理學(xué)基礎(chǔ)》期末考試附答案
- 五年級上冊數(shù)學(xué)試題-《組合圖形的面積》測試卷A北師大版 (含答案)
- GB/T 16553-2003珠寶玉石鑒定
- 中醫(yī)婦科常用湯頭歌訣
- 藝術(shù)人才培養(yǎng)資助項目申報表
- 第11章樓蓋資料課件
- 動態(tài)心電圖報告解讀及臨床應(yīng)用醫(yī)學(xué)課件
- 高中數(shù)學(xué)超幾何分布與二項分布優(yōu)秀課件
評論
0/150
提交評論