基因家族分析_第1頁
基因家族分析_第2頁
基因家族分析_第3頁
基因家族分析_第4頁
基因家族分析_第5頁
已閱讀5頁,還剩53頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

基因家族分析——挖掘與物種特性相關(guān)的生物學問題張

龍華中農(nóng)業(yè)大學&廣東省農(nóng)科院2539570165@qq.cm基本內(nèi)容一、獲取目標物種基因二、目標物種基因基本信息的獲取(命名、理化性質(zhì)、亞細

)●蛋白物理化學性質(zhì)分析/protparam/●亞細胞定位ttp://www.csbio.sjtu.e/bioinf/plant-multi/#一般將以上信息匯總在一張

表格中在文章中展示。alP/三、構(gòu)建系統(tǒng)發(fā)育樹——構(gòu)建、評估、解讀1、構(gòu)建·

序列比對,選擇保守區(qū)域·

有根樹or

無根樹:一般由于信息不足,采用無根樹·

建樹方法的選擇:NJ

法(常用,遠緣)、ML

法(進化模型)、MP

(近緣)等2、評估自展檢驗(Bootstrap

method)法,檢驗次數(shù)一般1000次,可將分支上的

百分數(shù)視為這支結(jié)果的可信度。三、構(gòu)建系統(tǒng)發(fā)育樹——構(gòu)建、評估、解讀3、解讀闡明系統(tǒng)進化關(guān)系。注意:系統(tǒng)發(fā)育樹并不能

確切指示進化方向FpTPS1pTF

S120eGpTPS

522GppsiAGo輸入的序分7進化關(guān)系,數(shù)字是評估,長度是進化距離亞家族分類ss2四、染色體定位分析1、基因主要分布于哪條染色體?2、是否能形成基因簇?基因簇的形成一般與基因家族的來源和特定功能有關(guān)。T

patop名言名名的

師0pToptmTPS4五

、motif分析(保守基序分析)在文章中,motif

分布圖通常與基因家族進化樹合并,這樣有助于直觀查看不同分支保守和特異性motif。如果對某些motif

感興趣,還可進一

步用CDD注釋motif

功能??梢娒恳煌茰y同一亞家族成員有類似的功能亞家族成員中Motif

組成和

排列順序的與功能相關(guān)六、基因結(jié)構(gòu)分析了解基因家族成員的基本分類信息、提供對某些基因家族內(nèi)進化關(guān)系的見解。在文章中,基因結(jié)構(gòu)圖通常與基因家族進化樹合并,這樣有助于直觀查看不同分支在基因結(jié)構(gòu)上的保守性和特征。同一亞家族成員的基因結(jié)構(gòu)是否類似,反證建樹是否可靠。UTR(非編碼區(qū)、內(nèi)含子組)、CDS

(編碼區(qū)、外顯子組)數(shù)量與基因結(jié)構(gòu)、功能有關(guān)七、基因復制和共線性分析闡明目標物種基因家族的潛在進化機制,有無串聯(lián)重復和大片段復制。研

究目標物種和其他物種基因家族成員之間的直系同源對關(guān)系。一般來說,基因長度和相似性大于70%則為基因復制;兩個重復基因的物理間隔小于100kb

且被少于5個基因分隔,則為串聯(lián)重復基因。紅線越多,直系同源基因?qū)υ蕉?,親緣關(guān)系越近,基因功能越相似紅色:高表達藍色:低表達一般有以下幾種類型:·不同組織表達分析:根、莖、葉·不同時間表達分析:1d、2d、3d·不同處理表達分析:干旱、鹽堿、水漬

明確基因家族的表達情況八

、基因表達分析基因家族的表達分析與基因功能的關(guān)系最緊密九、啟動子分析獲得基因家族功能相關(guān)的上游調(diào)控通路或因子,或響應的上游信號。是否含有某些脅迫響應順式元件或激素響應相關(guān)的基因。十、其他分析1、蛋白互作網(wǎng)絡分析:·分析家族成員之間的蛋白互作情況,分析是否需要形成同源或異源二聚體或多聚體來發(fā)揮功能;·

目標基因家族蛋白發(fā)揮作用時是否需要和其他蛋白形成復合體;·分析目標基因家族蛋白的上下游互作調(diào)控蛋白,比如轉(zhuǎn)錄因子通過結(jié)合基因啟

動子來調(diào)控基因表達,或者激酶通過蛋白互作磷酸化該蛋白從而進行信號轉(zhuǎn)導;·可以靶向下游基因發(fā)揮作用,比如酶催化底物蛋白進行生化反應等2、蛋白domian

比對分析和可視化3、蛋白3D結(jié)構(gòu)分析和可視化4、基因家族特殊結(jié)構(gòu)域分析基因家族分析簡明教程1、獲取目標物種基因2、目標物種目標基因家族鑒定3、基因家族成員理化性質(zhì)分析4、亞細胞定位預測5、染色體定位分析6、系統(tǒng)進化分析7、基因結(jié)構(gòu)分析8、motif分析9、啟動子分析10、基因共線性分析11、其他分析目

錄已超鏈接,點擊跳轉(zhuǎn)1.基因家族的鑒定·1.1獲取參考基因組信息NCBI(https://www.ncbi.nlm.nih.gov)在此輸入物種拉丁名+基因家族名稱如:TriticumaestivumTCP1.2獲取目標物種相關(guān)基因組數(shù)據(jù)(

DNA,cDNA,CDS,Proteinsequence,Genesets(GTF&GFF3)等)——使用EnsemblPlants

數(shù)據(jù)庫http://plants.ensembl.org/info/data/ftp/index.htmlLoginRegister2

基因家族成員鑒定:hummer

鑒定在Pfam網(wǎng)站https:

//pfam.xfam.org

/下載隱馬爾可夫模型2

.2在Pfam

網(wǎng)站https://pfam.xfam.org

/下載隱馬爾可夫模型12.3

以下載好的HMM

模型向目標物種基因組序列(蛋白)搜索,以篩選得到大

致的基因家族成員(候選基因)。hmmer程序/

下的子程序hmmsearch2.4.1將候選基因提交到

NCBI

中的

Batch

CDDsearch

Pf

am

數(shù)據(jù)庫比對,驗證是否具有目標基因特征,刪除假陽性基因。

首先是Batch

CDD

search?!ご蜷_NCBI——CDD——batch—CD—search·輸入剛剛提取得到的蛋白序列,點擊Browse

result,全選序列:2.4.2再點擊show

selected

queries,查看蛋白結(jié)構(gòu)域?qū)⒉缓心?/p>

的基因家族結(jié)構(gòu)域的蛋白刪除,最后得到的蛋白序列即為該基因家族的序

列?;蛘呤褂肨Btools

中的VisualizeNCBICDDDomainPattern

可視化結(jié)構(gòu)域圖。2.5.1Pfam數(shù)據(jù)庫驗證比對(

http://pfam-

legacy.xfam.org/search)2.5.2.Pfam結(jié)果可視化2.6根據(jù)驗證結(jié)果確定基因,除去以下序列,最終得到確定的基因序列·無典型結(jié)構(gòu)域·結(jié)構(gòu)不完整·冗余序列3.1

蛋白物理和生化特征分析,預測蛋白質(zhì)分子量、等電點、相對分子質(zhì)量、穩(wěn)定性等(/protparam/)。只輸入氨基酸序列即可,單個依次分析3.2

結(jié)果解讀ExpasyProtParamHomel

Contact Molecular

weight:29563.71

Theoretical

pI:6.124

亞細胞定位預測(http://wwW.csbio.sjtu.edu.cn/bioinf/plant-multi/#)5

基因位置分析及可視化6.

進化樹構(gòu)建6.1

目標物種基因家族文件與擬南芥等參考物種基因家族文件合并。

將兩個序列信息文件粘貼復制進一個新的fasta

文件中即可6

.2

MEGA比對,將新合并的fasta

文件拖入ME

GA軟件中,選擇對齊進入。進化樹構(gòu)建6.3

分析,完成后關(guān)閉當前頁面網(wǎng)

Molecular

EvolutionaryGenetics

Analysis□

×File

Analysis

Help點擊建樹DATA進化樹構(gòu)建6.4

建樹,一般選擇NJ

法進化樹構(gòu)建6.5

導出建樹文件,并保存。其他分析有用進化樹構(gòu)建6

.6進化樹美化(https://evolgenius.info//evolviewv2/#login)

-進化樹構(gòu)建6、進化樹美化。改變樹各部分顏色,可點擊下圖紅框框處查看官方詳細

配置說明。具體參考文章https://WWW.csdn.net/tags/0tDaQg4sODkzNjQtYmxvZw0000000000.html添加顏色的分組信息,編輯模板如下:AT2G04880.1,AT2G30250.1blue

adAT4G01250.1,AT4G31550.1red

adAT4G39410.1,AT5G49520.1yellow

ad《7.基因結(jié)構(gòu)分析TBtools8

motif分析8.1

序列提取motif分析8.2

MEME文件提取(

/meme/tools/meme)motif分析8.3motif可視化9.啟動子分析9.1

提取基因組文件中前2000bp

作為啟動子區(qū)域序列啟動子分析9.2

簡化所提取的啟動子區(qū)域序列TBtools

(Toolbox

forBiologists)v1.098774SequenceToolkitBLASTGO&KEGGGraphicsOthersAbout?RepotIHelp0區(qū)

Fasta

stats

區(qū)

sequence

Manipulate

(Rev&Comp)區(qū)

AboutTBtools區(qū)

GXFSequencesExtractFastaID

SimplifySeta

Input

Fasta

FileE:

研究生穿心蓮TCP\8啟動子分析12000bp.fasta

目標物種啟動子序列信息Note:Ifthe

input

file

is

a

table,the

last

column

must

be

the

sequences.□Removeversion輸出文件SimplifyMy

Sequences"IDFile

OutputOutputTextAreaSetanOutput

FileE:研究生穿心蓮TCP\8啟動子分析2000bp.simpliy.fasta啟動子分析9.3提取目標基因家族啟動子序列信息啟動子分析9.4反向驗證提取序列是否是前2000bp啟動子分析9.

5

將目標基因家族啟動子序列信息轉(zhuǎn)化大寫(所得大寫化的信息需手

動復制進新建文本文檔中并修改格式為fasta)啟動子分析9.6大寫化的目標基因家族序列信息提交至plant

care在線網(wǎng)站(

htttml/)

進行,等待結(jié)果發(fā)送至郵箱,下載郵箱中的附件,解壓后用execl打開其中的xxx.tab

文件p://bioinformatics.psb.ugent.be/webtools/plantcare/h啟動子分析9.7

根據(jù)作圖形式整理TAB

文件數(shù)據(jù),刪除無用列,保留有需要的信息,

對location列進行加減20得出起始、終止位置信息,根據(jù)功能描述列篩選所研究的順勢作用元件進行進一步分析。啟動子分析9.8.1.作

,TBtools

線形圖需用文件準備:①整理篩選后的TAB文件信息格式為:第一列基因ID

、第二列起始位置、

第三列終止位置、第四列順式作用元件。ABCDCXN00000643-RA2000CXN00001195-RA2000CXN00002762-RA2000CXN00002878-RA2000CXN00004183-RA2000CXN00004279-RA2000CXN00004746-RA2000CXN00007220-RA2000CXN00008155-RA2000CXN00008471-RA2000CXN00008509-RA2000CXN00008780-RA2000CXN00010818-RA2000啟動子分析9.8.1.作

,Tbtools線形圖需用文件準備:②2000bp

文件準備:第一列基因ID

,

第二列均為2000。Ex

cel

準備數(shù)

據(jù)后粘貼復制進新建文本文檔方可使用啟動子分析9.8.1.作

,Tbtools線形圖需用文件準備:③進化樹文件準備:將只含有目標物種目標基因家族的序列信息文件放入

MEGA軟件中,進行構(gòu)建進化樹操作至導出建樹文件(本教程進化樹構(gòu)建

第5步)粘貼復制進新建文本文檔中。ABCDEFCXN00001195-RAApTCP2CXN00004183-RAApTCP5CXN00004746-RAApTCP7CXN00008155-RAApTCP9CXN00008780-RAApTCP12CXN00011342-RAApTCP14CXN00011470-RAApTCP15CXN00017071-RAApTCP17CXN00018640-RAApTCP18CXN00019468-RAApTCP19CXN00004279-RAApTCP6CXN00008509-RAApTCP11CXN00020943-RAApTCP22CXN00000643-RAApTCP1CXN00002762-RAApTCP3啟動子分析9.8.1.作

,Tbtools線形圖需用文件準備:④重命名文件:第一列基因ID,

第二列新命名。Excel

準備數(shù)據(jù)后粘貼

復制進新建文本文檔方可使用。啟動子分析9.8.2作圖可視化,將準備的文件信息導入TBtools

中。ABCDE基因號順勢作用元件CXN00000643-RAI-boxCXN00000643-RAI-boxCXN00000643-RAGATA-motifCXN00000643-RAGT1-motifCXN00000643-RALTRCXN00000643-RAMRECXN00000643-RATGA-elementCXN00000643-RAARECXN00000643-RAARECXN00000643-RAAE-boxCXN00000643-RAMBSCXN00000643-RAABRECXN00000643-RAG-boxCXN00000643-RABox

4ICXN00001195-RAGT1-motif啟動子分析9.9.1.TBtools

熱圖制作,與上述線性圖一致選用一個即可。文件準備:①篩選后的TAB文件信息只保留基因ID和順式作用元件兩列即

可,使用Excel中的數(shù)據(jù)透視表功能處理數(shù)據(jù)如右圖所示。ABCDE基因號順勢作用元件CXN00000643-RAI-boxCXN00000643-RAI-boxCXN00000643-RAGATA-motifCXN00000643-RAGT1-motifCXN00000643-RALTRCXN00000643-RAMRECXN00000643-RATGA-elementCXN00000643-RAARECXN00000643-RAARECXN00000643-RAAE-boxCXN00000643-RAMBSCXN00000643-RAABRECXN00000643-RAG-boxCXN00000643-RABox

4ICXN00001195-RAGT1-motif啟動子分析9.9.1.TBtools

熱圖制作,與上述線性圖一致選用一個即可。文件準備:①篩選后的TAB文件信息只保留基因

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論