基因組信息分析_第1頁
基因組信息分析_第2頁
基因組信息分析_第3頁
基因組信息分析_第4頁
基因組信息分析_第5頁
已閱讀5頁,還剩105頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第三章基因組信息分析GenomeBioinformatics1.主要內(nèi)容一、引言二、人類基因組方案圖譜繪制三、基因組分析2.一、引言基因組(genome)

在個體水平代表個體所有遺傳性狀的總和;在細(xì)胞水平是一個細(xì)胞所有染色體的總和;從分子角度認(rèn)識,基因組代表了一個物種的所有DNA分子的總和.3.基因組學(xué)(genomics)是說明整個基因組的結(jié)構(gòu)、結(jié)構(gòu)與功能的關(guān)系以及基因之間相互作用的科學(xué).4.基因組分析的主要任務(wù)是確定基因在染色體上的位置,提供遺傳信息,并探討基因與基因之間以及基因與經(jīng)典遺傳學(xué)、醫(yī)學(xué)諸多方面之間的聯(lián)系.5.基因組信息學(xué)是指有關(guān)基因組信息的存儲、獲取、處理、分配、分析和注釋等方面的研究。目前主要是根據(jù)基因組作圖和測序的資料與數(shù)據(jù),應(yīng)用數(shù)學(xué)與統(tǒng)計(jì)學(xué)、計(jì)算機(jī)科學(xué)、遺傳學(xué)與分子生物學(xué)等多種研究手段,綜合分析處理基因組圖譜、DNA序列和蛋白質(zhì)序列等信息,說明這些資料和數(shù)據(jù)所包含的生物學(xué)意義。6.二、人類基因組方案(HGP)遺傳圖譜(geneticmap)物理圖譜(physicalmap)轉(zhuǎn)錄圖譜(transcriptionalmap)序列圖譜〔sequencemap)基因圖譜〔genemap)HGP主要目標(biāo)是繪制以下圖譜:7.8.(1)遺傳圖譜遺傳圖譜(連鎖圖):指基因或DNA標(biāo)記在染色體上的相對位置與遺傳距離。遺傳連鎖圖是用遺傳標(biāo)志來描述DNA標(biāo)記在染色體上的相對位置。遺傳標(biāo)志基因組中具有遺傳多態(tài)性的位點(diǎn),比方使用微衛(wèi)星(microsatellite,MS)標(biāo)記,單核苷酸的多態(tài)性(singlenucleotidepolymorphism,SNP)標(biāo)記。利用人類基因組中的一些特殊位點(diǎn)作為遺傳標(biāo)志而進(jìn)行的基因組分區(qū)。

9.在遺傳連鎖圖譜上,DNA標(biāo)記間的距離反映了它們共同遺傳的頻率。遺傳連鎖圖采用遺傳學(xué)距離(geneticdistance)作為圖距,遺傳距離通常由基因或DNA片段在染色體交換過程中別離的頻率厘摩(cM)來表示。1厘摩表示每次減數(shù)分裂的重組頻率為1%。厘摩值越高說明兩點(diǎn)之間遺傳距離越遠(yuǎn),厘摩值越低表示兩點(diǎn)間遺傳距離越近。在人的遺傳連鎖圖譜上,1cM的物理距離大約為106核苷酸對,人類基因組的遺傳大小已經(jīng)確定為3600cM。10.通過遺傳圖譜,我們可以大致了解各個基因或DNA片段之間的相對距離與方向。如哪個基因更靠近著絲粒,那個更靠近端粒等。遺傳距離是通過遺傳連鎖分析獲得的,實(shí)用的標(biāo)記越多、越密集,所得到的遺傳連鎖圖的分辨率就越高。遺傳圖譜不僅是現(xiàn)階段定位基因的重要手段,它也是研究人類基因組遺傳與變異的重要手段。

11.遺傳圖譜構(gòu)建的統(tǒng)計(jì)分析步驟兩點(diǎn)連鎖分析連鎖群的劃分基因位點(diǎn)的排序多位點(diǎn)連鎖分析GototheContents12.BC1群體AB

abABABAABB(1-r)/2n1AABbr/2n2AaBBr/2n3AaBb(1-r)/2n4兩點(diǎn)連鎖分析13.F2群體AB

abAB

abAABB(1-r)2/4n1AABbr(1-r)/2n2AAbbr2/4n3AaBBr(1-r)/2n4AaBb(1-r)2/2+r2/2n5Aabbr(1-r)/2n6aaBBr2/4n7aaBbr(1-r)/2n8aabb(1-r)2/4n9n5=n51+n52n51:n52=r2:(1-r)214.全同胞群體〔1〕位點(diǎn)的別離類型〔7種〕:ab×aaaa×abab×abab×cda0×a0a0×ab〔2〕位點(diǎn)的別離類型對〔17種〕:位點(diǎn)1位點(diǎn)2ab×aaaa×abab×abab×cda0×a0ab×a0a0×abab×aaaa×abab×abab×cda0×a0ab×a0a0×ab1*(1)2(2)73(3)8114(4)912145(6)101315166(5)(10)(13)(15)17(16)

Gotolinkageanalysis15.

aa

bb

aa

abaaaa(1-r)/4n1aaab1/4n2aabbr/4n3abaar/4n4abab1/4n5abbb(1-r)/4n6(3)例1:別離類型對abab×aaab的連鎖分析(C)

ab

ba

aa

ab(R)aaaar/4n1aaab1/4n2aabb(1-r)/4n3abaa(1-r)/4n4abab1/4n5abbbr/4n6LODc=LODrLinkagephase=c,ifrc<rr16.

aa

bb

ac

bd(3)例2:別離類型對abab×abcd的連鎖分析(C×C)

aa

bb

ad

bc(C×R)

ab

ba

ac

bd(R×C)

ab

ba

ad

bc(R×R)rr×r=1-rc×crr×c=1-rc×rLODc×c=LODr×rLODr×c=LODc×r重組率較小而LOD較大的那個連鎖相組合作為該別離類型對的連鎖相組合17.連鎖群的劃分假設(shè)記位點(diǎn)i和j之間的重組率為rij、LOD值為zij,那么連鎖群劃分的一般規(guī)那么為以下三者之一:(1)

如果rij<c,那么位點(diǎn)i和j劃為同一個連鎖群;(2)

如果zij>a,那么位點(diǎn)i和j劃為同一個連鎖群;(3)

如果rij<c,而且zij>a,那么位點(diǎn)i和j劃為同一個連鎖群,其中c為重組率的某一臨界值,a為LOD值的一個臨界值。18.基因位點(diǎn)的排序多位點(diǎn)排序的目標(biāo)函數(shù)極大似然函數(shù):鄰近重組率之和或鄰近重組率之積〔SARF或PARF)鄰近LOD值之和〔SALOD〕19.難點(diǎn):50個位點(diǎn)有50!/2可能的排序,窮舉法所需的計(jì)算時間會高達(dá)數(shù)億年多位點(diǎn)排序的計(jì)算方法排列法〔BuetowandChakravarti,1987〕模擬退火算法啟發(fā)式搜索算法

A

ABAC…AHACBACD…ACH…

ACBJIEFHGD代價函數(shù)為:f(n)=g(n)+h(n)g(n):從起始節(jié)點(diǎn)到當(dāng)前節(jié)點(diǎn)代價的最小估計(jì)值,h(n):從當(dāng)前節(jié)點(diǎn)到終止節(jié)點(diǎn)代價的估計(jì)值。20.多位點(diǎn)連鎖分析〔重考〕BC群體、F2群體全同胞群體〔隱馬爾可夫模型法,HMM〕位點(diǎn)1位點(diǎn)2ab×abab×cd基因型aaabbb隱狀態(tài)aaabbabb基因型和隱狀態(tài)acadbcbdLinkagephase:C×CLinkagephase:C×RLinkagephase:R×CLinkagephase:R×R21.Mt與Mt+1之間的重組率:似然函數(shù)值:其中是第k個樣本馬爾可夫鏈的向前變量值。22.23.24.

(2)物理圖譜物理圖譜:標(biāo)明一些界標(biāo)〔如限制酶切點(diǎn)、單一序列、基因等〕在DNA分子或染色體上所處的位置圖。以核苷酸序列的DNA片段〔序列標(biāo)簽位點(diǎn),sequence-taggedsite,STS〕為“路標(biāo)〞,以堿基對(bp)作為根本測量單位〔圖距〕的基因組圖。通過建立以DNA克隆片段和相互重疊連接起的“相連片段群〞(contig,源于contiguous,意為連著的、相鄰的)實(shí)現(xiàn)的。該“相連片段群〞覆蓋整個基因組。25.物理圖譜旨在獲得有關(guān)構(gòu)成基因組的全部基因的排列和間距的信息,它是通過對構(gòu)成基因組的DNA分子進(jìn)行測定而繪制的。目的是把有關(guān)基因的遺傳信息及其在每條染色體上的相對位置線性而系統(tǒng)地排列出來。作圖的方法是依靠顯微技術(shù)分析濃縮形式的染色體的結(jié)合方式,并利用現(xiàn)有的序列的信息

26.(3)轉(zhuǎn)錄圖譜轉(zhuǎn)錄圖譜:把mRNA或根據(jù)mRNA人工合成的cDNA別離、定位得到的圖譜。以EST〔expressedsequencetag,表達(dá)序列標(biāo)簽〕為標(biāo)記,根據(jù)轉(zhuǎn)錄順序的位置和距離繪制的圖譜。EST:通過從cDNA文庫中隨機(jī)挑選的克隆進(jìn)行測序所獲得的局部cDNA的5‘或3’端序列稱為表達(dá)序列標(biāo)簽〔EST〕,一般長300-500bp左右。27.轉(zhuǎn)錄圖抓住了基因的主要特點(diǎn)和主要局部(可轉(zhuǎn)錄的局部),所以,一張人類基因的轉(zhuǎn)錄圖(亦稱cDNA圖,包括基因的cDNA片段,即表達(dá)序列標(biāo)簽(expressedsequencetag,EST;或“表達(dá)序列〞),是人類的“基因圖〞的雛型。在人類基因組中,只有1%-5%的序列直接編碼蛋白質(zhì)。在人體(特別是成年人體)的每一特定組織中,一般只有10%的結(jié)構(gòu)基因表達(dá),即缺乏一萬個不同類型的mRNA抓住這1%-5%,就抓住了大多數(shù)基因。28.(4)序列圖譜序列圖譜〔分子水平的物理圖〕:整個人類基因組的核苷酸序列圖,也是最詳盡的物理圖。既包括可轉(zhuǎn)錄序列,也包括非轉(zhuǎn)錄序列,是轉(zhuǎn)錄序列、調(diào)節(jié)序列和功能未知序列的總和。29.人類基因組的核苷酸序列圖,是人類全部基因單個堿基按其結(jié)構(gòu)規(guī)律明確地排列而來,是分子水平上最高層次的、最詳盡的物理圖。測定總長度約為一米、由30億核苷酸組成的序列圖,是人類基因組方案中最明確、最艱巨的定量、定質(zhì)(準(zhǔn)確性)、定時(2005年前)完成的硬任務(wù)。實(shí)際上,2003年人類基因組序列圖繪制工作全部完成。來自美國、英國、日本、法國、德國、中國等6國的數(shù)百名科學(xué)家經(jīng)過13年的不懈努力,提前兩年完成了這一規(guī)模浩大的科學(xué)工程。許多國際知名專家稱贊說,這是人類揭示生命奧秘的一個里程碑,標(biāo)志著“基因時代黎明的真正到來〞。30.(5)基因圖譜在人類基因組中鑒別出全部基因的位置、結(jié)構(gòu)和功能;多少年完成?實(shí)驗(yàn)手段:cDNA/EST的染色體定位生物信息學(xué)方法?31.全球首個個人基因組圖譜

詹姆斯·沃森個人基因組圖譜DNA的雙螺旋結(jié)構(gòu)發(fā)現(xiàn)者之一,譽(yù)為“DNA之父〞的美國科學(xué)家詹姆斯·沃森32.2021年4月17日,英國?自然?雜志公布了用新一代快速基因測序技術(shù)排序的個人基因組圖譜。這是人類基因組測序領(lǐng)域的又一個里程碑。新一代快速基因測序技術(shù)由美國454生命科學(xué)公司牽頭開發(fā)。這種新技術(shù)可以允許在同一時間、同一外表進(jìn)行更多的測序反響。與先前的基因測序技術(shù)相比,其最大優(yōu)點(diǎn)是效率高,能大幅減少所需時間和費(fèi)用。33.科學(xué)家僅用了4個月時間、不到150萬美元就完成了沃森個人基因組圖譜的測序工作。相比之下,為了測定人類基因組的30億個堿基對,人類基因組方案花費(fèi)了4.37億美元和13年時間,于2003年繪制出首個人類全基因組圖譜。34.后基因組學(xué)35.36.37.38.39.基因組、轉(zhuǎn)錄組和蛋白質(zhì)組基因組轉(zhuǎn)錄組蛋白質(zhì)組化學(xué)生物學(xué)40.三、基因組分析1.基因組的結(jié)構(gòu)與內(nèi)容2.基因預(yù)測及基因組注釋3.比較基因組學(xué)4.基因/蛋白質(zhì)的功能預(yù)測5.功能基因組學(xué)41.1.基因組的結(jié)構(gòu)與內(nèi)容(1)基因的結(jié)構(gòu)(2)mRNA:可變剪切(3)蛋白質(zhì):翻譯后修飾(4)相互作用網(wǎng)絡(luò):基因、蛋白質(zhì)、小分子之間的相互作用(5)非編碼區(qū)a.功能元件:轉(zhuǎn)錄因子結(jié)合位點(diǎn);啟動子…b.Non-codingRNAc.轉(zhuǎn)座子d.重復(fù)片段e.偽基因(Pseudogene)42.(1)基因的結(jié)構(gòu)43.基因組大小&基因數(shù)44.基因數(shù)量->生物復(fù)雜性?〔1〕基因數(shù)量的變化,無法解釋生物學(xué)功能、調(diào)控機(jī)理以及物種多樣性和復(fù)雜性的巨大變化〔2〕當(dāng)前解釋:蛋白質(zhì)組的多樣性和復(fù)雜性->物種的多樣性和復(fù)雜性;~10,000,000種蛋白質(zhì)分子〔3〕兩種觀點(diǎn):a.轉(zhuǎn)錄后層面,mRNA剪切,產(chǎn)生拼接異構(gòu)體b.蛋白質(zhì)層面,蛋白質(zhì)序列上一個或多個位點(diǎn)上發(fā)生的翻譯后修飾45.GenotypetoPhenotype46.isoform1isoform2isoform3mRNASplicing〔2〕轉(zhuǎn)錄后層面:mRNASplicing47.Phosphorylation磷酸化SumoylationPalmitoylation棕櫚?;疉cetylation乙?;疷biquitination泛素化〔3〕蛋白質(zhì)層面:翻譯后修飾48.(4)相互作用網(wǎng)絡(luò)蛋白質(zhì)-蛋白質(zhì)相互作用網(wǎng)絡(luò)49.細(xì)胞信號通路G1/S檢驗(yàn)點(diǎn):有調(diào)控方向50.(5)非編碼區(qū)a.功能元件:轉(zhuǎn)錄因子結(jié)合位點(diǎn);啟動子…b.Non-codingRNAc.轉(zhuǎn)座子d.重復(fù)片段e.偽基因(Pseudogene)51.a.Functionalelements: Promotor52.TranscriptionFactorBindingSiteCRM:cis-regulatorymodules53.參與可變剪接的RNA順式作用元件Exonsplicingenhancer(ESE)andsilencer(ESS)Intronsplicingenhancer(ISE)andsilencer(ISS)54.b.Non-codingRNA

不翻譯成蛋白質(zhì),具有重要的調(diào)控功能

分類:a)

transferRNA(tRNA)b)ribosomalRNA(rRNA)c)snoRNAs,d)microRNAs,e)siRNAs…55.tRNA&rRNA56.snoRNAssnoRNAs:SmallnucleolarRNAs;介導(dǎo)其他RNA分子的化學(xué)修飾,例如甲基化57.microRNA/miRNA1.長度21-23bp2.調(diào)控基因的表達(dá)3.pre-miRNA:~70bp58.c.Transposon轉(zhuǎn)座子:在基因組中能夠移動位置的DNA序列59.2.基因預(yù)測及基因組注釋(1)基因組序列的拼裝(2)基因預(yù)測(3)非編碼的功能元件的預(yù)測60.(1)基因組測序:鳥槍法61.基因組的拼裝62.重復(fù)序列帶來干擾63.(2)基因預(yù)測根本原理:序列同源比對:與數(shù)據(jù)庫中的序列〔如EST,cDNA,蛋白質(zhì)序列〕一致或相似預(yù)測新基因從頭預(yù)測(abinitio):依據(jù)基因的特征序列,如原核生物的長ORF、真核生物編碼區(qū)中外顯子和內(nèi)含子間的GT-AG規(guī)那么、基因5’端的CpG島、核心啟動子的TATA盒、起始密碼子兩側(cè)的特征序列、3’端的polyA尾等統(tǒng)計(jì)分析,識別基因以上兩種方法的結(jié)合64.真核生物的基因結(jié)構(gòu)5’3’3’5’

~1-100Mbp5’3’3’5’…………

~1-1000kbpexons(cds

&

utr)/introns(~102-103bp)(~102-105bp)Polyadenylationsitepromoter(~103bp)enhancers(~101-102bp)otherregulatorysequences(~101-102bp)65.其他相關(guān)術(shù)語CDS(Codingsequence):

TheportionofDNAthatcodesfortranscriptionofmessengerRNA.

ORF(OpenReadingFrame):從AUG開始,至stopcodon終止CodonUsage:CAI…66.基因預(yù)測常見方法序列相似性比較方法模式生物基因組全測序完成及大規(guī)模EST測序,為相似性比較預(yù)測法提供了根底。近一半脊椎動物基因可通過與模式生物序列比較,找到高相似性序列。缺乏:很多情況下,不能識別完整基因,只能識別一局部編碼序列。67.基因預(yù)測常見方法2隱馬爾可夫模型方法依據(jù)編碼區(qū)內(nèi)部結(jié)構(gòu)特征確定蛋白質(zhì)編碼區(qū),如GeneMark,HMMGene;通過編碼區(qū)周邊的特征序列,如啟動子、剪切位點(diǎn)、polyA尾等,預(yù)測基因編碼區(qū),如Veil、Genie等多個HMM模型組合,預(yù)測復(fù)雜的脊椎動物基因。擴(kuò)展的隱馬爾可夫模型〔GHMMs〕中,狀態(tài)對應(yīng)于基因的各種不同功能位點(diǎn),如啟動子區(qū)、外顯子、內(nèi)含子等。68.HMMmodelforGenePrediction(Genie)Kulp,D.,PhDThesis,UCSC200369.基因預(yù)測常見方法3神經(jīng)網(wǎng)絡(luò)方法強(qiáng)自主學(xué)習(xí)、自主適應(yīng)性密碼子方法主要依據(jù)統(tǒng)計(jì)密碼子中各字母的使用傾向性〔密碼子偏好性〕進(jìn)行預(yù)測。Z-曲線法利用幾何學(xué)分析研究DNA序列的方法。目前,多數(shù)方法是預(yù)測基因編碼區(qū),對非編碼區(qū)的預(yù)測可靠性較差。70.3.比較基因組學(xué)

Comparativegenomics比較基因組學(xué)是基因組學(xué)與生物信息學(xué)的一個重要分支,它通過模式生物基因組之間或模式生物基因組與人類基因組之間的比較和鑒別,可以為研究生物進(jìn)化和別離人類遺傳病的候選基因以及預(yù)測新的基因功能提供依據(jù)?!?〕根本原理〔2〕主要方法〔3〕功能網(wǎng)絡(luò)〔4〕種間比較基因組學(xué)研究〔5〕種內(nèi)比較基因組學(xué)研究71.〔1〕根本原理5種模式生物:大腸桿菌〔E.coli〕、釀酒酵母〔S.cerevisiae〕、秀麗新小桿線蟲〔C.elegans〕、黑腹果蠅〔D.melanogaster〕和小鼠〔M.musculus〕可以從模式生物中尋找人類可能具有的新基因例如,先確定“胖鼠〞基因在小鼠基因組中的位置,然后根據(jù)小數(shù)基因組與人類基因組的對應(yīng)關(guān)系,可獲得人類的“肥胖〞基因72.人類基因組與小鼠染色體組間的關(guān)系(a)人類基因組(b)小鼠染色體組73.〔2〕主要方法系統(tǒng)發(fā)育概形法RosettaStone法基因鄰居法方法比較74.系統(tǒng)發(fā)育概形法圖解175.RosettaStone法一些相互間存在作用的蛋白,其同源物在另一種生物上融合成一個單一的蛋白,這個蛋白序列稱為“融合蛋白序列〞或RosettaStone序列一個生物體中獨(dú)立的蛋白A和B在其他物種中可能是作為一個融合蛋白表達(dá)的,此時結(jié)構(gòu)域A和B根本上是關(guān)聯(lián)的由于A和B有不相關(guān)的序列,這種功能聯(lián)系就不能用同源性查詢檢測到76.TrpCRosettaStone法圖解77.基因鄰居法如果在原核生物中操縱子是共同的,兩個基因〔藍(lán)色和黃色〕在不同的基因組中是相鄰的,就可以推斷出它們編碼的蛋白質(zhì)之間具有功能聯(lián)系78.〔3〕功能網(wǎng)絡(luò)

當(dāng)檢測功能關(guān)聯(lián)的方法應(yīng)用于一個生物物種的所有蛋白質(zhì)時,可以記錄到交互作用的、指示功能聯(lián)系蛋白的網(wǎng)絡(luò),稱為功能網(wǎng)絡(luò)79.酵母的完整基因表達(dá)圖譜(Marcotteetal,1999Nature,402:83-86)80.〔4〕種間比較基因組學(xué)研究通過對不同親緣關(guān)系物種的基因組序列進(jìn)行比較,能夠鑒定出編碼序列、非編碼調(diào)控序列及給定物種獨(dú)有的序列?;蚪M范圍之內(nèi)的序列比對,可以了解不同物種在核苷酸組成、同線性關(guān)系和基因順序方面的異同,進(jìn)而得到基因分析預(yù)測與定位、生物系統(tǒng)發(fā)生進(jìn)化關(guān)系等方面的信息。全基因組的比較研究系統(tǒng)發(fā)育的進(jìn)化關(guān)系分析81.種間比較基因組學(xué)研究例如尿殖道支原體是最小的基因組〔0.58Mb〕,可依此確定能自我復(fù)制的細(xì)胞必需的一套最少的核心基因。流感嗜血桿菌的基因組為1.83Mb。流感嗜血桿菌基因大小平均900bp,平均1042bp有1個基因。尿殖道支原體的基因?yàn)?040bp,平均1235bp有1個基因。二者的差異在于基因數(shù)量上,流感嗜血桿菌有1743個ORF,尿殖道支原體有470個ORF。82.通過流感嗜血桿菌能量代謝類群的ORF分析,了解到它缺乏三羧酸循環(huán)(TCA)中必需的3個酶,即檸檬酸合成酶基因、異檸檬酸脫氫酶基因和順烏頭酸酶基因。由此推斷流感嗜血桿菌TCA缺失,不能合成谷氨酸,因?yàn)楣劝彼岬墓w是TCA的中間產(chǎn)生物α-酮戊二酸。83.〔5〕種內(nèi)比較基因組學(xué)研究同種群體內(nèi)基因組存在大量的變異和多態(tài)性,正是這種基因組序列的差異構(gòu)成了不同個體與群體對疾病的易感性和對藥物與環(huán)境因子不同反響的遺傳學(xué)根底。84.多態(tài)性人的DNA序列上平均每幾百個堿基會出現(xiàn)一些變異〔variation〕,并按照孟德爾遺傳規(guī)律由親代傳給子代,從而在不同個體間表現(xiàn)出不同,因而被稱為多態(tài)性〔Polymorphism〕。多態(tài)性標(biāo)記:〔1〕單核苷酸的多態(tài)性〔2〕短的串聯(lián)重復(fù)序列〔3〕基因拷貝數(shù)多態(tài)性+限制性片段長度多態(tài)性85.〔1〕單核苷酸的多態(tài)性

〔singlenucleotidepolymorphism,SNP〕SNP:是由于單個核苷酸改變而導(dǎo)致的核酸序列多態(tài)。 人類99.9%的基因密碼是相同的,而差異不到0.1%,不同人群僅有140萬個核苷酸差異。這些差異是由“單一核苷酸多樣性〞〔SNP〕產(chǎn)生的,它構(gòu)成了不同個體的遺傳根底。在整個基因組序列中,人與人之間的變異僅為萬分之一,從而說明人類不同“種屬〞之間并沒有本質(zhì)上的區(qū)別。86.SNP與CNP和STR標(biāo)記的主要不同之處在于,它不再以DNA片段的長度變化作為檢測手段,而直接以序列變異作為標(biāo)記。87.〔2〕短的串聯(lián)重復(fù)序列

ShortTandemRepeat,STR包括小衛(wèi)星DNA和微衛(wèi)星DNA,其多態(tài)性主要來自重復(fù)序列拷貝數(shù)的變化。小衛(wèi)星DNA:由15-65bp的根本單位串聯(lián)重復(fù)而成,長度一般不超過20kb。重復(fù)次數(shù)〔小衛(wèi)星DNA區(qū)的長度〕在人群中是高度變異的;按照孟德爾的規(guī)律遺傳。微衛(wèi)星DNA/簡短串聯(lián)重復(fù)〔STR、STRP或SSLP〕重復(fù)單元2-8bp,通常重復(fù)10-60次。CTAGCTTATATATATATATATATATATATAAGCTTGC88.〔3〕基因拷貝數(shù)多態(tài)性

copynumberpolymorphism,CNP表型正常的人群中,不同的個體間在某些基因的拷貝數(shù)上存在差異,一些人喪失了大量的基因拷貝,而另一些人那么擁有額外、延長的基因拷貝,這種現(xiàn)象為“基因拷貝數(shù)多態(tài)性〞。正是由于CNP才造成了不同個體間在疾病、食欲和藥效等方面的差異。研究說明,平均2個個體間存在11個CNP的差異,CNP的平均長度為465kb,其中半數(shù)以上的CNP在多個個體中重復(fù)出現(xiàn),并經(jīng)常定位于其他類型的染色體重排附近。89.+限制性片段長度多態(tài)性

restrictionfragmentlengthpolymorphism(RFLP)90.GWAS-全基因組關(guān)聯(lián)研究

Genome-WideAssociationStudies是指在全基因組層面上,開展多中心、大樣本、反復(fù)驗(yàn)證的基因與疾病的關(guān)聯(lián)研究,全面揭示疾病發(fā)生、開展與治療相關(guān)的遺傳基因。是一種對全基因組范圍內(nèi)的常見遺傳變異〔單核苷酸多態(tài)性和拷貝數(shù)〕基因總體關(guān)聯(lián)分析的方法,在全基因組范圍內(nèi)進(jìn)行整體研究,能夠一次性對疾病進(jìn)行輪廓性概覽,適用于復(fù)雜疾病的研究。91.4.基因/蛋白質(zhì)的功能預(yù)測(1)一級序列的比較:相似的序列具有相似的功能(2)保守的功能結(jié)構(gòu)域:保守的功能(3)三級結(jié)構(gòu)的比較:相似的結(jié)構(gòu)具有相似的功能92.(1)一級序列的比較

同源物的鑒定:不同物種中的直系、旁系同源物的預(yù)測

主要工具:BLAST93.同源性分析->功能相似性O(shè)rtholog(直系同源物):兩個基因通過物種形成的事件而產(chǎn)生,或,源于不同物種的最近的共同祖先的兩個基因,或者兩個物種中的同一基因,一般具有相同的功能。Paralog(旁系同源物):兩個基因在同一物種中,通過至少一次基因復(fù)制的事件而產(chǎn)生。Xenolog(異同源物):由某一個水平基因轉(zhuǎn)移事件而得到的同源序列。Convergentevolution:通過不同的進(jìn)化途徑獲得相似的功能,或者,功能替代物。94.paralogsorthologs95.(2)保守的功能結(jié)構(gòu)域

保守的功能結(jié)構(gòu)域:保守的功能

常用工具:工具網(wǎng)址Interprohttp://www.ebi.ac.uk/interpro/Pfamhttp://pfam.sanger.ac.uk/SMARThttp://smart.embl.de/PROSITE/prosite/ProDomhttp://prodom.prabi.fr/prodom/current/html/home.phpCDD/Structure/cdd/wrpsb.cgi96.例:Survivin97.(3)三級結(jié)構(gòu)的比較Ubiquitin:泛素,主要負(fù)責(zé)蛋白質(zhì)的降解SUMO:小的類泛素蛋白質(zhì),

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論