第二章 基因與基因組.ppt_第1頁
第二章 基因與基因組.ppt_第2頁
第二章 基因與基因組.ppt_第3頁
第二章 基因與基因組.ppt_第4頁
第二章 基因與基因組.ppt_第5頁
已閱讀5頁,還剩63頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、第一章 基因與基因組,一、基因的概念:,基因(gene) 是一段攜帶功能產(chǎn)物(多肽,蛋白質(zhì),tRNA和rRNA和某些小分子RNA)信息的DNA片段,是控制某種性狀的的遺傳單位。,估計,人類約有33.5萬(或3.4萬)個基因,不同生物,基因的數(shù)量、結(jié)構(gòu)及組合方式不同,第一節(jié) 基因與基因組,在早期,Morgan等把遺傳性狀與特定的染色體區(qū)段聯(lián)系起來,并提出“一個基因,一個酶”和“一個基因,一條多肽鏈”的概念。,基因的特點和鑒別方法,編碼tRNA和rRNA和某些小分子RNA的基因: 我們較易通過核酸序列加以判斷。,蛋白質(zhì)編碼基因: 目前可根據(jù)其特點使用五項標(biāo)準(zhǔn)來鑒別 但這些標(biāo)準(zhǔn)使用起來卻并不得心應(yīng)手

2、。,基因的特點和鑒別方法,基因組(genome)是指一個細(xì)胞或生物體的一套完整的單倍體遺傳物質(zhì)。,對二倍體高等生物來說,維持配子正常功能最低數(shù)目的一套染色體遺傳物質(zhì),構(gòu)成一套基因組。,對只有一個染色體的原核生物,基因組就是其整個染色體。,人類基因組24個染色體(22+X+Y)約3.0109bp,1.開放閱讀框(open reading frame, ORF) *是始于起始密碼子并終于終止密碼子的一串密碼子。 *從mRNA中找出大的ORF來確定編碼蛋白質(zhì)的基因; *適合于從DNA序列中鑒別原核生物基因和含少量內(nèi)含子的真核基因。 *但對于一些短少的基因及一些內(nèi)含子豐富的基因則很難鑒別。,2. 序列

3、特征密碼子偏愛和剪接點,*密碼子偏愛(codon bias ) 指在不同物種的基因中經(jīng)常為某種氨基酸編碼的只是其中的一個密碼子。 當(dāng)鑒別到一個ORF時,密碼子偏愛常常用來確定這個ORF是否是一個基因。,*基因的剪接位點(splice sites) 一般有特定的序列特征,計算機程序利用這種序列特征可預(yù)測將近50%的外顯子及20%的完整基因。,3. 序列保守性,*一個功能在不同物種內(nèi)是保守的基因,大都表現(xiàn)出外顯子的保守性和內(nèi)含子的多變性。 *最好是對適當(dāng)進化距離的物種間序列進行比較。 *但保守性序列也可能是非轉(zhuǎn)錄的調(diào)控單元。,*尋找基因的表達產(chǎn)物RNA或蛋白質(zhì),是鑒定一個基因的有效方法。 *但有些

4、OFR似乎并不轉(zhuǎn)錄,因為檢測不到它們的RNA或蛋白質(zhì)產(chǎn)物。,4. 轉(zhuǎn)錄產(chǎn)物,除以上鑒定基因的五項標(biāo)準(zhǔn)之外,在實施過程中還有些麻煩的問題,如重疊基因、變通性斷裂基因、假基因等。,*使基因失活也是確認(rèn)基因功能的一個方法。 *但許多編碼序列的失活并不導(dǎo)致一個明顯的表型,因而很難找到鑒定的標(biāo)準(zhǔn)。,5. 基因失活,二、基因組的概念:,基因組(genome)是指一個細(xì)胞或生物體的一套完整的單倍體遺傳物質(zhì)。,對二倍體高等生物來說,維持配子正常功能最低數(shù)目的一套染色體遺傳物質(zhì),構(gòu)成一套基因組。,原核生物和真核生物基因組又分染色體基因組與染色體外基因組,后者如原核生物的質(zhì)粒DNA,真核生物的線粒體DNA及葉綠體

5、DNA。,人類基因組24個染色體(22+X+Y)約3.0109bp,1. 基因組大小與C值佯謬,基因組大小在不同生物之間差異很大;如HBV 僅3200 bp,而某些顯花植物和兩棲類動物可達1011bp。 基因組大小用C值(C value)表示; C值大小基本上反映生物進化程度的差異; 但這種相關(guān)性并不很精確; 這種生物體的進化程度與基因組大小之間不完全成比例的現(xiàn)象稱為C值佯謬( C value paradox ); C值矛盾主要是由于各種生物基因組的結(jié)構(gòu)特征的差異造成的,低等和高等生物差別明顯。,2. 基因總數(shù)與N值佯謬,基因總數(shù)( N表示)人類為3萬多個,僅比大腸桿菌大7倍,比低等動物秀麗線

6、蟲大1.6倍,水稻高達5萬。 果蠅在進化上比秀麗線蟲高等,基因總數(shù)只有后者的0.6倍。 基因組中基因數(shù)目與生物進化程度或復(fù)雜程度的不對稱性,稱為N值佯謬(N value paradox)。 既然一切生物性狀都是由基因決定的,那么生物體的DNA含量(C值)和質(zhì)量(N值)就應(yīng)該與生物進化階梯及復(fù)雜性成正相關(guān)。 生物體結(jié)構(gòu)與功能的復(fù)雜程度不僅取決于一定的基因數(shù)量,更重要的是在于基因功能及其相互作用網(wǎng)絡(luò)的復(fù)雜性和精確性。,三、真核生物基因組特點,(一)分子量很大的DNA與蛋白質(zhì)形成染色體存在于核內(nèi)。人類染色體約30億bp,(二)轉(zhuǎn)錄與翻譯不同步,轉(zhuǎn)錄產(chǎn)物為單順反子,功能相關(guān)基因分散排布,無操縱子結(jié)構(gòu),

7、(三) 基因組存在高比例的非編碼順序(non coding sepuence, NCS), NCS可作進化標(biāo)尺?,(四) 大量重復(fù)序列(repeat sequence)存在。,單拷貝順序編碼蛋白質(zhì),基因順序,重復(fù)順序的功能:,1)編碼某些重要的功能性蛋白、rRNA、tRNA等,2)與染色體構(gòu)象、著絲粒形成有關(guān),3)參與基因的表達調(diào)控,重復(fù)順序,1. 倒位(轉(zhuǎn))重復(fù)順序,指兩互補順序呈反向排列,形成回文結(jié)構(gòu)或發(fā)夾狀結(jié)構(gòu),2. 串連重復(fù)順序,由相同的核心順序(270bp)成串(頭尾相接)排列而成的高度重復(fù)順序。約占整個基因組的10%,衛(wèi)星DNA(satellite DNA)分3類:,大衛(wèi)星DNA(

8、macrosatellite DNA),即經(jīng)典的衛(wèi)星DNA,由數(shù)十個核苷酸的重復(fù)單位構(gòu)成,主要存在于異染色區(qū)和著絲粒。又分I 、II、III、IV和 、衛(wèi)星DNA。,小衛(wèi)星DNA(minisatellite DNA),由612個核酸的重復(fù)順序組成,位于染色體端粒及其附近,長度數(shù)十?dāng)?shù)千bp,微衛(wèi)星DNA(microsatellite DNA),或稱簡短串連重復(fù),由26個核苷酸的重復(fù)順序組成,如(CA)n、(GA)n、(TA)n,n為1530具有多態(tài)性,衛(wèi)星長度常小于100bp,大量分布每條染色體。,且衛(wèi)星兩側(cè)的順序是特異的,故可以PCR檢測,可作為遺傳連鎖分析的標(biāo)志。,微衛(wèi)星DNA順序可能還與癌

9、基因或抑癌基因的表達調(diào)控有關(guān),亦可作為散發(fā)性腫瘤的研究標(biāo)志,3. 散在重復(fù)順序,為中度重復(fù)順序,約占染色體組的20%,散在分布于基因組內(nèi)。,如Alu家簇或稱Alu順序,由300bp短序列構(gòu)成,其中有一個Alu酶切位點(AG/CT),被切成130bp和10bp二個片段。,Alu順序分散于整個基因組中,平均5kb就有一個。是人類基因組所特異的,可作為鑒別人類基因的天然標(biāo)志。,Alu家簇稱短的散在重復(fù)順序(長度小于500bp), Kpn家簇則稱長的重復(fù)順序(長度大于500bp),散在重復(fù)順序可能是轉(zhuǎn)座子,(五) 基因多為不連續(xù)的,被插入序列(IS)所分隔,斷裂基因由內(nèi)含子(intron)(非編碼序列

10、)和外顯子(exon)(編碼序列)交替組成。,這種現(xiàn)象稱為斷裂基因(split gene),內(nèi)含子和外顯子在編碼不同蛋白的時可轉(zhuǎn)換角色,除少數(shù)蛋白(a,-intron和組蛋白)外幾乎所有基因都有內(nèi)含子。,內(nèi)含子功能未知!,GT/AG規(guī)則: GT-intron-AG,AAA-AAA,GpppG,3,轉(zhuǎn)錄,斷裂基因及其轉(zhuǎn)錄、轉(zhuǎn)錄后修飾,(六 )功能相關(guān)基因構(gòu)成各種基因家族,基因家族的各個基因可以相距很遠(yuǎn)(甚至在不同染色體上),亦可以串連地成簇排列,但都各自轉(zhuǎn)錄。,1)核苷酸序列相同:成簇或成串排列,如rRNA基因家族、tRNA基因家族和組蛋白基因家族,2)核酸序列高度同源:如生長激素基因家族、-珠

11、蛋白基因家族,3)編碼產(chǎn)物的功能或功能區(qū)同源:基因全長序列相似性較低,但產(chǎn)物具有保守的功能區(qū)。如src癌基因家族都有同源的蛋白激酶結(jié)構(gòu)域,基因家族(genefamily)概念:指核苷酸序列或編碼產(chǎn)物的結(jié)構(gòu)具有一定同源性的一些基因。,5)假基因():在多基因家簇中,有的成員并不表達基因產(chǎn)物,稱,假基因可能與有功能基因同源,可能由于基因突變而失活,假基因普遍存在,可能為進化的痕跡,4)基因超家族( gene superfamily):結(jié)構(gòu)上具有一定的相似性,但功能不一定相似,且進化上的親緣關(guān)系較遠(yuǎn)。如免疫球蛋白基因超家族、絲氨酸蛋白酶基因超家族等,基因組(genome) 泛指一個有生命體、病毒或細(xì)

12、胞器的全部遺傳物質(zhì);在真核生物,基因組是指一套染色體(單倍體)DNA。,一、基因組學(xué)概念及范疇,基因組學(xué)(genomics) 發(fā)展和應(yīng)用基因作圖、 DNA測序、基因定位等新技術(shù)以及計算機程序,分析生命體(包括人類)全部基因組結(jié)構(gòu)及功能。,第二節(jié) 基因組學(xué),基因組學(xué)的亞領(lǐng)域和研究內(nèi)容,二、人類基因定位的基本方法,家系分析法發(fā)現(xiàn)感興趣的基因 通過分析統(tǒng)計家系中有關(guān)遺傳性狀的連鎖情況和重組率而進行基因定位的方法。,連鎖分析法(linkage analysis),摩爾根1910年提出連鎖定律,發(fā)表了“基因論” :,(1)相引是兩個基因位于同一染色體上,相斥則反之 (2)同源染色體在減數(shù)分裂時發(fā)生交換

13、(3)位置相近的因子相互連鎖。,交換值=新組合數(shù)/(親本組合數(shù)+新組合數(shù)); 交換值從050%; 同一條染色體上二個基因間的距離越遠(yuǎn)交換值越大; 交換值為0時為完全連鎖(二個性狀總是同時出現(xiàn)); 二個基因間的遺傳學(xué)距離(圖距)用單位cM表示(厘摩)表示(1%交換值為1 cM ),減數(shù)分裂過程中的同源染色體交換,1) 性連鎖分析最常用的家系分析法,如果其性狀只出現(xiàn)于男性,則基因位于Y染色體; 如果其性狀是隔代交叉遺傳,亦即外祖父的某些性狀不出現(xiàn)于其母親,卻出現(xiàn)在其外孫子身上; 由于男性的X染色體總是傳給女兒,一般不直接從父到子遺傳,所以這個基因應(yīng)位于X染色體上。 如果二個性狀都表現(xiàn)出隔代遺傳,則

14、這二基因都位于X染色體上; 外祖父法確定二個X染色體連鎖基因的遺傳學(xué)距離。如X染色體連鎖的色盲基因和蠶豆病基因。,2)染色體標(biāo)記連鎖分析法,當(dāng)已知染色 體上的某種標(biāo)記與某個基因間的連鎖關(guān)系后,亦可通過家系分析法將基因定于染色體上并計算出重組率確定遺傳學(xué)距離。 如Donahue發(fā)現(xiàn)自己家系的1號染色體長臂近著絲粒區(qū)變長,是一個可遺傳標(biāo)記;隨后又發(fā)現(xiàn)這一標(biāo)記與 Duffy血型具有平行性(連鎖關(guān)系),從而將Duffy血型基因定位。,3)多態(tài)性DNA標(biāo)記,串連重復(fù)序列(VNTR)第二代遺傳標(biāo)記 其核心順序重復(fù)的次數(shù)具多態(tài)性,現(xiàn)已定位了300余個均勻分布于各個染色體上的VNTR; 由于VNTR的核心順序

15、兩側(cè)的序列是沒有個體差異且長度各不相同,因此,以此兩側(cè)序列為PCR引物,能獲得個體特異的指紋圖譜(亦稱全基因掃描)。 進行家系全基因掃描時,如發(fā)現(xiàn)某些性狀總是與某些VNTR相連鎖,就可以將該基因定位于某一染色體,精度10cM左右。 VNTR多態(tài)性亦符合孟德爾遺傳,故指紋分析還可應(yīng)用于遺傳病診斷、法醫(yī)個體鑒定、親子鑒定等,2.體細(xì)胞雜交初步的基因定位,應(yīng)用體細(xì)胞雜交技術(shù),離體條件下把基因定位到染色體上。 如人/鼠雜交細(xì)胞,經(jīng)傳代相對穩(wěn)定后,一般含整套鼠染色體及丟失部分人染色體(常保留17條不等的人染色體); 這種雜交細(xì)胞是進行基因定位和連鎖分析的極好材料,通過分析某基因產(chǎn)物是否與人的某個染色體同

16、時存在,即可將基因定位到染色體上; 其后再進行區(qū)域定位常利用染色體的結(jié)構(gòu)的異常,如缺失、易位等標(biāo)記進行連鎖分析; 新發(fā)展起來的輻射雜交細(xì)胞基因定位法人/鼠雜交細(xì)胞染色體經(jīng)射線處理后,只含帶著絲粒的部分片段。比較含長、短染色體片段的雜交細(xì)胞的基因表達差異,可更精確定位。,3. 核酸雜交技術(shù)精確的基因定位,基因原理:以克隆基因的cDNA為探針,與保留在雜交細(xì)胞的人染色體DNA順序進行分子雜交,獲得染色體定位; 大致步驟(以人白蛋白基因定位為例): 分別提取人細(xì)胞、CHO細(xì)胞和各種人/CHO雜交細(xì)胞的染色體組DNA;分別用Hind III酶切、電泳、轉(zhuǎn)膜;用人白蛋白cDNA為探針雜交、顯帶;結(jié)果分析

17、-定位于4號染色體,1) 克隆基因定位法,2) 原位雜交法(in situ hybridization),原理:以標(biāo)記的目的基因特異DNA序列或RNA為探針,直接與細(xì)胞中期染色體進行分子雜交,顯影后即可確定探針雜交的染色體位置(定位)。 熒光原位雜交(fluorescence in situ hybridization , FISH ) :探針以熒光標(biāo)記(生物素、地高辛等)的原位雜交 FISH能直接完成基因的染色體定位。,FISH程序示圖,端粒序列定位于染色體的每個末端(FISH),3) 原位PCR (in situ PCR),原理:在單細(xì)胞或組織切片上,對目的基因用PCR進行原位擴增,(或再

18、進行分子雜交),從而獲得基因的染色體定位信息。 間接法:先對基因進行原位擴增,再進行DNA原位雜交,間接示蹤; 直接法:將標(biāo)記的核苷酸直接摻入PCR產(chǎn)物中,直接示蹤。 基本步驟:固定細(xì)胞,蛋白酶部分消化;原位PCR擴增;直接法直接顯影(如放射身顯影、熒光、化學(xué)顯影等),間接法通過標(biāo)記探針進行雜交顯影。當(dāng)然需要與染色分帶技術(shù)相結(jié)合!,4) 定位克隆技術(shù),原理:對通過疾病表型觀察到的致病基因,進行基因定位和進一步分離、克隆該基因的策略。 基本策略:通過家系分析等確定致病基因與多態(tài)性標(biāo)記間的連鎖關(guān)系或染色體定位;通過染色體步移進行更精確定位,或以標(biāo)志性序列探針,從克隆重迭群(contigs)篩選出特

19、異的(contig) ;再通過DNA測序等確定目的基因的序列,獲得基因克隆。,第三節(jié) 人類基因組計劃 (Human genome project ,HGP),Dolbecco(1986)首次提出HGP的概念;,1990美國國會批準(zhǔn)正式啟動HGP;法、英、意、德、日跟進;成為國際人類基因組計劃,中國負(fù)責(zé)1%的序列測定,并于2001年完成完整圖,預(yù)計2005年完成,后來提前到2003年完成完整圖,1999年宣布完成了22號染色體DNA全序列測定,1993美國對HGP進行了修正。,2000年公布了人類基因組工作草圖,一、修正后的HGP主要內(nèi)容,人類基因組作圖及序列分析(22+X+Y, 30億bp);

20、,基因的鑒定與定位(約5萬個基因);,基因組研究技術(shù)的建立和創(chuàng)新;,模式生物基因組作圖及序列分析;,信息系統(tǒng)的建立、儲存及相應(yīng)軟件的開發(fā);,相關(guān)產(chǎn)業(yè)的開發(fā)。,HGP的主要成果四張圖,被譽為人類“分子水平的解剖圖”、人類“生命的元素周期表”,1. 遺傳圖(genetic map)又稱連鎖圖(linkage map),以具有遺傳多態(tài)性(在一個遺傳位點上具有一個以上的等位基因)的遺傳標(biāo)記為路標(biāo),以遺傳學(xué)距離( cM)為圖距的基因圖譜。,第三代遺傳標(biāo)記是SNP(restriction fragment length polymorphism,單核苷酸多態(tài)性),不再是分析長度,而是直接測序,第二代遺傳標(biāo)

21、記是STR(short tandem repeat,簡短串連重復(fù)序列 ),6000個標(biāo)記,96年已全部完成,第一代遺傳標(biāo)記是RFLP(restriction fragment length polymorphism,限制性酶切片段多態(tài)性),2. 物理圖 (physical map),以一段已知序列的DNA片段(STS,sequence tagged site,序列標(biāo)記位置)并有染色體定位為路標(biāo),以Mb或Kb為圖距的基因組圖。,首先建立相互重迭的相連片段克隆群(contigs)(每個克隆都含有一個STS),借助YAC已建立總體覆蓋率達近100% contigs,測序分析,計算實際距離(Mb或Kb

22、),3. 轉(zhuǎn)錄圖又稱表達序列圖或cDNA圖,是以部分5 端或3端cDNA序列(即表達標(biāo)志,EST)為路標(biāo),根據(jù)表達順序的位置和距離作圖,已注冊的EST達300萬條,正每天以千多條的速度增加,實際上cDNA圖就是人類“基因圖”的雛形,另一個優(yōu)點是:直接編碼蛋白質(zhì)的序列只占整個基因組的的15%,在成人中每一特定組織中只有不到10%的基因表達,即不足1萬種mRNA。抓住這15%,就抓緊了大多數(shù)基因。并且可通過cDNA全長轉(zhuǎn)錄本基因及鄰近序列,生物性狀(包括疾病),都是由結(jié)構(gòu)或功能蛋白質(zhì)決定的,而蛋白質(zhì)又是由mRN編碼的。,轉(zhuǎn)錄圖的另一層意義:,cDNA具有組織(空間)、發(fā)育階段(時間)和病理(病態(tài))

23、特異性。因此,了正常的轉(zhuǎn)錄圖就可以進而繪制生理、病理、受控條件下的轉(zhuǎn)錄圖。,可以作為篩選基因的探針,亦可以作為基因診斷的探針,因此,世界各國、各大公司在轉(zhuǎn)錄圖、EST的構(gòu)建方面竟?fàn)幖ち摇?免費共享?美國專利?,4.序列圖,測定總長約30億個核苷酸組成的全染色體序列,是HGP最明確、最準(zhǔn)確(定質(zhì)定量)、最艱巨(定時,2005年)的硬任務(wù)。,由于測序技術(shù)的限制(一次測序在1000個核苷酸左右,還不能直接利用全基因組或YAC、BAC或大片段克隆的contig作模板測序。必須在些大片段基礎(chǔ)上構(gòu)建小的(1kb)的亞文庫。,1999年完成22號染色體的全序列測定!,2003年全部完成,準(zhǔn)確率達99.99%

24、!,二、我國HGP的發(fā)展戰(zhàn)略和研究現(xiàn)狀,發(fā)展戰(zhàn)略:根據(jù)我國人群資源豐富的特點(56個民族和豐富的病種;山區(qū)封閉的民族群和遺傳隔離群;多世代多個體的大家族具有典型的遺傳性狀或遺傳疾?。怀龌蚪M多樣性研究和重大疾病的疾病基因組研究。,現(xiàn)狀:,-1993年自然基金批準(zhǔn)了“中華民族若干位點基因結(jié)構(gòu)研究”重大項目,標(biāo)志中國的HGP正式啟動,-1996年“重大疾病相關(guān)基因定位、克隆、結(jié)構(gòu)與功能研究”獲“863”資助。,-1999年參與HGP大規(guī)模測序,承擔(dān)1%任務(wù),2000年完成工作框架圖,2001.8提前2年完成完整圖,-已完成南北2個漢族人群、東北地區(qū)12個小數(shù)民族共733個細(xì)胞系的建立,應(yīng)用多種

25、標(biāo)志進行基因組多樣性的比較性研究。,-克隆了遺傳性神經(jīng)性耳聾基因(湖醫(yī)大夏家輝),-我國正進行多種疾病相關(guān)基因組計劃,如肝病、腎病等,已獲得數(shù)百個疾病相關(guān)基因(克隆),總之,有機遇又有差距,2002.4我國科學(xué)家在Science上發(fā)表水稻(秈稻)工作框架圖,三、后基因組計劃,21世紀(jì)生物學(xué)的發(fā)展方向功能基因組學(xué) 對整個基因組所包含的基因、非基因序列的功能進行大規(guī)模分析;認(rèn)識基因在發(fā)育、分化和病理狀態(tài)下的功能變化及其調(diào)節(jié)機制。 后基因組時代的主角蛋白質(zhì)組學(xué) 蛋白質(zhì)組(proteome)是指細(xì)胞或組織表達的全部蛋白質(zhì)。 人類2.4萬個基因,幾十萬種蛋白質(zhì); 重點分析生命不同時期、不同組織、不同(疾

26、?。顟B(tài)蛋白質(zhì)的變化 蛋白質(zhì)組學(xué)(proteomics):是從整體上采取高通量/大規(guī)模手段研究所有蛋白組成及其活動規(guī)律.,基因組學(xué)的延伸模式生物基因組學(xué) 五大模式生物:E.coli、釀酒酵母、黑腹果蠅、秀麗線蟲和小鼠,其序列分析被列為HGP的內(nèi)容; 不同物種間功能基因有相當(dāng)大保守性,如99%鼠基因與人對應(yīng); 最終目的:比較基因組學(xué)比較不同物種的全基因組,增強對各基因功能的認(rèn)識。 從分子水平上升到細(xì)胞水平細(xì)胞計劃 在闡明以基因為核心的生命物質(zhì)的本質(zhì)后,以信號傳導(dǎo)為主線闡明在細(xì)胞內(nèi)一切生命現(xiàn)象的本質(zhì)。 1950年代生物學(xué)從細(xì)胞水平深入到分子水平是一次飛躍,但現(xiàn)在似乎又正返回到細(xì)胞水平! 新型學(xué)科與

27、產(chǎn)業(yè)的發(fā)展生物信息學(xué)和生物芯片,基因組與蛋白質(zhì)組知識 庫,基因組科學(xué)與醫(yī)學(xué)的關(guān)系,基因組學(xué)研究推動了生物產(chǎn)業(yè)發(fā)展,人類基因組計劃的實施帶動了基因組學(xué)的發(fā)展?;蚪M學(xué)的重要性就在于它是整個生命科學(xué)產(chǎn)業(yè)的上游部分,掌握了基因的知識產(chǎn)權(quán),就等于控制了基因工程產(chǎn)業(yè)的核心。 世界上一些最大的制藥集團投巨資進軍生命科學(xué)工業(yè)。CibaGeigy和Sandoz 2.5億美元、GlaxoWellcome 0.47億、Smith Kline 1.25億。 對HGP的預(yù)測,將藥物開發(fā)項目的25建立在HGP基礎(chǔ)上。 大型化學(xué)工業(yè)公司向生命科學(xué)工業(yè)轉(zhuǎn)軌的規(guī)模和力度更大。美國孟山公司于1997年轉(zhuǎn)向生物技術(shù)和基因組研究,

28、共投資66億美元。,四、生物信息學(xué)HGP數(shù)據(jù)的利用,生物信息學(xué)(Bioinformatics)是將計算機和信息科學(xué)技術(shù)運用到生命科學(xué),尤其是分子生物學(xué)研究中的重大交叉學(xué)科。 它通過對生物學(xué)實驗數(shù)據(jù)的獲取、加工、存儲、檢索與分析,進而達到揭示這些數(shù)據(jù)所蘊含的生物學(xué)意義的目的。 它已廣泛地滲透到醫(yī)學(xué)的各個研究領(lǐng)域中,成為生物醫(yī)學(xué)發(fā)展不可缺少的重要 工具。 人類基因組計劃(HGP)和生物醫(yī)藥工業(yè)催生其發(fā)展的的兩個主要力量,1.國內(nèi)外發(fā)展現(xiàn)狀,各國投入大量資金,相繼成立了生物信息中心。 美國的國家生物技術(shù)信息中心(National Center for Biotechnology Informatic

29、s,NCBI) 歐洲生物信息學(xué)研究所 (European Bioinformatic Institute,EBI) 日本信息生物學(xué)中心(Center for Information Biology,CIB)等。 NCBI、EBI和CIB相互合作,共同維護著GenBank、EMBL、DDBJ三大基因序列數(shù)據(jù)庫,它們每天通過計算機網(wǎng)絡(luò)互相交換、更新數(shù)據(jù)。 他們每年召開兩個年會討論合作事宜。 中國國家級生物醫(yī)學(xué)信息學(xué)中心籌建運行。,2.主要應(yīng)用方向功能基因組學(xué),將已知基因序列與功能相聯(lián)系; 以常規(guī)克性為主基因的分離轉(zhuǎn)向以序列和功能分析為基礎(chǔ)的基因分離; 從單個致病基因機制的研究轉(zhuǎn)向多個致病基因機制的

30、研究 比較正常/疾病、疾病/治療、發(fā)育/分化各組織來研究功能基因組和蛋白質(zhì)組; 通過比較不同物種的基因組中各種結(jié)構(gòu)的異同,進行分子進化的研究; 構(gòu)建生物分子的結(jié)構(gòu)模型進行藥物設(shè)計藥物基因組成學(xué),3.主要任務(wù)之一建立和管理各種數(shù)據(jù)庫,Genbank:美國國家生物技術(shù)信息中心的數(shù)據(jù)庫()。 EMBL:建立在歐洲分子生物實驗室的數(shù)據(jù)庫 (http:/www.embl-heidelberg.de)。 DDBJ:日本的DNA數(shù)據(jù)庫銀行(http:/www.nig.ac.jp )。 其他:酵母基因組數(shù)據(jù)庫(SGD)、酵母蛋白質(zhì)數(shù)據(jù)庫(YPD)、擬南芥數(shù)據(jù)庫(At

31、DB)、醫(yī)學(xué)數(shù)據(jù)庫(OMIM)、線蟲數(shù)據(jù)庫(ACEDB),(1)核酸序列數(shù)據(jù)庫三大數(shù)據(jù)庫,(2)蛋白質(zhì)數(shù)據(jù)庫,SwissPDB (Protein Data Bank,) /pdb/cgi/queryForm.cgi Prosite (expasy.hcuge.ch) Pfam (www.sanger.ac.uk/Pfam),(3) 三維結(jié)構(gòu)數(shù)據(jù)庫,PDB( )等。 與蛋白質(zhì)結(jié)構(gòu)有關(guān)的數(shù)據(jù)庫還有: SCOP( )等。 與基因組有關(guān)的數(shù)據(jù)庫: OMIM(/omim/),4. 最重要的任務(wù)從數(shù)據(jù)中提取新知識,生物信息學(xué)最重

32、要的任務(wù),是從海量數(shù)據(jù)中提取新知識。 這首先是從DNA序列中識別編碼蛋白質(zhì)的基因,以及調(diào)控基因表達的各種信號。 其次,從基因組編碼序列翻譯出的蛋白質(zhì)序列; 數(shù)目急劇增加,根本不可能用實驗方法一一確定它們的結(jié)構(gòu)和功能。 從已經(jīng)積累的數(shù)據(jù)和知識出發(fā),預(yù)測蛋白質(zhì)的結(jié)構(gòu)和功能,成為常規(guī)的研究任務(wù)。,核酸序列搜索軟件,Genbank () Entrez BLAST EMBL (European Molecular Biology Laboratory, www.ebi.ac.uk) SRS : srs.ebi.ac.uk , www.sanger.ac.uk/sr

33、s6/,(1) 序列比較和數(shù)據(jù)庫搜索軟件之一,BLAST(Basic Local Alignment Searching Tool) 該工具利用了retrieval system 可以搜索世界上最大的核酸數(shù)據(jù)庫EMBL+Genbank+DDBJ,最大的蛋白質(zhì)數(shù)據(jù)庫等。 我們可以輸入一段DNA、RNA、蛋白序列,一段插入序列、tRNA序列、與HIV相關(guān)的序列等,從而分析這段序列的同源性,再根據(jù)同源性推論出它所具有的功能。 還可以通過輸入一段DNA序列,而知道它所編碼的蛋白質(zhì)的功能,以及它來源與是什么生物。,(2)序列比較和數(shù)據(jù)庫搜索軟件之二,FASTA 96年推出的FASTA3實現(xiàn)了高度的并行化

34、,能夠在多CPU的計算機上將搜索速度提高數(shù)倍,還支持并行虛擬機器技術(shù)(Parallel Virtual Machine),增加了并行網(wǎng)絡(luò)計算機制。 多序列比較軟件(Mulitple Alignment)(用戶可以同時輸入多個序列),第四節(jié) DNA多態(tài)性及其意義,DNA多態(tài)性:除同卵雙生的兩個體外,沒有兩個人的DNA組成是完全相同的,即人類DNA組成具有多態(tài)性。 如果比較隨機的十個人的常染色體的非編碼區(qū),就會發(fā)現(xiàn)約200400bp就有一個核苷酸不同,這些可變區(qū)域即稱為DNA多態(tài)性 (DNA polymorphism)位點 DNA多態(tài)性標(biāo)記的價值 為路標(biāo),構(gòu)建DNA標(biāo)記的遺傳連鎖圖譜; 使遺傳圖譜

35、從直接可見的表型多樣性標(biāo)記進步到DNA分子本身多態(tài)性標(biāo)記,1. DNA位點的多態(tài)性(DNA site polymorphism),這種多態(tài)性是由控制某些性狀的DNA堿基差異造成的。如人的白細(xì)胞抗原(HLA)僅其HLA-DR抗原就有6個位點、60多個等位基因(等位基因多態(tài)性)。,DNA位點的多態(tài)性導(dǎo)致限制性內(nèi)切酶切割位點的差異,即限制性片段長度多態(tài)性(restriction fragment length polymorphism,RFLP) RFLP是第一代DNA遺傳學(xué)標(biāo)記,由此發(fā)展成了RFLP技術(shù)(酶切、電泳、轉(zhuǎn)膜、探針雜交,探針為基因序列或cDNA),一、DNA多態(tài)性的種類,2. 串連重復(fù)

36、順序多態(tài)性,串連重復(fù)順序的核心順序重復(fù)的次數(shù)差異,即可變數(shù)串連重復(fù)(variable number tandom repeats,VNTR),VNTR及重復(fù)順序中的插入小片段導(dǎo)致了串連重復(fù)順序多態(tài)性。,DNA指紋分析(DNA fingerprint),亦是RFLP技術(shù)的特殊型,由于串連重復(fù)順序的核心順序兩側(cè)的序列是沒有個體差異的,因此使用限制性內(nèi)切可切下重復(fù)順序,選用特定的探針(高拷貝的小衛(wèi)星、微衛(wèi)星或人工合成的簡短重復(fù)順序等),能獲得個體特異的指紋圖譜。,VNTR和位點多態(tài)性亦符合孟德爾遺傳規(guī)則,故指紋分析可作為遺傳病診斷、法醫(yī)個體鑒定、親子鑒定,微衛(wèi)星標(biāo)記第二代DNA標(biāo)記,微衛(wèi)星DNA(microsatellite DNA)或稱簡短串連重復(fù)(short tandem repeat, STR),由26個核苷酸的重復(fù)順序組成,如(CA)n、(GA)n、(TA)n,n為1530具有多態(tài)性,衛(wèi)星長度常小于100bp,大量分布每條染色體。 由于STR的核心順序兩側(cè)的序列是沒有個體差異且長度各不相同,因此,以此兩側(cè)序列為PCR引物,能獲得個體特異的指紋圖譜(亦稱全基因掃描)。 6000個STR標(biāo)記作圖,96年已全部完成 全基因掃描目前已半自動化,單核苷酸多態(tài)性(single nucleotide polymorphism, SNP):指發(fā)生在基因組序列中單個

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論