(計算機應用技術專業(yè)論文)基于DNA微陣列基因表達譜數據的癌癥檢測研究.pdf_第1頁
(計算機應用技術專業(yè)論文)基于DNA微陣列基因表達譜數據的癌癥檢測研究.pdf_第2頁
(計算機應用技術專業(yè)論文)基于DNA微陣列基因表達譜數據的癌癥檢測研究.pdf_第3頁
(計算機應用技術專業(yè)論文)基于DNA微陣列基因表達譜數據的癌癥檢測研究.pdf_第4頁
(計算機應用技術專業(yè)論文)基于DNA微陣列基因表達譜數據的癌癥檢測研究.pdf_第5頁
已閱讀5頁,還剩120頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

博i 學伊滄文 摘要 癌癥治療面臨的重大挑戰(zhàn)是如何針對病原上各自獨特的癌癥類型制定具體的 治療方法,以達到最大療效的同時降低藥物的副作用。因此,癌癥檢測或癌癥分 類成為癌癥治療的中心環(huán)節(jié)。一直以來,癌癥檢測主要基于腫瘤的形態(tài)表觀,但 這種檢測方式有很大的局限性,因為具有相似組織病理學表觀的腫瘤可能表現出 很不相同的臨床發(fā)展過程,或者對同種治療呈現出不同反應。近年來,d n a 微陣 列技術的發(fā)展產生了海量的基因表達譜數據,為尋找基因之間表達調控的復雜關 系網絡,研究功能基因組和癌癥檢測提供依據。目前,利用基因表達譜進行癌 癥檢測成為癌癥研究的重點之一。但是基因表達譜數據具有高維性,高噪聲, 高冗余,數據分布不均衡等特點,對基因數據分析方法提出了更高要求,對基 于d n a 微陣列基因表達譜的癌癥檢測帶來了挑戰(zhàn)。 本論文從基因表達譜數據的分析著手,以挖掘基因表達模式和癌癥檢測研究 為主要目標,研究癌癥檢測中基因表達數據的預處理、特征基因的選取、癌癥組 基因表達模式的分析以及建立合適的基因診斷模型的問題。本文的主要工作歸納 如下: 第一,針對基因表達數據的特點,提出一種基于c m s t 聚類方法的分步的特 征基因選擇方法,然后,在分步的特征基因選擇方法中引入“g a ps t a t i s t i c ”理 論,以確定特征基因數目,提出一種自適應的特征基因的選擇方法,彌補目前的 特征基因選擇算法中缺乏較好的基因數目預置機制的不足。 第二,利用主分量分析方法( p c a ) 和獨立分量分析方法( i c a ) 挖掘基因 表達譜中隱含的基因表達模式,揭示癌癥中基因的調控機制,通過抽樣來選取特 征基因子集以減少噪聲對p c a f 和i c a p 的影響,并且根據基因子集中隱含模式的 相似性來重構基因表達,提出一種基于隱含變量模型的癌癥檢測算法。 第三,利用癌癥組基因表達存在的局部特征相關性的生物病理特點,提 出d n a 微陣列基因表達譜中癌癥組關聯空間的概念,抽取不同癌癥組基于關聯空 間的基因特征模式,研究與癌癥組相關聯的基因表達模式在癌癥組中的表達以及 調控,并提出適合癌癥組相關聯的基因表達模式的癌癥預測算法,有效緩解基因 數據集中“維數災難”的問題。 第四,由于不同的特征選擇方法采用不同的搜索機制和評價策略,挑選出的 特征基因偏向癌癥特征的不同方面,因此不同方法選擇的特征基因明顯不同,導 致分類器的識別結果不穩(wěn)定。針對癌癥組基因數據和基因組數據構建一組具有互 補性分類器,提出一種組合分類算法提高癌癥分類算法的泛化性能。 萆十儆辨別蘋嘲發(fā)迓譜數掘, 勺穗痹搶測研究 第五,從基因之間的協同表達來分析基因數據,研究具有可解釋的基因表達 模式。在顯現模式的提取中增加虛擬樣本以挖掘具有更高辨識能力的顯現模式, 并在候選分割點選擇策略中通過高斯分布來模擬分割點的分布,提高分割點選擇 的可靠性,然后提出兩種基于顯現模式的癌癥檢測算法。 關鍵詞:d n a 微陣列;基因表達譜;癌癥檢測;特征基因;基因調控;基因表 達模式 1 l 博f 學伊論文 a b s t r a c t t h eg r e a tc h a l l e n g ei nc a n c e rt r e a t m e n ti sh o wt od i r e c ts p e c i f i ct r e a t m e n tt op a r t i c u l a rt u m o u l i no r d e rt oa c h i e v et h eb e r e rt h e r a p ye f f e c tw h i l et h el o w e rt o x i c i t y s ot h e c a n c e rd e t e c t i o no rc a n c e rc l a s s i f i c a t i o nb e c o m e so n ek e yp o i n tf o rc a n c e rt h e r a p y f o ra l o n gt i m e ,t h ec l a s s i f i c a t i o nl i e so nt h es a m p l em o r p h o l o g y , w h i c hi sn o t e f f i c i e n ti nm a n y c a s e s b e c a u s et u m o u r si nd i f f e r e n ts t a g e sm a y p r e s e n ts i m i l a rp a t h o m o r p h i s ma n dt u m o u e sw i t hs i m i l a rp a t h o m o r p h i s mm a yr e a c td i f f e r e n t l yt ov a r i o u st h e r a p i e s n o wc a n c e r d e t e c t i o nu s i n gg e n ee x p r e s s i o nd a t ai sa ni m p o r t a n ta s p e c ti nc a n c e rr e s e a r c h r e c e n t l y , w i t ht h ed e v e l o p m e n to fm i c r o a r r a yt e c h n o l o g ym a s s i v eo fg e n ee x p r e s s i o nd a t ai sp r o d u c e d , w h i c hi sh e l pf o re x p l o r i n gc o m p l i c a t e dg e n e t i cr e g u l a t i n gn e t w o r k , i n v e s t i g a t i n g f u n c t i o n a lg e n o m ea n ds t u d y i n go nc a n c e rd e t e c t i o n h o w e v e r , t h e r ea r ec h a r a c t e r si ng e n e e x p r e s s i o nd a t a , s u c ha sh i g hd i m e n s i o n a l i t y , h u g en o i s e ,h u g er e d u n d a n c ya n dn o n e q u i l i b r i u md i s t r i b u t i o n , w h i c hi m p o s e sc h a l l e n g e sf o rd e v e l o p m e n to f t h ea s s o c i a t e dd a t am i n i n g t e c h n i q u e sa n dc a n c e rd e t e c t i o n i nt h i sd i s s e r t a t i o n , w ee m p h a s i z eo na n a l y s i so fg e n ee x p r e s s i o nd a t a o u rm a j o r g o a l sa x ef o rg e n ee x p r e s s i o nm o d em i n i n ga n dc a n c e rd e t e c t i o n w ee x p l o r et h eg e n e e x p r e s s i o nd a t ap r e - p r o c e s s i n g ,t h ef e a t u r eg e n es e l e c t i o n , a n a l y s i so fg e n ee x p r e s s i o n m o d e lt oc a n c e ra n db u i l d i n gt h ec a n c e rd e t e c t i o nm o d e l t h em a i nc o n t r i b u t i o n so ft h i s d i s s e r t a t i o na l es u m m a r i z e da f t ;b e l o w : f i r s t l y , t h ec h a r a c t e r so fg e n ee x p r e s s i o np r o f i l ea r ea n a l y z e da n d ac m s t c l u s t e r i n g b a s e dm u l t i s t e pg e n es e l e c t i o ns c h e m ei sp r o p o s e d ,t h e n ”g a ps t a t i s t i c i si n t r o d u c e d i n t ot h i sf e a t u r eg e n es e l e c t i o nt od e t e r m i n et h en u m b e ro ff e a t u r eg e n e s ,s ow ed e v e l o p as e l f - a d a p t i v eg e n es e l e c t i o nm e t h o d , w h i c hm a k e sag r e a ti m p r o v e m e n tc o m p a r e dt ot h e m e c h a n i s mo fs e t t i n gt h en u m b e ro ff e a t u r eg e n e sa r b i t r a r i l y s e c o n d l y , p c aa n di c a i sa p p l i e dt oa n a l y z et h eg e n ee x p r e s s i o nd a t aa n di n v e s t i g a t e t h eu n d e r l y i n gr e g u l a t i n gf a c t o ra n dg e n er e g u l a t i n gn e t w o r k i n gi nc a n c e r s a m p l i n gi s u s e dt op r o d u c et h eg e n es u b s e t s ,a n di nt h ep c a pa n di c a po f s u b s e t st h en o n i n f o r m a t i v e f e a t u r e sa r er e d u c e d , t h e nt h eg e n ee x p r e s s i o nm o d e sa r er e c o n s t r u c t e da n dah i d d e ng e n e e x p r e s s i o nm o d e lb a s e dc a n c e rd e t e c t i o ni sp r e s e n t e d t h i r d l y , t h eb i o l o g i c a ll o c a l i t yo fg e n ee x p r e s s i o nt ot h ec a n c e ri se x p l o r e d , a n da c o n c e p to f r e l a t i v es p a c e t oac a n c e ri sp r o p o s e d , t h e nt h ec a n c e r o g e n i cg e n em o d eb a s e d o nr e l a t i v es p a c ei se x t r a c t e d , a n dt h er e g u l a t i o nw i t l lc a n c e r o g e n i cg e n em o d ei sd i s c u s s e d 1 1 1 棼卡微弦硎革田表達譜數搦的瘸瘁撿測研究 t h e nac a n c e rd e t e c t i o na l g o r i t h mw i t hr e l a t i v eg e n ee x p r e s s i o nm o d ei sp r o p o s e d ,i n w h i c ht h ep r o b l e mo f c u r s eo f d i m e n s i o n a l i t y i sr e l i v e d f o u r t h l y , w h e n d i f f e r e n tf e a t u r es e l e c t i o n sa r eu s e d ,a st h er e s e a r c h i n gm e c h a n i s ma n d e v a l u a t i o ns t r a t e g ya r ed i f f e r e n tt h ed i s t i n c tf e a t u r eg e n e s ,w h i c ht e n dt od i f f e r e n ta s p e c t s o f c a n c e r , a l es e l e c t e d t h ec l a s s i f i c a t i o nr e s u r su s i n g t h e s ec l a s s i f i e r sw i t hd i s t i n c tg e n e s v a r i e dal o t s oa g r o u p o fc o m p l e m e n t a lg e n ec l a s s i f i e r sa r ec o n s t r u c t e d ,a n dae n s e m b l e c a n c e rc l a s s i f i c a t i o na l g o r i t h mi sp r o p o s e d f i f t h l y , t h eg e n ec o e x p r e s s i o na n de x p l a i n a b l ee m e r g i n gp a t t e r na r ee x p l o r e d t h e v i r t u a ls a m p l e si sa d d e dt ot oi m p r o v ed i s t i n g u i s h m e n to fe m e r g i n gp a t t e r n ,a n di nt h e s t r a t e g yo fc h o o s i n gc u tp o i n tt h ed i s t r i b u t i o no fc u tp o i n ti sa s s u m e dt ob et h eg a u s s i a n d i s t r i b u t i o nf o ri m p r o v i n gt h er e l i a b i l i t yo fe m e r g i n gp a t t e r na n dt w oe m e r g i n gp a t t e m b a s e dc a n c e rd e t e c t i o n sa l ep r e s e n t e d k e y w o r d s :d n am i e r o a r r a y ;g e n ee x p r e s s i o np r o f i l e ;c a n c e rd e t e c t i o n ;f e a t u r e g e n e ;g e n er e g u l a t i o n ;g e n ee x p r e s s i o nm o d e i v 圖1 1d n a 微陣列技術及應用 圖1 2 基因表達譜數據 插圖索引 圖2 1 雙向層次聚類圖 圖2 2 自組織映射 圖2 3g s 法 圈3 1 自組織樹算法 圖3 2 0 s c m s t 在b u d d i n g y e a s t d a t a s e t 上的實驗結果 圖3 3 0 s c m s t 在y e a s t f u n c t i o n a l g e n o m e 上的實驗結果 圖3 4o s c m s t 在a l i z a d e h 上的實驗結果 圖4 1 癌癥組織中基因表達的混合模型 圖4 2 癌癥組織中基因表達的解混模型 圖4 3 基于i c a 隱含變量的基因表達模型 圖4 4 在y e a s t 中七類基因的平均表達譜 圖4 5 在y e a s t 中i c a e 模型的基因表達模式i c a p 圖4 6 在y e a s t 中的基因表達模式e i c a p 圖4 7 在y e a s t 中p c a e 模型的基因表達模式p c a p 圖4 8 在y e a s t 中的基因表達模式e p c a p 圖5 1 樣本在i 維,i i 維和i i i 維空間下的分布情況比較 圖5 2 癌癥模式p 和q 中致癌因子的局部相關性 圖5 3l e u k e m i ad a t a s e t 中平均正確率隨d 的變化情況 圖5 4 c o l o n d a t a s e t 中平均正確率隨d 的變化情況 圖5 5a l l 和a m l 在g a l l 下的分布 圖5 6 a l l 和a m l 在g a m l 下的分布 圖5 7 t c t 和n c t 在t 下的分布 圖5 8t c t 和n c t 在 ,凹下的分布 圖6 1 基因特征選擇和分類器組合 圖6 2 癌癥識別中的全局分量模型 圖6 3 癌癥識別中的癌癥組分量模型 圖6 4c c m 的癌癥組分量和g c m 的全局分量 圖6 5 基于組合g c m 和c c m 的癌癥識別 圖6 6 基于組合g c m 和c c m 的解決方案 圖6 7 獨立測試實驗結果 圖6 8l o o c v 交叉測試實驗結果 圖6 9f f c v 交叉測試實驗結果 圖7 1 分割點的分類性能比較1 0 4 v 四加n ” 鋁鑼鉀舛舛鮐” 鼴鼴:2的卯鋸鈔田 記弭踮盯盯 萆十徽斛列萆田表選譜數瓤的稚疼傳測研完 附表索引 表3 1b u d d i n g y e a s t d a t a s e t 表3 2 y e a s t f u n c t i o n a l g e n o m e 表3 3 a l i z a d e h s d a t a s e t 表3 4 在b u d d i n g y e a s t d a t a s e t 數據集上的基因聚類結果比較 表3 5 在b u d d i n g y e a s t d a t a s e t 上的聚類結果 表3 6 在y e a s t f u n c t i o n a l g e n o m e 上的聚類結果 表3 7 經不同基因預處理后的癌癥識別結果( a ) 表3 8 經不同基因預處理后的癌癥識別結果( b ) 表3 9 分類結果比較 表4 1l o o c v 測試實驗結果( s v m ) 表4 2l o o c v 測試實驗結果( k n n ) 表5 1l e u k e m i ad a t a s e t 中l(wèi) o o c v 的實驗結果比較 表5 2 c o l o n d a t a s e t 中l(wèi) o o c v 的實驗結果比較 5 6 5 6 6 7 6 8 表6 1 基因表達譜數據集8 2 表6 2 噪聲基因過濾8 3 表6 3 混亂矩陣8 3 表6 4 獨立測試實驗結果8 4 表6 5l o o c v 測試實驗結果8 6 表6 6 f f c v 測試實驗結果8 6 表7 1 離散方法分離出的前2 5 個特征基因及分割點 表7 2 基于m - 估計的離散方法分離出的前2 5 個特征基因及分割點 表7 3 顯現模式中的三個特征基因在分割點的類別信息熵 表7 4 增強顯現模式中的三個特征基因在分割點的類別信息熵 表7 5 測試集樣本在基因表達規(guī)則上的分布情況 表7 6 測試集樣本在增強基因表達規(guī)則上的分布情況 表7 7a l l 樣本中增長率最大的前2 5 個e p i s 表7 8a m l 樣本中增長率最大的前2 5 個e p i s 表7 9 試驗結果比較 表7 1 0 a l l 中增長率最大的前2 0 個e p a s 表7 1 1a m l 中增長率最大的前2 0 個e p a s 表7 1 2 試驗結果比較 孫n弘孫弘拍詣 鱷卯卯粥:兮 湖南大學 學位論文原創(chuàng)性聲明 本人鄭重聲明:此處所呈交的論文基于d n a 微陣列基因表達譜數 據的癌癥檢測研究,是本人在導師的指導下獨立進行研究所取得的成 果。除了文中特別加以標注引用的內容外,本論文不包含任何其他個人 或集體已經發(fā)表或撰寫的成果作品。對本文的研究做出重要貢獻的個人 和集體,均已在文中以明確方式標明。本人完全意識到本聲明的法律后 果由本人承擔。 作者躲知詞 日期矽。7 年,f 月- 乒日 學位論文版權使用授權書 本學位論文作者完全了解學校有關保留、使用學位論文的規(guī)定,同 意學校保留并向國家有關部門或機構送交論文的復印件和電子版,允許 論文被查閱和借閱。本人授權湖南大學可以將本學位論文的全部或部分 內容編入有關數據庫進行檢索,可以采用影印、縮印或掃描等復制手段 保存和匯編本學位論文。 本學位論文屬于 1 、保密口,在年解密后試用本授權書。 2 、不保密囪。 ( 請在以上相應方框內打“”) 日期p 0 7 年九月 爭日 醐。1 q 一7 日 司弋 蓯并 孫銃套鴦 者師惻副 第1 章緒論 在多年的癌癥( 疾病) 研究中,科學家和醫(yī)學工作者們認識到,癌癥并不只 是某一種疾病,在它的背后,隱藏著形形色色,變化多端的種類,存在著幾百種 這樣的癌癥。它們?yōu)槭裁匆恢彪y以攻克呢? 其主要的原因是由于每一種癌癥都有 自己的特點,一種藥物并不能對各個不同組織的癌癥都能產生療效,有些能抑制 住腫瘤細胞,但有些卻毫無作用,甚至在病癥上相同的癌癥,也無法用一種藥物 達到治療的目的。隨著人類生命科學的發(fā)展,人們對于基因這一有關人類生長、 發(fā)育、衰老、遺傳的最重要和最本質的因素,有了新的認識,并逐漸開始將基因 引入對疾病的診斷、治療、藥物研制、藥物篩選等方面。因此,基因診斷、基因 治療,藥物基因組圖等應運而生。通過基因進行疾病診治是對傳統(tǒng)診治方法提出 的巨大挑戰(zhàn),成為人們關注的焦點。 2 0 世紀9 0 年代初開始實施的人類基因組計劃( h u m a ng e n o m ep r o j e c t ,h g p ) 與2 0 世紀4 0 年代制定的曼哈頓原子彈計劃( m a n h a t t a np r o j e c t ) 以及6 0 年代制定的 阿波羅登月計劃( a p o l l op r o j e c t ) 并稱為美國的三大國家計劃。人類基因組計劃 是由美國科學家于1 9 8 5 年率先提出”“,旨在闡明人類基因組3 0 億個堿基對( b a s e p a i t s ) 的序列,發(fā)現所有人類基因,并搞清其在染色體( c h r o m o s o m e ) 上的位 置,破譯人類全部遺傳信息,讓人類第一次在分子水平上全面地認識自我,該計 劃1 9 9 0 年正式啟動。英、日、德、法隨后相繼加入該計劃,值得關注的是1 9 9 9 年 中科院基因組中心代表中國正式加入該計劃,承擔了1 人類基因組的測序任 務。2 0 0 1 年2 月,人類基因組草圖宣布完成“。隨著以測序為主的結構基因組計 劃( s t r u c t u r a lg e n o m i c sp r o j e c t ) 的完成,生命科學研究的重點也逐漸的轉變?yōu)橐?對基因功能研究為主的功能基因組計劃( f u n c t i o n a lg e n o m i c sp r o j e c t ) 。功能基 因組計劃的主要任務之一是尋找調控疾病的相關基因,研究與疾病相關基因功 能,進行基因功能鑒定,研究通過基因表達實現疾病診斷和基因治療。在“九 五”“十五”期間,功能基因組計劃研究已被列為國家高科技計劃8 6 3 和9 7 3 重大 專項。 一項類似于計算機芯片技術的新興生物高技術一d n a 微陣列( m i c r o a r r a y ) 技術,或稱為生物芯片( b i o c h i p ) 、d n a 芯片( d n ac h i p ) 、基因芯片( g e n e c h i p ) “”,隨著人類基因組研究的進展應運而生。自從1 9 9 1 年a f f y m e t r i x 公司 的f o a o r 博士等人”提出基因芯片的概念后,已有多種不同功用的基因芯片問世, 并在生命科學研究中開始發(fā)揮重要作用。近年來d n a 微陣列技術”1 得到了迅猛 發(fā)展,產生了大量基因序列和基因表達水平數據。如何利用d n a 微陣列技術研究 輩十儆礦砷k 四五讓啦數批7 兜弼礦拎刪職了: 基因的功能、基因的調控,以及在疾病中的基因變異和基因表達。因此,研究者 提出了后基因組計劃、蛋白組計劃、疾病基因組計劃以破澤人類基因這部天書。 生物體發(fā)育、分化、生長相代謝的過程,始終足遺傳信息從儲有到表達、加 工及傳遞的過程;實質上,主要是基因中m r n a ( c d n a ) 信息的傳遞過程。而 生物體的遺傳、變異和進化問題則主要體現在遺傳信息的復制、重組、變異和選 擇。d n a 微陣列利用成千上萬密集排列的基因探針,通過己知堿基順序的d n a 片 段,并結合堿基互補的原則檢測細胞基因m r n a ( c d n a ) 表達水平。不同個體 基因變異、不同組織、不同時間、不同生命狀態(tài)等基因表達的分析是基因組計 劃、蛋白組計劃和疾病基因組計劃中最重要的一個環(huán)節(jié)。d n a 微陣列基因表達數 據在疾病診斷、基因治療、藥物篩選、給藥個性化、新基因發(fā)現、d n a 計算機研 究等領域發(fā)揮重要的作用。 d n a 微陣列具有高速度、高通量、集約化的特點,所以我們可以通過微陣列 一次性對大量序列進行檢測和基因分析,獲取高維的基因表達數據”?!? 。通過基 因表達數據研究人員能夠在基因組層次上研究任何種類細胞在任何時間、任何給 定條件下的基因表達模式,可以幫助我們深入研究和了解生物過程的本質。通過 分析基因表達數據,我們可以了解疾病在基因級別的發(fā)病機理、疾病的診斷、基 因級別的藥物研制以及基因治療。當前的腫瘤檢測和分類技術高度依賴于病理學 工作者對癌癥組織的主觀判斷,而基于微陣列技術,即使一些組織沒有顯著變 化,利用基因表達數據也可以對之做出早期診斷”。如何利用基因表達數據揭示 基因在影響和調控癌癥組織產生的變異? 如何利用基因表達數據有效地識別癌癥 組織,并為人類最終戰(zhàn)勝各種病魔提供有效武器? 然而,基于微陣列數據的分析 方法和基于微陣列數據的癌癥檢測的發(fā)展才剛剛起步,解決上述問題具有巨大的 挑戰(zhàn)“。 1 1d n a 微陣列技術簡介 d n a 微陣列技術是融微電子學、生物學、物理學、化學、計算機科學于一體 的高度交叉的新興技術。d n a 微陣列技術已被公認將會給2 1 世紀的生命科學和醫(yī) 學研究帶來一場革命,并因此成為學術界和工藝界研究的一個熱點。美國總統(tǒng)克 林頓在1 9 9 8 年1 月的國情咨文演講中指出:“在未來的1 2 年內,基因芯片將為我 們一生中的疾病預防指點迷津”。另外,美國商界權威刊物f o r t u n e 對其重大意義 作了如下闡述:“微處理器在本世紀使我們的經濟結構發(fā)生了根本改變,給人類 帶來了巨大的財富,改變了我們的生活方式。然而,生物芯片給人類帶來的影響 可能會更大,它可能從根本上改變我們的醫(yī)學行為和生活質量,從而改變世界的 面貌“。由于生物芯片技術領域的飛速發(fā)展,美國科學促進協會于1 9 9 8 年底將 生物芯片評為1 9 9 8 年的十大科技突破之一“。 基因芯片就是利用點樣技術、現代探針固相原位合成技術、照相平板印刷技 術等微電子技術在有限的空間內,將成千上萬種基因的d n a 片段有組織的點在固 相片基上作為可尋址識別的基因探針。在微陣列實驗中,所有的r n a 被反轉錄成 帶有放射性同位素或熒光標記的e d n a 。然后,c d n a 與由基因片段組成的、固相 片基上的大型d n a 文庫雜交。最后,采用熒光或其他成像技術測定上千個基因在 各種不同實驗條件下的表達,以檢測不同組織或不同細胞的基因表達情況,為疾 病診斷和基因治療提供大量的遺傳變化信息”1 ,如圖1 1 所示。按照芯片的制作原 理,基因芯片可以分為很多類,但目前真正成熟的,且廣泛應用的有使用原位合 成和合成點樣技術的微陣列( m i c r o a r r a y ) 。 圖1 1d n a 微陣列技術及應用 1 1 1d n a 微陣列的制備技術 d n a 微陣列的實質是高度集成的寡核苷酸陣列,制造基因芯片首先要解決的 技術是如何在芯片片基上定位合成高密度的核酸探針。目前,基因芯片的制備技 術主要有以下幾種: 茸十做阱硎革罰女達講數批叼彬癌盼例碳完 1 1 1 1 原位合成法 原位合成( h as i r es y n t h e s i s ) 是指直接在芯片上用四種核苷酸合成所需探針 的基因芯片制備技術。原位合成方法可以制作高密度基因芯片,但是,需要的技 術設備復雜,成本較高并且合成的效率較低。主要包括: 1 原位光刻 美國a f f y m e t r i x 公司結合了半導體工業(yè)的光刻技術$ 1 d n a 合成技術制造發(fā)展 的一項高密度核酸陣列的基因芯片制備技術。它利用光保護基團修飾芯片片基表 面堿基單體的活性羥基,通過設計特定的光刻掩膜和不斷地更換曝光區(qū)域,直接 在片基上合成所需高密度寡核昔酸陣列,探針數目在合成循環(huán)中呈指數增長。 2 原位噴印合成 原位噴印合成原理與噴墨打印類似,不過芯片噴印頭和墨盒有多個,墨盒中 裝的是四種堿基等液體而不是碳粉;采用的化學原理與傳統(tǒng)的d n a 固相合成一 致,因此不需要特殊制備的化學試劑。 3 分子印章多次壓印 根據所需微陣列,設計有凹凸的微印章,然后根據預先設計在制備的各級印 章上涂上對應的單核苷酸;按照設計的順序將不同的微印章逐個依次壓印在同一 基片上,得至u 2 5 6 2 5 6 陣列的高密度基因芯片。 1 1 1 2 合成點樣法 合成點樣法( o f f - c h i pd n as y n t h e s i s ) 是指將合成好的探針、c d n a 或基因 組d n a 通過特定的高速點樣機器人直接點在芯片片基上。制作基因芯片的密度 低,需要的設備簡單,成本較低,適用于多數實驗室制作基因芯片。目前, 除a f f y m e t r i x 等研究和生產基因芯片的少數大公司使用原位合成法外,其他中小 型公司和實驗室研究中普遍采用合成點樣法。 1 微型機械點樣法 該技術是由s h a l o n 和b r o w n 于1 9 9 5 年發(fā)展起來的一類芯片制備技術,而后由 美國s y n t e n i 公司開發(fā)出商品儀器。該方法通過毛細作用使用點樣針將生化物質轉 移到固體基底表面( 點樣針與基底表面接觸) ,每一輪結束后,清洗點樣針進行 下一輪操作,而且機器人控制系統(tǒng)可使其實現自動化生產。 2 化學噴射法 將合成好的寡核苷酸探針定點噴射到芯片片基上來制作d n a 芯片。該技術 f l j i n c y t ep h a r m a c e u t i c a l s 和p r o t o g e n e 公司等發(fā)展。該方法通過應用與壓電接口相連 的微型噴嘴將生化物質噴向基底,通過電流控制使樣品體積得到精確控制。 1 1 2d n a 微陣列技術的主要特點 d n a 微陣列技術將成千上萬的核酸探針固定于芯片片基上與標記的樣品分子 進行雜交,通過檢測每個探針分子的雜交信號強度獲取樣品分子中的基因表達水 平。相對于傳統(tǒng)的基因檢測技術,d n a 微陣列技術的具有以下特點:技術操作簡 單、自動化程度高、檢測基因數量大、檢測效率高、應用范圍廣、成本相對低。 1 2d n a 微陣列技術的應用 d n a 微陣列技術將生命科學研究中許多不連續(xù)的分析過程,如樣本制備、生 化反應和定性、定量檢測等,集中到指甲蓋大小的芯片上,使基因分析過程全自 動化,被稱為“芯片實驗室”( l a b o n - ac h i p ) 。該技術成千上萬倍提高基因分 析效率的同時,大大減少了樣品和試劑,并且實驗結果更具全面性、直觀性和 可重復性。因此,d n a 微陣列技術廣泛地應用于分子生物學及醫(yī)學研究的各個方 面。 1 2 1 基因組測序 d n a 微陣列的思想是在基因測序的早期提出的,由于傳統(tǒng)的基因測序方法難 以解決人類基因組計劃如此繁重的工作,因此d n a 微陣列早期主要用來研究基因 組結構。d n a 微陣列技術可在一次實驗中利用探針與待測樣本分子進行大量雜交 反應,并分析雜交反應產生的雜交圖譜而排列出待測樣品的序列。h a c i a 在n a t u r e g e n e t i c s 上對用寡核苷酸微陣列進行基因重復測序和基因突變分析進行了較為詳 細的敘述川。 1 2 2 基因表達分析 基因表達( g e n ee x p r e s s i o n ) 是指儲存遺傳信息的基因經過一系列步驟表現 出其生物功能的整個過程。典型的基因表達是基因經過轉錄、翻譯,產生有生物 活性的蛋白質的過程。d n a 微陣列已被用來測定菌類、植物、動物和人類樣品中 的基因表達水平。 斯坦福大學的s c h e n a 于1 9 9 5 年首先使用d n a 微陣列研究擬南芥( a r a b i d o p s i s t h a l i a n a ) 基因表達,通過芯片雜交分析擬南芥根與葉兩種組織中基因的差異表 達嘲。 d e r i s i 等“”應用釀酒酵母( s a c c h a r o m v c e sc e r e v i s i a e ) e d n a 基因芯片研究孢 子在有絲分裂狀態(tài)下基因轉錄和表達水平的差異。斯坦福大學的b r o w n 研究小組 應用合成點樣法制備釀酒酵母c d n a 微陣列,獲得酵母在不同細胞周期狀態(tài)以及 職十徽阱列菲習衷地誥戡荊均癬癢_ 陀測研究 在熱休克冷休克處理后其2 4 7 3 個基因的表達譜,較直觀地反應了不同條件和狀態(tài) 下基因轉錄調控水平,為尋找基因調控的機理提供了一條有效的途徑。 t a n a k a 等“”利用基因芯片技術檢測了1 5 0 0 只小鼠妊娠中期子宮及胚胎發(fā)育過 程中基因的表達情況,從而了解到哺乳類動物胚胎發(fā)育過程中基因表達的動態(tài)變 化。 g o l u b 等”分析了人類白血病的6 8 1 7 個基因表達譜,利用基因表達水平的差 異將7 2 個白血病樣本分成a m l 和a l l 兩組,并取得了較好的準確性。b u l l 等”1 用 包含前列腺癌、損害前身和正常組織的e d n a 微陣列研究前列腺癌中基因表達。 標記從前列腺電切術( t u r p ) 或前列腺根治術得到的腫瘤樣品的e d n a ,分析其 表達,揭示了許多上調轉錄和基因過表達 1 2 3 發(fā)現新基因 微陣列技術是一項發(fā)現新基因及分析各個基因在不同時空表達方面 十分有用的技術,它具有樣品用量極少,自動化程度高等優(yōu)點,便于大 量篩選新基因。h e l e r 等”1 利用e d n a 芯片比較了炎證性疾病類風濕關節(jié)炎 和腸炎組織中基因表達的不同,并導致進一步發(fā)現了炎癥相關基因i l 3 ,g r o - a 等。b u a t e s 等“”鑒定了由激活因子( s 2 8 4 6 3 ) 誘導表達的一系列基 因。s c h e n a 等用包含1 0 5 6 個c d n a 的芯片與熱休克作用和佛波酯處理的t 細胞 的c d n a 雜交,發(fā)現了4 個新基因。目前,人類基因數據庫中有4 0 0 0 0 0 個基因表 達序列標簽( e x p r e s s e ds e q u e n c et a g ,e s t ) 。成千上萬的e s t s 微陣列為人類基 因表達研究提供強有力的分析工具,加速人類基因組的功能分析。 1 2 4 在疾病診斷中的應用 疾病的發(fā)生和發(fā)展實際是多種疾病相關基因表達失?;蛟S多疾病抑制基因失 活所致。利用基因微陣列技術,可以找到與該疾病相關的基因,實現對該疾病快 速、簡便、高效的診斷。人類惡性腫瘤的6 0 與人類尸5 3 抑癌基因的突變有關, 對癌癥樣本的基因突變和異常表達進行檢測可以作為診斷的重要指標。 k a u r a n i e m i 等利用e d n a 芯片技術和n o r t h e r n 雜交技術檢測了b r c a l 乳腺癌 患者m y b 基因m r n a 的表達情況,發(fā)現在b r c a l 突變型中m y b 基因表達較常 見”。o k u s t s u 等從7 6 例急性細胞白血病( a m l ) 患者獲得2 3 0 4 0 個基因構成的腫 瘤細胞基因表達譜,結果a m l 患者有6 3 個基因過表達,3 7 2 個基因的表達受到 抑制,這些基因可能調控與a m l 發(fā)病分子機制有關的關鍵因子,也成為a m l 藥 物治療的潛在靶基因。同時通過比較a m l 患者對化療敏感者與對化療不敏感 患者的基因表達情況發(fā)現有2 8 個基因的表達水平不同,基于此基礎建立一個 個體抗腫瘤藥物的敏感系統(tǒng),預示化療最終走向個性化治療的目標”。k a n 等 把人食管癌細胞系和人食管組織點在c d n a 微陣列上,把k y a z 和o e 3 3 ( 腺癌) 從k y s e 系( 鱗狀細胞癌) 中區(qū)分出來,識別了在k y a z 和o e 3 3 中特征性表達 的基因”“。l o s s o s 等在一項獨立研究中發(fā)現,根據i g 基因超突變的有無,可將 彌漫性大b 細胞淋巴瘤( d i f u s el a r g eb c e l ll y m p h o m a ,d l b c l ) 分為兩個亞 型。b r o w n 等運用d n a 微陣列技術對脆x 綜合癥( f r a g i l e - xs y n d r o m e ,f r ax ) 的分子生物學機制及早期診斷進行了研究”“。 d n a 微陣列技術為臨床疾病的診斷提供了一種全新的概念,它不僅使實驗檢 測的高通量、高自動化,微量化得以實現,并且在臨床上對使某些疑難疾病的準 確診斷成為可能。 1 2 5 在藥物研究中的應用 基因芯片技術在新藥開發(fā)、藥物靶標的發(fā)現,多靶位藥物篩選、藥物作用 的分子機理研究、藥物療效及副作用等方面具有明顯優(yōu)勢,還可以將藥物的生 物效應和基因變化密切相聯系,從而為藥物的研究和開發(fā)注入了新的生機和活 力。k u m a r - s i n h a 等利用d n a 芯片篩選發(fā)現脂酸合酶( f a s ) 基因及其相應的信 號通路與乳腺癌的發(fā)生相關,提示該通路可能被用來作為治療或藥物篩選的新靶 標”1 。r o g e r s 等通過d

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論