第八章生物信息學(xué)在基因芯片中的應(yīng)用_第1頁
第八章生物信息學(xué)在基因芯片中的應(yīng)用_第2頁
第八章生物信息學(xué)在基因芯片中的應(yīng)用_第3頁
第八章生物信息學(xué)在基因芯片中的應(yīng)用_第4頁
第八章生物信息學(xué)在基因芯片中的應(yīng)用_第5頁
已閱讀5頁,還剩51頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、第八章第八章 生物信息學(xué)在基因芯片生物信息學(xué)在基因芯片中的應(yīng)用中的應(yīng)用主講人:孫 嘯制作人:劉志華東南大學(xué) 吳健雄實驗室 生物信息學(xué)和基因芯片是生命科學(xué)研究領(lǐng)域中的兩種新方法和新技術(shù),生物信息學(xué)與基因芯片密切相關(guān),生物信息學(xué)促進了基因芯片的研究與應(yīng)用,而基因芯片則豐富了生物信息學(xué)的研究內(nèi)容 第一節(jié) 概述概述、基因芯片簡介()基因芯片的基本原理及生物信息學(xué)的作用 基因芯片(gene chip),又稱DNA微陣列(microarray),是由大量DNA或寡核苷酸探針密集排列所形成的探針陣列,其工作的基本原理是通過雜交檢測信息。 基因芯片把大量已知序列探針集成在同一個基片上,經(jīng)過標(biāo)記的若干靶核酸序列

2、通過與芯片特定位置上的探針雜交,便可根據(jù)堿基互補匹配的原理確定靶基因的序列。 根據(jù)探針的類型和長度,基因芯片可分為兩類。 其中一類是較長的DNA探針(100mer)芯片 這類芯片的探針往往是PCR的產(chǎn)物,通過點樣方法將探針固定在芯片上,主要用于RNA的表達分析。 另一類是短的寡核苷酸探針芯片 其探針長度為25 mer左右,一般通過在片(原位)合成方法得到,這類芯片既可用于RNA的表達監(jiān)控,也可以用于核酸序列分析。原理原理 - - 通過雜交檢測信息通過雜交檢測信息一組寡核苷酸探針TATGCAATCTAGCGTTAGATACGTTAGAATACGTTAGATCTACGTTAG由雜交位置確定的一組核

3、酸探針序列GTTAGATC雜交探針組TATGCAATCTAG重組的互補序列靶序列TACGTTAGACGTTAGAATACGTTACGTTAGATGTTAGATC ATACGTTA基因芯片熒光標(biāo)記的樣品 共聚焦顯微鏡獲取熒光圖象雜交結(jié)果分析探 針 設(shè) 計雜交()基因芯片制備 基因芯片的制備主要有兩種基本方法: 一是在片合成法, 在片合成法是基于組合化學(xué)的合成原理,它通過一組定位模板來決定基片表面上不同化學(xué)單體的偶聯(lián)位點和次序。在片合成法制備DNA芯片的關(guān)鍵是高空間分辨率的模板定位技術(shù)和固相合成化學(xué)技術(shù)的精巧結(jié)合。 另一種方法是點樣法。 基因芯片點樣法首先按常規(guī)方法制備cDNA(或寡核苷酸)探針庫

4、,然后通過特殊的針頭和微噴頭, 分別把不同的探針溶液,逐點分配在玻璃、尼龍或者其它固相基底表面上不同位點,并通過物理和化學(xué)的結(jié)合使探針被固定于芯片的相應(yīng)位點。 ()靶基因樣品的制備及芯片雜交 根據(jù)基因芯片的檢測目的不同,可以把樣品制備方法分為 用于表達譜測量的mRNA樣品制備 用于多態(tài)性(或突變)研究的基因樣品的制備()雜交信號檢測 對于用熒光素標(biāo)記經(jīng)擴增(也可用其他放大技術(shù))的序列或樣品,與芯片上的探針進行雜交,然后沖洗,采集熒光圖像。 圖像的采集用落射熒光顯微鏡 或電荷偶聯(lián)裝置照相機 非共聚焦激光掃描儀等進行。 、基因芯片對于生物分子信息檢測的作用和意義 在生命科學(xué)領(lǐng)域中,基因芯片為分子生

5、物學(xué)、生物醫(yī)學(xué)等研究提供了強有力的手段。 利用基因芯片技術(shù),可研究生命體系中不同部位、不同生長發(fā)育階段的基因表達,比較不同個體或物種之間的基因表達,比較正常和疾病狀態(tài)下基因及其表達的差異。 基因芯片技術(shù)也有助于研究不同層次的多基因協(xié)同作用的生命過程,發(fā)現(xiàn)新的基因功能,研究生物體在進化、發(fā)育、遺傳過程中的規(guī)律。、基因芯片研究和應(yīng)用中所涉及到的生物信息學(xué)問題提取什么信息提取什么信息如何提取信息如何提取信息如何處理和利用信息如何處理和利用信息確定芯片檢測目標(biāo)確定芯片檢測目標(biāo)芯片設(shè)計芯片設(shè)計數(shù)據(jù)管理與分析數(shù)據(jù)管理與分析探針設(shè)計探針設(shè)計解決雜交條件一解決雜交條件一致性問題致性問題芯片優(yōu)化芯片優(yōu)化提高芯片

6、制備效提高芯片制備效率率公共公共 數(shù)據(jù)庫數(shù)據(jù)庫專用專用 數(shù)據(jù)庫數(shù)據(jù)庫確定目標(biāo)確定目標(biāo)選擇待檢測的選擇待檢測的目標(biāo)序列目標(biāo)序列數(shù)據(jù)分析數(shù)據(jù)分析分析雜交檢測結(jié)分析雜交檢測結(jié)果及可靠性果及可靠性基因芯片基因芯片 數(shù)據(jù)庫數(shù)據(jù)庫圖像處理圖像處理數(shù)數(shù) 據(jù)據(jù) 庫庫 查查 詢詢 序序 列列 分分 析析生生 物物 信信 息息 學(xué)學(xué) 數(shù)數(shù) 據(jù)據(jù) 挖挖 掘掘 數(shù)數(shù) 據(jù)據(jù) 可可 視視 化化雜交雜交檢測檢測圖像圖像基因芯片數(shù)據(jù)流圖基因芯片數(shù)據(jù)流圖()生物信息學(xué)在基因芯片中的應(yīng)用 生物信息學(xué)在基因芯片中的應(yīng)用主要體現(xiàn)在三個方面: 確定芯片檢測目標(biāo) 芯片設(shè)計 實驗數(shù)據(jù)管理與分析()基因芯片研究與應(yīng)用中所要解決的信息學(xué)問題

7、在基因芯片信息學(xué)方面要解決以下幾個關(guān)鍵的問題: 第一是芯片設(shè)計問題 第二是可靠性分析問題 第三是數(shù)據(jù)挖掘問題 第二節(jié)第二節(jié) 基因芯片設(shè)計基因芯片設(shè)計、基因芯片設(shè)計的一般性原則 基因芯片設(shè)計主要包括兩個方面: (1)探針的設(shè)計 指如何選擇芯片上的探針 (2)探針在芯片上的布局 指如何將探針排布在芯片上。 確定芯片所要檢測的目標(biāo)對象確定芯片所要檢測的目標(biāo)對象 查詢生物分子數(shù)據(jù)庫查詢生物分子數(shù)據(jù)庫取得相應(yīng)的取得相應(yīng)的DNADNA序列數(shù)據(jù)序列數(shù)據(jù) 序列對比分析序列對比分析找出特征序列,作為芯片設(shè)計的參照序列。找出特征序列,作為芯片設(shè)計的參照序列。 數(shù)據(jù)庫搜索數(shù)據(jù)庫搜索得到關(guān)于序列突變的信息及其它信息。

8、得到關(guān)于序列突變的信息及其它信息。 在進行探針設(shè)計和布局時必須考慮以下在進行探針設(shè)計和布局時必須考慮以下幾個方面:幾個方面: (1)互補性 (2)敏感性和特異性 (3)容錯性 (4)可靠性 (5)可控性 (6)可讀性 、DNA變異檢測型芯片與基因表達型芯片的設(shè)計 對于DNA序列變異分析,最基本的要求是能夠檢測出發(fā)生變異的位置,進一步的要求是能夠發(fā)現(xiàn)發(fā)生了什么樣的變化。 從雜交的單堿基錯配辨別能力來看,當(dāng)錯配出現(xiàn)在探針中心時,辨別能力強,而當(dāng)錯配出現(xiàn)在探針兩端時,辨別能力非常弱。所以,在設(shè)計檢測DNA序列變異的探針時,檢測變化點應(yīng)該對應(yīng)于探針的中心,以得到最大的分辨率。、cDNAcDNA芯片與寡

9、核苷酸芯芯片與寡核苷酸芯片的設(shè)計片的設(shè)計 cDNA芯片設(shè)計的關(guān)鍵在于數(shù)據(jù)庫的建立和數(shù)據(jù)庫信息的利用以及各種文庫的建立。 cDNA芯片制備方法一般采用點樣法,多用于基因表達的監(jiān)控和分析。 寡核苷酸芯片制備一般采用在片合成方法。優(yōu)化是寡核苷酸芯片設(shè)計的一個重要環(huán)節(jié),包括探針的優(yōu)化和整個芯片設(shè)計結(jié)果的優(yōu)化。 、寡核苷酸探針的優(yōu)化設(shè)計、基因芯片布局雜雜 交交 模模 式式探探 針針 布布 局局 圖圖Target T C C G T T A G C T G A C T G CAGCTTG變異、基因芯片布局基于Tm值梯度場的布局方法 凸點均勻分布布局方法(a) (b)凸點均勻分布優(yōu)化結(jié)果示意凸點均勻分布優(yōu)化

10、結(jié)果示意(a)(a)優(yōu)化前;優(yōu)化前; (b)(b)優(yōu)化后。優(yōu)化后。、基因芯片優(yōu)化 高密度寡核苷酸芯片設(shè)計的結(jié)果是形成芯片合成方案和步驟,產(chǎn)生制作掩膜板的CAD文件。高密度基因芯片制備的一個關(guān)鍵是掩膜板技術(shù),利用掩膜板進行定位并控制探針的在片合成,從而得到很高的探針密度。 但是制作掩膜板的代價較高,為了盡可能地提高基因芯片制備效率,需要對設(shè)計好的基因芯片進行優(yōu)化,以減少制備芯片所需要的掩膜板個數(shù),同時也減少芯片探針循環(huán)合成次數(shù),這對于基因芯片應(yīng)用有著重要的意義。第三節(jié)第三節(jié) 基于芯片的序列分析基于芯片的序列分析、測定未知序列 早期基于芯片雜交的序列分析實驗中,芯片上的探針是長度為k(一般為8)的

11、所有寡核苷酸的組合。這是一種完備的探針集合,根據(jù)互補關(guān)系,通過各個探針的雜交結(jié)果確定DNA靶序列中存在的所有k長度片段,形成靶序列的k長度片段譜,然后根據(jù)這些片段重構(gòu)靶序列。 、直接檢測目標(biāo)序列 在同一塊芯片上設(shè)計多組探針,每一組探針分別檢測一條目標(biāo)序列,探針的長度在20到30之間。一般要求同一組探針之間相互獨立,盡可能不重疊或少重疊,以提高探針的敏感性和特異性。、DNA序列突變檢測分析有兩種方法可以進行已知突變點的分析: 一種方法是對于目標(biāo)序列上已知的突變點,以該點為中心,從目標(biāo)序列選取一個片段,作為設(shè)計探針的參考序列。根據(jù)參考序列,分別設(shè)計四個高度特異的探針,這四個探針除中心位置外均相同并

12、與參考序列互補 另一種方法是對于目標(biāo)序列上已知的突變點,分別設(shè)計四組探針,其中每一組探針分別檢測一種核苷酸替換。同一組中的各個探針長度相同,相互之間交疊,并且每個探針均覆蓋對應(yīng)的突變點。、基因型和多態(tài)性分析 在同一物種不同種群和個體之間,有著多種不同的基因型,這往往與個體的不同性狀和多種遺傳性疾病有著密切的關(guān)系。通過對大量具有不同性狀的個體的基因型進行比較,就可以得出基因與性狀的關(guān)系。 為了進行SNPs研究,發(fā)現(xiàn)目標(biāo)序列上可能出現(xiàn)的變化,最直接的方法就是根據(jù)已知的目標(biāo)序列設(shè)計一系列寡核苷酸探針,其中每一個探針用于檢測目標(biāo)序列特定位置上的核苷酸是否發(fā)生變化,探察位置位于探針的中心。這種方法又稱等

13、長等覆蓋移位法 第二種方法為單核苷酸分析法。針對目標(biāo)序列每第二種方法為單核苷酸分析法。針對目標(biāo)序列每個位置上所有可能出現(xiàn)的變化設(shè)計相應(yīng)的探針。個位置上所有可能出現(xiàn)的變化設(shè)計相應(yīng)的探針。 第四節(jié)第四節(jié) 基于芯片的基因功能基于芯片的基因功能分析分析、基因表達分析 基因表達是根據(jù)基因的DNA模板進行mRNA和蛋白質(zhì)合成的過程,各種基因的表達存在差異,一種組織中基因表達水平的差異可達1萬倍。功能基因研究的一種重要的方法就是采用高通量基因表達檢測技術(shù),全面分析基因的表達水平,了解基因的功能。 、高密度基因表達芯片、基因表達圖譜 基于芯片的表達監(jiān)控實驗產(chǎn)生大量的數(shù)據(jù),在這些數(shù)據(jù)背后隱藏著豐富的基因相互作用

14、、基因功能信息,需要通過細致的數(shù)據(jù)分析揭示這些信息,得到有益的結(jié)果 這種根據(jù)基因芯片獲得的新的表達圖譜有別于以前的物理圖和功能圖,它能夠更為直接地揭示基因組中各基因相互關(guān)系。、尋找基因功能 DeRisi等應(yīng)用酵母cDNA基因芯片研究在有絲分裂和孢子狀態(tài)下基因轉(zhuǎn)錄和表達水平的差異。 Affymetrix公司制備的酵母基因表達型芯片,包括酵母基因組開放讀碼框中的260 000個25mer探針陣列。Wodicka 等采用這種基因芯片對不同生活狀態(tài)下酵母細胞的基因表達進行了研究。 第五節(jié)第五節(jié) 基因芯片檢測結(jié)果的基因芯片檢測結(jié)果的分析分析、熒光檢測圖像處理 基因芯片與樣本雜交以后,用圖像掃描儀器捕獲芯

15、片上的熒光圖像。在計算機中,一幅圖像由二維象素點所組成,通常用一個8-bit的整數(shù)存貯象素點的灰度值,取值范圍為0,255,其中0代表“黑”,255代表“白”。 一個理想的基因芯片圖像具有以下幾個性質(zhì): (1)芯片單元的形狀和尺寸相同; (2)每個單元的中心位于象素點上; (3)無灰塵等引起的噪聲信號; (4)最小和均勻的圖像背景強度。 圖象預(yù)處理圖象預(yù)處理網(wǎng)格定位網(wǎng)格定位背景濾除背景濾除熒光信號提取熒光信號提取歸一化處理歸一化處理網(wǎng)格定位結(jié)果1234GT010203040506070GCTA背景區(qū)域背景濾除熒光信號提取、檢測結(jié)果分析 如果芯片檢測的目的是測定樣本序列,則需要根據(jù)芯片上每個探針

16、的雜交結(jié)果判斷樣本中是否含有對應(yīng)的互補序列片段,并利用生物信息學(xué)中的片段組裝算法連接各個片段,形成更長的目標(biāo)序列。 如果芯片檢測的目的是進行序列變異分析,則要根據(jù)全匹配探針以及錯配探針在基因芯片對應(yīng)位置上的熒光信號強度,給出序列變化的位點,并指明發(fā)生什么變化。 如果芯片檢測的目的是進行基因表達分析,則需要給出芯片上各個基因的表達圖譜,定量描述基因的表達水平,進一步的分析還包括根據(jù)基因表達模式進行聚類,尋找基因之間的相關(guān)性,發(fā)現(xiàn)協(xié)同工作的基因、檢測結(jié)果可靠性分析可靠性分析可以從兩個方面進行: 一是根據(jù)實驗統(tǒng)計誤差(如探針合成的錯誤率、全匹配探針與錯配探針的誤識率等),計算出基因芯片最終實驗結(jié)果的可靠性。 二是對基因芯片與樣本序列雜交過程進行分子動力學(xué)研究,建立芯片雜交過程的計算機仿真實驗?zāi)P停员阍谥谱餍酒胺治鏊O(shè)計芯片的性能,預(yù)測芯片實驗結(jié)果的可靠性。、數(shù)據(jù)分析 基因芯片數(shù)據(jù)分析包括實驗數(shù)據(jù)管理、數(shù)據(jù)質(zhì)量控制、數(shù)據(jù)處理等 進一步將基因芯片實驗數(shù)據(jù)與公共數(shù)據(jù)庫中的信息相關(guān)聯(lián),利用數(shù)據(jù)挖掘方法進行分析處理,揭示各種數(shù)據(jù)之間的關(guān)系,發(fā)現(xiàn)新的生物學(xué)知識。第六節(jié)第六節(jié) 基因芯片信息的管理基因芯片信息的管理和利用和利用、芯片信息管理 目

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論