




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、基因表達(dá)數(shù)據(jù)的獲得與分析一、基因表達(dá)的概念基因經(jīng)過(guò)轉(zhuǎn)錄、翻譯,產(chǎn)生具有特異生物學(xué)功能的蛋白質(zhì)分子的過(guò)程。* 基因表達(dá)(gene expression)基因表達(dá)是受調(diào)控的!基因表達(dá)是指基因轉(zhuǎn)錄及翻譯的過(guò)程。在該過(guò)程中,每一步都被嚴(yán)格的調(diào)節(jié)和控制,這些調(diào)節(jié)控制作用包括控制基因表達(dá)的開(kāi)始、行進(jìn)和終止,也包括調(diào)節(jié)基因表達(dá)的強(qiáng)弱及表達(dá)產(chǎn)物即蛋白質(zhì)合成的多少等,產(chǎn)生具有特異生物學(xué)功能的蛋白質(zhì)分子,從而賦予細(xì)胞或個(gè)體一定的功能或形態(tài)表型。(二)空間特異性在個(gè)體生長(zhǎng)全過(guò)程,某種基因產(chǎn)物在個(gè)體按不同組織空間順序出現(xiàn),稱之為基因表達(dá)的空間特異性(spatial specificity),又稱細(xì)胞或組織特異性(ce
2、ll or tissue specificity) 。二、基因表達(dá)具有時(shí)間及空間特異性(一)時(shí)間特異性按功能需要,某一特定基因的表達(dá)嚴(yán)格按特定的時(shí)間順序發(fā)生,稱之為基因表達(dá)的時(shí)間特異性(temporal specificity),又稱階段特異性(stage specificity) 。 鼠和人基因組的表達(dá)調(diào)控80%基因是“完全一樣的”共享99%的類似基因腦和肝的表達(dá)調(diào)控基因完全相同正常肝中心法則基因組 (genome):一個(gè)物種整套(單倍體)遺傳物質(zhì)的總和稱為該物種的基因組?;蚪M學(xué) (genomics)結(jié)構(gòu)基因組學(xué):以全基因組測(cè)序?yàn)槟繕?biāo)功能基因組學(xué):以基因功能鑒定為目標(biāo),又被稱為后基因組轉(zhuǎn)錄
3、組 (transcriptome):基因組表達(dá)的最初產(chǎn)物,既是某種細(xì)胞在特定時(shí)間下,基因衍生而來(lái)的RNA分子的集合。轉(zhuǎn)錄組學(xué)(transcriptomics)蛋白質(zhì)組 (proteome):RNA分子直接合成基因組表達(dá)的終產(chǎn)物,即細(xì)胞內(nèi)所有蛋白質(zhì)的總和。蛋白質(zhì)組學(xué) (proteomics)轉(zhuǎn)錄組學(xué)轉(zhuǎn)錄組學(xué)(transcriptomics),是一門在整體水平上研究細(xì)胞中基因轉(zhuǎn)錄的情況及轉(zhuǎn)錄調(diào)控規(guī)律的學(xué)科。簡(jiǎn)而言之,轉(zhuǎn)錄組學(xué)是從RNA層面研究基因表達(dá)的情況。 了解轉(zhuǎn)錄組是解讀基因組功能元件和揭示細(xì)胞及組織中分子組成所必需的RNA信使RNA(mRNA) 3%4%核糖體RNA(rRNA) 70%轉(zhuǎn)運(yùn)R
4、NA(tRNA) 15%microRNA(調(diào)控基因表達(dá)) DNA(Gene)Protein 數(shù)據(jù)挖掘的挑戰(zhàn)-高維性數(shù)據(jù)挖掘的挑戰(zhàn)-高維性M個(gè)geneN1個(gè)疾病樣本、N2個(gè)正常樣本內(nèi)容安排基因表達(dá)數(shù)據(jù)的獲得與分析基因表達(dá)的檢測(cè)方法表達(dá)數(shù)據(jù)的獲得、預(yù)處理基于表達(dá)數(shù)據(jù)發(fā)現(xiàn)知識(shí)(廣義知識(shí)、關(guān)聯(lián)知識(shí)、分類知識(shí)、預(yù)測(cè)知識(shí)、偏差知識(shí))基因表達(dá)的檢測(cè)方法基因芯片二代測(cè)序基因芯片的發(fā)展歷史和趨勢(shì)基因芯片是上世紀(jì)九十年代,隨著計(jì)算機(jī)技術(shù)和基因組測(cè)序技術(shù)的發(fā)展而發(fā)展起來(lái)的一種新型的生物技術(shù),它能夠平行、高通量地監(jiān)測(cè)成千上萬(wàn)基因轉(zhuǎn)錄本的表達(dá)水平,從而為系統(tǒng)地監(jiān)測(cè)細(xì)胞內(nèi)mRNA分子的表達(dá)狀態(tài)進(jìn)而推測(cè)細(xì)胞的功能狀態(tài)提供了
5、可能。1995年Schena (Science, 1995)等人,把擬南芥的45個(gè)基因固定在一張玻片上,并行檢測(cè)擬南芥45個(gè)基因的表達(dá)情況,這是第一次結(jié)合了高精度機(jī)械手點(diǎn)樣系統(tǒng)、熒光標(biāo)記技術(shù)、雙通道熒光掃描技術(shù)和數(shù)據(jù)分析軟件,是第一次真正意義上的用DNA芯片技術(shù)進(jìn)行基因表達(dá)分析的應(yīng)用。部分基因組被測(cè)序的微生物全基因的DNA芯片問(wèn)世,如:釀酒酵母,大腸桿菌。人類、小鼠和水稻等物種的全基因組芯片。近年Medline收錄的發(fā)表的“DNA microarray” 相關(guān)論文基因芯片技術(shù)經(jīng)過(guò)十多年的發(fā)展,已經(jīng)發(fā)展成為一種高通量,大規(guī)模和微量化的分析手段,成為功能基因組研究中的重要技術(shù)方法,得到了較為廣泛的
6、應(yīng)用和推廣。DNA芯片技術(shù)芯片的制備樣品的準(zhǔn)備分子雜交DNA芯片技術(shù)檢測(cè)分析DNA芯片技術(shù)的主要方法芯片的制備樣品的準(zhǔn)備分子雜交DNA芯片技術(shù)檢測(cè)分析 什么是微陣列微陣列(microarray): 是一種平面的基質(zhì)載體,它上面規(guī)則的、特異性地吸附著基因或基因產(chǎn)物(探針)。 是一種小型的分析裝置,能夠快速和精確地研究生物基因組信息。芯片的制作支持物的預(yù)處理探針設(shè)計(jì)與制造芯片的打印打印后處理DNA微陣列1. 1芯片制備-芯片探針DNA探針:DNA探針是最常用的核酸探針,指長(zhǎng)度在幾百堿基對(duì)以上的雙鏈DNA或單鏈DNA探針。這類探針多為某一基因的全部或部分序列,或某一非編碼序列。DNA探針的獲得有賴于
7、分子克隆技術(shù)的發(fā)展和應(yīng)用。可在質(zhì)粒載體中克隆,便于無(wú)限繁殖,制備簡(jiǎn)便;不易降解(相對(duì)RNA而言)cDNA 探針(complementary DNA)是指互補(bǔ)于mRNA的DNA分子,是由逆轉(zhuǎn)錄酶催化而產(chǎn)生的。該酶以RNA為模板,根據(jù)堿基配對(duì)原則,按照RNA的核苷酸順序合成DNA(其中U與A配對(duì))。 cDNA 探針是目前應(yīng)用最為廣泛的一種探針。 芯片探針的特點(diǎn)互補(bǔ)性:即針對(duì)目的基因的保守區(qū)設(shè)計(jì)互補(bǔ)、完全配對(duì)(perfect match,PM)的寡核苷酸探針特異性:即探針與目的基因的結(jié)合相對(duì)于家族其他成員具有高度特異性探針的豐足:并非把相同的探針片段固化在陣列中多處部位而是指針對(duì)靶基因序列設(shè)計(jì)多個(gè)(
8、三個(gè)以上)寡核苷酸探針這些寡核苷探針可與該基因的不同部位特異結(jié)合、應(yīng)用多個(gè)不同序列探針檢測(cè)同一個(gè)分子可顯著提高信噪比,提高RNA定量的準(zhǔn)確性原位合成芯片 ( synthetic genechip )芯片的制備方式DNA 微陣列 ( DNA microarray)原位合成芯片采用顯微光蝕刻(photolithography)等技術(shù),在芯片的特定部位原位合成寡核苷酸而制成。探針較短采用常規(guī)分子生物學(xué)技術(shù)如PCR、分子克隆、DNA合成技術(shù)等,預(yù)先合成DNA或基因片段,然后以顯微打印的方式,待這些基因片段有序地固化于支持物表面而制成 預(yù)先合成基因芯片探針原位合成探針原位合成探針原位合成探針 原位合成(
9、In Situ Synthesis)羥基化特制的光刻掩膜 1.2. 芯片支持物類型實(shí)性材料 膜性材料硅片玻片瓷片聚丙烯膜尼龍膜纖維素膜支持物的預(yù)處理實(shí)性材料 通常在表面衍生出活性基團(tuán),如羥基或氨基載體的活化膜性材料使其表面帶上正電荷以吸附帶負(fù)電荷的DNA分子,通常以氨基硅烷或多聚賴氨酸等進(jìn)行包被需進(jìn)行預(yù)處理,使其表面衍生出羥基、氨基活性基團(tuán)。1.3. 芯片的打印將預(yù)先制備好的DNA探針以液滴的形式有序排列在經(jīng)特殊處理的支持物上的過(guò)程.接觸式打印非接觸式打印1.4 打印后處理1.一方面需要把探針固定在玻璃表面2. 另一方面也要封閉玻片上未打印的區(qū)域,以防止雜交時(shí)樣品DNA的非特異性結(jié)合基因芯片是
10、規(guī)則的規(guī)則的:微陣列上的單元按照行和列的方式進(jìn)行排列?;緲?biāo)準(zhǔn) :成行 、成列、大小均一、點(diǎn)間距相近、位置明確。意義:能使微陣列的制備、檢測(cè)和定量快速進(jìn)行。行和列是!否!均一的大小和點(diǎn)間距意義:能使微陣列的制備、檢測(cè)和定量快速進(jìn)行。同時(shí)均一化的點(diǎn)滿足定量簡(jiǎn)單化、分析精確化的需要。是!否!明確的位置意義:能確保對(duì)信號(hào)強(qiáng)度的精確定量并能把信號(hào)值和對(duì)應(yīng)的基因序列對(duì)應(yīng)起來(lái)。A1A2B1B2B3C1C2C3A3A1A2A3B1B2B3C3C2C1是!否!DNA芯片技術(shù)的主要方法芯片的制備樣品的準(zhǔn)備分子雜交DNA芯片技術(shù)檢測(cè)分析樣品的準(zhǔn)備樣品核酸的提取與純化擴(kuò)增與標(biāo)記標(biāo)記樣品的純化組織、細(xì)胞中樣品核酸的提
11、取和純化反轉(zhuǎn)錄生成cDNA樣品核酸的擴(kuò)增和熒光標(biāo)記擴(kuò)增:PCR, RTPCR,固相PCR常用標(biāo)記物為 Cy3,Cy5(熒光標(biāo)記), 生物素標(biāo)記,放射素末端標(biāo)記:在引物上標(biāo)記有熒光素,在DNA擴(kuò)增過(guò)程時(shí),使新形成的DNA鏈末端帶有熒光素。標(biāo)記樣品的純化樣品的準(zhǔn)備DNA微陣列技術(shù)流程芯片的制作支持物的預(yù)處理探針設(shè)計(jì)與制造芯片的打印打印后處理DNA微陣列樣品的準(zhǔn)備樣品核酸的提取與純化擴(kuò)增與標(biāo)記標(biāo)記樣品的純化雜交與雜交后清洗檢測(cè)與分析DNA芯片技術(shù)的主要方法芯片的制備樣品的準(zhǔn)備分子雜交DNA芯片技術(shù)檢測(cè)分析基因芯片基因芯片原理-molecular hybridization 指具有一定同源性的兩條核酸
12、單鏈(DNA或RNA),在一定條件下按堿基互補(bǔ)配對(duì)原則經(jīng)過(guò)退火處理,形成異質(zhì)雙鏈的過(guò)程。 利用這一原理,就可以使用已知基因的單鏈核酸片段作為探針,去查找各種不同來(lái)源的基因組DNA分子中的同源基因或同源序列。將一系列的核酸片段固定在芯片載體上作為探針,待測(cè)的核酸片段人工標(biāo)記上不同的熒光、或同位素等作為靶片段( target ),一定條件下兩者雜交,根據(jù)雜交后不同的信號(hào)即可獲得靶片段的信息,進(jìn)行計(jì)算機(jī)分析?;蛐酒砘蛐酒詣?dòng)雜交儀 分子雜交系統(tǒng)檢測(cè)與分析1 激光激發(fā)使含熒光標(biāo)記的DNA片段發(fā)射熒光2 激光掃描儀或激光共聚焦顯微鏡采集各雜交點(diǎn)的信號(hào)3 軟件進(jìn)行進(jìn)行圖象分析和數(shù)據(jù)處理DyePho
13、tonsElectronsSignalLaserPMTA/DConvertorexcitationamplificationFilteringTime-spaceaveragingDNA微陣列技術(shù)流程芯片的制作支持物的預(yù)處理探針設(shè)計(jì)與制造芯片的打印打印后處理DNA微陣列樣品的準(zhǔn)備樣品核酸的提取與純化擴(kuò)增與標(biāo)記標(biāo)記樣品的純化雜交與雜交后清洗檢測(cè)與分析表達(dá)譜實(shí)驗(yàn)流程Fragment(heat, Mg2+)Hybridize(16 hours)IVTBiotin-rNTPcDNATotal RNACellsScanBBBBBBBBWash & StainAAAAAAAAAAAA生物信息學(xué)在基因芯片中
14、的應(yīng)用體現(xiàn)在四個(gè)方面:芯片設(shè)計(jì)可靠性分析預(yù)處理數(shù)據(jù)分析基因芯片數(shù)據(jù)的預(yù)處理數(shù)據(jù)的提取對(duì)數(shù)化探針過(guò)濾補(bǔ)缺失值標(biāo)準(zhǔn)化探針注釋數(shù)據(jù)提取表達(dá)值獲得圖象預(yù)處理網(wǎng)格定位背景濾除熒光信號(hào)提取歸一化處理背景區(qū)域數(shù)據(jù)的提取芯片的熒光掃描圖像cDNA芯片Affymetrix寡核苷酸芯片數(shù)據(jù)的提取-cDNA芯片芯片的熒光掃描圖像CH1ICH1BCH2ICH2BRatio=(CH1I-CH1B)/(CH2I-CH2B)數(shù)據(jù)的提取-Affymetrix芯片的熒光掃描圖像黑-藍(lán)黑-藍(lán)-高藍(lán)-綠-黃-橙-紅-白低高每個(gè)基因通常會(huì)設(shè)計(jì)1620個(gè)探針對(duì),組成探針集,共同決定某基因的雜交信號(hào)PM (perfect match):
15、與目標(biāo)樣本完美匹配的探針MM (mismatch):在完美匹配的探針序列中央發(fā)生一個(gè)堿基替換雜交信號(hào):定性(P-Present/A-Absent/M-Marginal)定量(real signal)數(shù)據(jù)的提取數(shù)據(jù)的提取芯片的數(shù)據(jù)格式探針數(shù)遠(yuǎn)大于基因數(shù)Human Genome U133包含100萬(wàn)不同的寡核苷酸探針,33000個(gè)基因“.cel”文件數(shù)據(jù)的提取芯片的數(shù)據(jù)格式Matrix file數(shù)據(jù)的提取?基因芯片數(shù)據(jù)的預(yù)處理數(shù)據(jù)的提取對(duì)數(shù)化探針過(guò)濾補(bǔ)缺失值標(biāo)準(zhǔn)化探針注釋對(duì)數(shù)化原始數(shù)據(jù)呈偏態(tài)分布對(duì)數(shù)轉(zhuǎn)化后呈近似正態(tài)分布探針過(guò)濾去除表達(dá)水平是負(fù)值或很小的數(shù)據(jù)或明顯的噪音數(shù)據(jù)過(guò)閃耀現(xiàn)象物理因素導(dǎo)致的信
16、號(hào)污染(劃傷、指紋等)雜交效能低點(diǎn)樣問(wèn)題補(bǔ)缺失值數(shù)據(jù)缺失類型非隨機(jī)缺失(表達(dá)豐度過(guò)低或過(guò)高)隨機(jī)缺失(與表達(dá)水平高低無(wú)關(guān))雜交效能低物理刮傷指紋灰塵圖像污染補(bǔ)缺失值刪除相應(yīng)的行、列簡(jiǎn)單補(bǔ)缺法無(wú)表達(dá)或無(wú)差異表達(dá)0或1均值樣本均值基因均值補(bǔ)缺失值回歸法補(bǔ)缺失值k近鄰法-KNN(K-NearestNeighbor)前提假設(shè):近鄰的對(duì)象具有類似的預(yù)測(cè)值。思想:在多維空間Rn 中找到與未知樣本最近鄰的k 個(gè)點(diǎn),并根據(jù)這k個(gè)點(diǎn)的類別來(lái)判斷未知樣本的類這k個(gè)點(diǎn)就是未知樣本的k-最近鄰。k近鄰法-KNN數(shù)學(xué)模型:離散目標(biāo)分類函數(shù)為f:Rn-V設(shè)未知樣本的特征向量X為訓(xùn)練數(shù)據(jù)集D=(Xi,Vi),1iN,其中X
17、i是第i個(gè)訓(xùn)練樣本的特征向量,Vi是類別V是有限集合v1,v2,vs ,即各不同分類集計(jì)算X和Xi之間的距離d(Xi,X)按距離排序,得到d(X,Xi1)d(X,Xi2)d(X,XiN)選擇前K個(gè)樣本:S=(Xi1,Yi1)(XiK,YiK);統(tǒng)計(jì)S中每個(gè)類別出現(xiàn)的次數(shù),確定X的類別Y補(bǔ)缺失值k近鄰法-KNN(K-NearestNeighbor)基因i在樣本j中的表達(dá)水平缺失確定距離最近的k個(gè)鄰居基因歐氏距離相關(guān)系數(shù)加權(quán)平均估計(jì)缺失值標(biāo)準(zhǔn)化基因芯片數(shù)據(jù)中存在的變異感興趣的變異真正的生物學(xué)變異差異表達(dá)基因混雜變異實(shí)驗(yàn)過(guò)程中引入的變異在樣本的染色、芯片的制作、芯片的掃描過(guò)程中引入的系統(tǒng)誤差CDNA
18、芯片數(shù)據(jù)的標(biāo)準(zhǔn)化系統(tǒng)誤差來(lái)源染料的物理屬性染料的結(jié)合效率探針的制備探針和樣本的雜交過(guò)程數(shù)據(jù)收集時(shí)的掃描過(guò)程不同芯片間的差異不同芯片雜交條件的差異CDNA芯片數(shù)據(jù)的標(biāo)準(zhǔn)化標(biāo)準(zhǔn)化過(guò)程的參照物穩(wěn)定表達(dá)的基因持家基因(housekeeping genes)外源性的或人工合成的控制基因(controls)芯片上大部分穩(wěn)定表達(dá)的基因(所有基因)相對(duì)穩(wěn)定基因子集(invariant set)CDNA芯片數(shù)據(jù)的標(biāo)準(zhǔn)化標(biāo)準(zhǔn)化方法片內(nèi)標(biāo)化對(duì)數(shù)轉(zhuǎn)換 log-Ratios全局標(biāo)化(global normalization)Cy3和Cy5不同染料的熒光強(qiáng)度不一致糾正了染料偏倚(dye bias)所有基因log-Ratios的中值或均值假設(shè):CDNA芯片數(shù)據(jù)的標(biāo)準(zhǔn)化標(biāo)準(zhǔn)化方法片內(nèi)標(biāo)化熒光強(qiáng)度依賴的標(biāo)化(intensity dependent normalization)方法: scatter-plot sm
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024江蘇省公務(wù)員考試【申論 A卷、C卷】+2023年【申論B卷】共 3套 真題及答案
- 2025年石頭湯考試試題及答案
- 5年級(jí)下冊(cè)英語(yǔ)書單詞
- 5年級(jí)上冊(cè)題目
- 登記注冊(cè) 標(biāo)準(zhǔn)化建設(shè)思路
- 地下施工工藝流程
- 不同材料短時(shí)記憶保持量的實(shí)驗(yàn)報(bào)告 - 副本 - 副本
- 2025年陜西青年職業(yè)學(xué)院?jiǎn)握新殬I(yè)技能考試題庫(kù)審定版
- 2025年深圳信息職業(yè)技術(shù)學(xué)院?jiǎn)握新殬I(yè)傾向性測(cè)試題庫(kù)完整版
- 2025年關(guān)于紀(jì)念抗日戰(zhàn)爭(zhēng)勝利72周年的調(diào)查報(bào)告
- 部編版七年級(jí)道德與法治上冊(cè)第一單元復(fù)習(xí)教案
- 壓力管道安全風(fēng)險(xiǎn)管控清單格式
- 華中師范大學(xué)矢量logo課件
- 培訓(xùn)績(jī)效管理與績(jī)效評(píng)價(jià)課件
- 輸血相關(guān)制度及流程-課件
- DGT252-2021農(nóng)機(jī)播種作業(yè)監(jiān)測(cè)終端
- 抽水蓄能式水電站機(jī)組巡檢維護(hù)保養(yǎng)與安全管理方案
- 《中華民族一家親》評(píng)課
- 新能源汽車技術(shù)專業(yè)教學(xué)資源庫(kù)申報(bào)書
- (投標(biāo)書范本)聘請(qǐng)常年法律顧問(wèn)項(xiàng)目投標(biāo)書
- 喇榮課誦集(早課部分)
評(píng)論
0/150
提交評(píng)論