版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
結構生物信息學演示文稿現(xiàn)在是1頁\一共有55頁\編輯于星期四結構生物信息學現(xiàn)在是2頁\一共有55頁\編輯于星期四本章內容提要1.Microarray簡介2.圖像處理與數據標準化3.基因芯片的數據分析4.Microarray:工具&數據庫現(xiàn)在是3頁\一共有55頁\編輯于星期四基因芯片1.基因芯片(1987)2.根據免疫測定的(immunoassay)的方法予以改進3.高通量、點陣以及Northern雜交同時測定細胞內數千個基因的表達情況將mRNA反轉錄成cDNA與芯片上的探針雜交4.芯片的體積非常小:微量樣品的檢測5.基因表達情況的定量分析6.其他類型的芯片:組織芯片蛋白質芯片現(xiàn)在是4頁\一共有55頁\編輯于星期四基因芯片的密度:100-1millionDNA探針/1cm2將樣品中的DNA/RNA表上熒光標記,則可以定量檢驗基因的表達水平堿基互補現(xiàn)在是5頁\一共有55頁\編輯于星期四基因表達情況的定量測定1.發(fā)現(xiàn)在特定生長時期,或者隨著環(huán)境變化,那些基因的表達收到誘導或者抑制2.在相同條件下,上調或者下調變化規(guī)律相似的基因,可能具有功能上的關聯(lián)3.可以從共表達的基因中尋找調控模體4.基因表達的模式可以用來表征異常的細胞調控,例如,癌癥的診斷現(xiàn)在是6頁\一共有55頁\編輯于星期四基因芯片技術的類型按技術手段、探針類型分類1.Shortoligonucleotidearrays(Affymetrix)2.cDNAarrays(Brown/Botstein)3.Longoligoarrays(Agilent)4.Serialanalysisofgeneexpression(SAGE)按實驗要求分類1.單通道(SingleChannel):一次檢驗一種狀態(tài)2.雙通道(DualChannel):差異表達基因的篩選現(xiàn)在是7頁\一共有55頁\編輯于星期四兩類主流的DNA芯片1.cDNAmicroarrays:將500~5,000bp的cDNA固載到介質上(例如玻璃),Stanford開發(fā)設計,通常為雙通道2.DNAchips:將寡核苷酸探針(20~80-mer)合成到芯片上,Affymetrix開發(fā)設計,通常為單通道現(xiàn)在是8頁\一共有55頁\編輯于星期四(1)cDNAmicroarrayscDNAclones現(xiàn)在是9頁\一共有55頁\編輯于星期四Robotspotter普通的蓋玻片cDNAmicroarrays的制備現(xiàn)在是10頁\一共有55頁\編輯于星期四差異表達基因的篩選Treatment/controlNormal
/tumortissueBrain/liver…現(xiàn)在是11頁\一共有55頁\編輯于星期四點樣后的cDNAMicroarrays現(xiàn)在是12頁\一共有55頁\編輯于星期四GenesmRNAsamplesGeneexpressionlevelofgeneiinmRNAsamplej=Log(Redintensity/Greenintensity)Log(Avg.PM-Avg.MM)
sample1 sample2 sample3 sample4 sample5 …1 0.46 0.30 0.80 1.51 0.90 ...2 -0.10 0.49 0.24 0.06 0.46 ...3 0.15 0.74 0.04 0.10 0.20 ...4 -0.45 -1.03 -0.79 -0.56 -0.32 ...5 -0.06 1.06 1.35 1.09 -1.09 ...基因表達的數據現(xiàn)在是13頁\一共有55頁\編輯于星期四(1)DNAchips現(xiàn)在是14頁\一共有55頁\編輯于星期四現(xiàn)在是15頁\一共有55頁\編輯于星期四DNAchips的制備:
Affymetrixphotolitography探針長度:25bp每個基因:22-40個探針PerfectMatch(PM)vs.MisMatch(MM)probes現(xiàn)在是16頁\一共有55頁\編輯于星期四點樣后的Genechip現(xiàn)在是17頁\一共有55頁\編輯于星期四總結現(xiàn)在是18頁\一共有55頁\編輯于星期四基因芯片的實驗流程現(xiàn)在是19頁\一共有55頁\編輯于星期四2.圖像處理與數據標準化單通道基因芯片
white(veryhigh)
red(high)
Yellow(alittlehigh)green(medium)blue(low)black(no)現(xiàn)在是20頁\一共有55頁\編輯于星期四圖像處理植根區(qū)域生長法(SRG)FixedCircle柵格化:確定點的位置圖象分割(Segmentation):將點從背景中分離出來。抽提亮度:各個像素亮度的平均值(mean)或中位數(median)背景校正:局部或全局現(xiàn)在是21頁\一共有55頁\編輯于星期四基因表達量的定量對于每個點,我們可以計算Redintensity=Rfg-Rbgfg=foreground,bg=background,andGreenintensity=Gfg-Gbgandcombinetheminthelog(base2)ratioLog2(
Redintensity/Greenintensity)
Greenintensity(medium):~1現(xiàn)在是22頁\一共有55頁\編輯于星期四Microarray:誤差的來源系統(tǒng)的隨機的
log
signalintensity
logRNAabundance現(xiàn)在是23頁\一共有55頁\編輯于星期四Microarray:誤差的來源1.圖像分析2.掃描3.DNA雜交過程(溫度、時間、混合均勻程度等)4.探針的標記5.RNA的抽提6.加樣7.其他現(xiàn)在是24頁\一共有55頁\編輯于星期四Red/green比值存在亮度的傾向M=log2R/G=log2R-log2G=(log2R+log2G)/2Valuesshouldscatteraboutzero.現(xiàn)在是25頁\一共有55頁\編輯于星期四數據標準化beforeafter現(xiàn)在是26頁\一共有55頁\編輯于星期四3.基因芯片的數據分析(1)差異表達基因的分析(2)基因共表達分析(3)基因表達數據的聚類(4)基因表達數據的分類(5)MaptoGO(6)Generegulatorynetwork現(xiàn)在是27頁\一共有55頁\編輯于星期四(1)差異表達基因的分析1.差異表達基因的分析:尋找處理前后表達上調或者下調的基因2.Arethetreatmentsdifferent?3.使用標準的統(tǒng)計學方法檢驗(t-testorf-test),發(fā)現(xiàn)統(tǒng)計顯著性差異表達的基因,4.如果處理本身并不顯著,則結果無意義現(xiàn)在是28頁\一共有55頁\編輯于星期四統(tǒng)計學分析1.Foldchange,一般2-foldincreaseordecrease(平行實驗的樣本較少)2.p-value(平行實驗的樣本較多)under-expressedover-expressed/2/2現(xiàn)在是29頁\一共有55頁\編輯于星期四P-value:學生分布1.T-test:學生分布2.Excel函數:TTEST(array1,array2,tails,type)Array1為第一個數據集Array2為第二個數據集Tails指示分布曲線的尾數。如果tails=1,函數TTEST使用單尾分布。如果tails=2,函數TTEST使用雙尾分布Type為t檢驗的類型1成對2等方差雙樣本檢驗3異方差雙樣本檢驗現(xiàn)在是30頁\一共有55頁\編輯于星期四P-value:學生分布1.一般選擇雙尾分布2.異方差雙樣本檢驗3.Excel函數:=TTEST(B2:D2,E2:G2,2,3)
4.C:對照組;T:實驗組C1C2C3T1T2T3TTESTGene11.3221.6761.4573.5264.2343.8790.001988現(xiàn)在是31頁\一共有55頁\編輯于星期四MultipleComparisons1.在基因芯片的實驗中,每一個基因/探針,都是一個獨立的實驗2.基因芯片:高通量,>1,000個基因/探針3.因此,無論怎么比較,總會有一些基因會是統(tǒng)計顯著性差異表的——可能是隨機產生的4.如何評估表達差異基因預測的有效性?5.例:1,000個探針的雙通道芯片,以p-value<0.01為域值,發(fā)現(xiàn)7個上調基因,5個下調基因,分析結果是否具有統(tǒng)計學意義?現(xiàn)在是32頁\一共有55頁\編輯于星期四FalseDiscoveryRate(FDR)1.Falsepositiveprediction:“Type1error"or"FalseDiscovery"2.FalseDiscoveyRate(FDR)=p-value*No.ofGenes上例:FDR=0.01*1,000=10(隨機)7個上調基因,5個下調基因<10因此上例計算的結果無統(tǒng)計學意義3.FDR必須遠小于發(fā)現(xiàn)的差異表達基因數目實驗的有效性p-value的選擇現(xiàn)在是33頁\一共有55頁\編輯于星期四(2)基因共表達分析1.在N個不同的條件下(時間序列的芯片數據),考察基因X和Y的表達是否相似2.Gene1#是否與Gene2#、Gene3#和Gene4#共表達?3.共表達:正相關:相似的表達譜,可能存在正關聯(lián)負相關:相反的表達譜,可能存在負調控EisenMB,etal.,(1998)PNAS95:14863-14868GeneNameT1T2T3T4T5T6Gene1#123456Gene2#100200300400550610Gene3#660540430320210101Gene4#150421535725451670998現(xiàn)在是34頁\一共有55頁\編輯于星期四沒有相關性?現(xiàn)在是35頁\一共有55頁\編輯于星期四基因相關性分析1.Spearmanrankcorrelation2.Kendall'stau3.Euclideandistance4.Pearsoncorrelationcoefficient:-1~1Excel函數:=PEARSON(array1,array2)EisenMB,etal.,(1998)PNAS95:14863-14868現(xiàn)在是36頁\一共有55頁\編輯于星期四Pearson相關系數1.r~[-1,1]r~1,正相關r~-1,負相關Gene1#Gene2#Gene3#Gene1#Gene2#0.996368Gene3#-0.99988-0.99611Gene4#0.2452920.254855-0.2395結論:Gene1#與Gene2#表達正相關,與Gene3#表達負相關,與Gene4#無關聯(lián)現(xiàn)在是37頁\一共有55頁\編輯于星期四(3)基因表達數據的聚類1.將表達譜相似的基因聚類在一起2.無督導學習(unsupervisedlearning)3.Patternfinding:發(fā)現(xiàn)新的模式4.聚類方法:A.HierarchicalclusteringB.K-meansclusteringHierarchicalClustering現(xiàn)在是38頁\一共有55頁\編輯于星期四Hierarchicalclustering1.用樹狀結構來表征基因表達之間的相似性/相關性2.優(yōu)點:不需要指定結果有多少類Object123451223654109459853DistancematrixDistanceCluster01,2,3,4,52(1,2),3,4,53(1,2),3,(4,5)4(1,2),(3,4,5)5(1,2,3,4,5)現(xiàn)在是39頁\一共有55頁\編輯于星期四K-meansclustering1.對數據進行聚類2.必須給定結果分成多少類!3.假設,該例中,指定為聚成5類現(xiàn)在是40頁\一共有55頁\編輯于星期四K-meansclustering1.隨便選取5個點,作為每一個類的中心點現(xiàn)在是41頁\一共有55頁\編輯于星期四K-meansclustering2.計算其他點與這5個中心點的距離距離:歐氏距離馬氏距離皮爾孫相關系數…點的歸類:離哪個中心點近,歸哪個類現(xiàn)在是42頁\一共有55頁\編輯于星期四K-meansclustering3.針對每一類中的每一個點,計算其與其他點的距離,加和,除以該類點的數目;找到新的中心點,即改點到該類中其他點的平均值最??;確定新的5個中心點!現(xiàn)在是43頁\一共有55頁\編輯于星期四K-meansclustering4.重復2,3,直到結果收斂實際操作時,因結果完全收斂時間過長,一般指定迭代的次數,如1,000次現(xiàn)在是44頁\一共有55頁\編輯于星期四K-meansclustering5.最終結果:所有基因芯片數據被聚成5類軟件:Cluster3.0,MichaelEissen,Stanford現(xiàn)在是45頁\一共有55頁\編輯于星期四(4)基因表達數據的分類1.根據基因表達的數據將樣本分成兩類或多類;2.督導學習(supervisedlearning):根據發(fā)現(xiàn)的pattern進行預測3.應用:癌癥vs.正常組織癌癥的亞型、不同階段(良性的vs.惡性的)對藥物的敏感性(tamoxifenforbreastcancer)現(xiàn)在是46頁\一共有55頁\編輯于星
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年中國發(fā)酵蟲草菌粉市場調查研究報告
- 2025至2030年中國聚丙烯薄膜介質電容器數據監(jiān)測研究報告
- 2025至2030年中國施工錐形路標數據監(jiān)測研究報告
- 二零二五年度私家車借用及安全責任協(xié)議3篇
- 二零二五年度離婚協(xié)議書:婚姻解除與經濟補償3篇
- 二零二五版水電安裝分包合同模板(含驗收標準)3篇
- 二零二五版水電工程招投標文件編制與審查合同3篇
- 2025版電商促銷活動宣傳品制作合同2篇
- 二零二五個人旅游度假產品預訂合同4篇
- 二零二五年度跨境金融協(xié)議存款合同范本3篇
- 江蘇省無錫市2023-2024學年八年級上學期期末數學試題(原卷版)
- 2024年全國統(tǒng)一高考數學試卷(新高考Ⅱ)含答案
- 繪本《汪汪的生日派對》
- 分手的協(xié)議書模板(5篇)
- 助產護理畢業(yè)論文
- 地震工程學概論課件
- 小學語文三年級下冊生字偏旁、拼音、組詞
- 紡織廠各工種考核細則
- (3篇)工會換屆主持詞
- 機房溫濕度標準要求(設計要求方案)
- 高考英語3500詞匯大綱詞形轉換匯總
評論
0/150
提交評論