公用數(shù)據(jù)庫(kù)基因組表達(dá)譜數(shù)據(jù)挖掘策略及分析方法李曦(達(dá)人學(xué)社)課件_第1頁(yè)
公用數(shù)據(jù)庫(kù)基因組表達(dá)譜數(shù)據(jù)挖掘策略及分析方法李曦(達(dá)人學(xué)社)課件_第2頁(yè)
公用數(shù)據(jù)庫(kù)基因組表達(dá)譜數(shù)據(jù)挖掘策略及分析方法李曦(達(dá)人學(xué)社)課件_第3頁(yè)
公用數(shù)據(jù)庫(kù)基因組表達(dá)譜數(shù)據(jù)挖掘策略及分析方法李曦(達(dá)人學(xué)社)課件_第4頁(yè)
公用數(shù)據(jù)庫(kù)基因組表達(dá)譜數(shù)據(jù)挖掘策略及分析方法李曦(達(dá)人學(xué)社)課件_第5頁(yè)
已閱讀5頁(yè),還剩69頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、李曦 副教授 中南大學(xué)湘雅醫(yī)院臨床藥理研究所 公用數(shù)據(jù)庫(kù)基因組表達(dá)譜數(shù)據(jù)挖掘策略 及分析方法 1 公用數(shù)據(jù)庫(kù)基因組表達(dá)譜數(shù)據(jù)挖掘策略及分 析方法李曦(達(dá)人學(xué)社) Nature Reviews Genetics 16, 8597 (2015) 2 公用數(shù)據(jù)庫(kù)基因組表達(dá)譜數(shù)據(jù)挖掘策略及分 析方法李曦(達(dá)人學(xué)社) 什么是數(shù)據(jù)挖掘 從海量數(shù)據(jù)中揭示潛在的生物學(xué)規(guī)律。從海量數(shù)據(jù)中揭示潛在的生物學(xué)規(guī)律。 3 公用數(shù)據(jù)庫(kù)基因組表達(dá)譜數(shù)據(jù)挖掘策略及分 析方法李曦(達(dá)人學(xué)社) 為什么要學(xué)習(xí)數(shù)據(jù)挖掘 l把握自己的命運(yùn) l最大化利用已有數(shù)據(jù) l尋找新的課題 4 公用數(shù)據(jù)庫(kù)基因組表達(dá)譜數(shù)據(jù)挖掘策略及分 析方法李曦(達(dá)

2、人學(xué)社) 數(shù)據(jù)挖掘的步驟 5 公用數(shù)據(jù)庫(kù)基因組表達(dá)譜數(shù)據(jù)挖掘策略及分 析方法李曦(達(dá)人學(xué)社) 生物醫(yī)學(xué)研究人員的優(yōu)勢(shì) l數(shù)據(jù)處理步驟、統(tǒng)計(jì)分析均有工具可以完成 l數(shù)據(jù)挖掘表型的確定 l數(shù)據(jù)的選擇 l數(shù)據(jù)挖掘結(jié)果的解讀 6 公用數(shù)據(jù)庫(kù)基因組表達(dá)譜數(shù)據(jù)挖掘策略及分 析方法李曦(達(dá)人學(xué)社) 生物醫(yī)學(xué)數(shù)據(jù)挖掘所需技能 l必備技能必備技能: 基本的生物信息學(xué)知識(shí) 各種數(shù)據(jù)庫(kù)的使用、數(shù)據(jù)庫(kù)信息的解讀 基本的生物統(tǒng)計(jì)學(xué)知識(shí) 分析方法的選擇,分析軟件的使用 l可選技能:可選技能: R語(yǔ)言的基本操作 R包的使用 Linux系統(tǒng)的基本操作 生物信息學(xué)分析軟件的使用 7 公用數(shù)據(jù)庫(kù)基因組表達(dá)譜數(shù)據(jù)挖掘策略及分 析方

3、法李曦(達(dá)人學(xué)社) 基因組表達(dá)譜數(shù)據(jù)挖掘流程 l確定研究策略 l獲取表達(dá)譜數(shù)據(jù) l處理表達(dá)譜數(shù)據(jù) l統(tǒng)計(jì)分析 l驗(yàn)證分析 8 公用數(shù)據(jù)庫(kù)基因組表達(dá)譜數(shù)據(jù)挖掘策略及分 析方法李曦(達(dá)人學(xué)社) 數(shù)據(jù)挖掘案例 9 公用數(shù)據(jù)庫(kù)基因組表達(dá)譜數(shù)據(jù)挖掘策略及分 析方法李曦(達(dá)人學(xué)社) 分析策略 l 核心思路: 影響腦膠質(zhì)瘤發(fā)生發(fā)展的基因可能影響腦膠質(zhì)瘤的預(yù)后 l 分析流程: 獲取包含腦膠質(zhì)瘤組織和正常腦組織的全基因組表達(dá)數(shù)據(jù) 的多個(gè)數(shù)據(jù)集 鑒定在腦膠質(zhì)瘤組織和正常腦組織中差異表達(dá)的基因 在自己收集的樣本中驗(yàn)證這些基因 分析這些基因與腫瘤分級(jí)以及總生存期之間的關(guān)系 10 公用數(shù)據(jù)庫(kù)基因組表達(dá)譜數(shù)據(jù)挖掘策略及分

4、 析方法李曦(達(dá)人學(xué)社) 11 公用數(shù)據(jù)庫(kù)基因組表達(dá)譜數(shù)據(jù)挖掘策略及分 析方法李曦(達(dá)人學(xué)社) 12 公用數(shù)據(jù)庫(kù)基因組表達(dá)譜數(shù)據(jù)挖掘策略及分 析方法李曦(達(dá)人學(xué)社) 13 公用數(shù)據(jù)庫(kù)基因組表達(dá)譜數(shù)據(jù)挖掘策略及分 析方法李曦(達(dá)人學(xué)社) 14 公用數(shù)據(jù)庫(kù)基因組表達(dá)譜數(shù)據(jù)挖掘策略及分 析方法李曦(達(dá)人學(xué)社) 15 公用數(shù)據(jù)庫(kù)基因組表達(dá)譜數(shù)據(jù)挖掘策略及分 析方法李曦(達(dá)人學(xué)社) 策略舉例 l影響阿糖胞苷藥物敏感性的基因可能影響AML預(yù)后。 l影響鉑類藥物敏感性的基因可能影響多種腫瘤的預(yù)后。 l在高低腫瘤分級(jí)中存在差異的基因可能影響癌癥預(yù)后。 16 公用數(shù)據(jù)庫(kù)基因組表達(dá)譜數(shù)據(jù)挖掘策略及分 析方法李曦(

5、達(dá)人學(xué)社) 研究策略如何確定 l研究策略可以千變?nèi)f化 l研究策略決定了論文的上限 l應(yīng)根據(jù)自身專業(yè)選擇有意義的研究策略 17 公用數(shù)據(jù)庫(kù)基因組表達(dá)譜數(shù)據(jù)挖掘策略及分 析方法李曦(達(dá)人學(xué)社) 包含基因組表達(dá)譜數(shù)據(jù)的數(shù)據(jù)庫(kù) Gene Expression Omnibus (GEO) https:/ ArrayExpress https:/ The Cancer Genome Atlas (TCGA) / International Cancer Genome Consortium 18 公用數(shù)據(jù)庫(kù)基因組表達(dá)譜數(shù)據(jù)挖

6、掘策略及分 析方法李曦(達(dá)人學(xué)社) GEO數(shù)據(jù)庫(kù)關(guān)鍵名詞 Profile:數(shù)據(jù)庫(kù)整理好的單個(gè)基因的概述 Datasets:見GDS和GSE。 GSM:?jiǎn)蝹€(gè)樣本的實(shí)驗(yàn)數(shù)據(jù) GDS:數(shù)據(jù)庫(kù)整理好的關(guān)于某個(gè)話題的GSM集合。一個(gè)GDS中 的所有GSM為同一平臺(tái)。 GSE:一個(gè)實(shí)驗(yàn)項(xiàng)目中的多個(gè)GSM合集,可能使用多個(gè)平臺(tái)。 GPL:芯片平臺(tái),如Affymetrix, Agilent等。 19 公用數(shù)據(jù)庫(kù)基因組表達(dá)譜數(shù)據(jù)挖掘策略及分 析方法李曦(達(dá)人學(xué)社) 20 公用數(shù)據(jù)庫(kù)基因組表達(dá)譜數(shù)據(jù)挖掘策略及分 析方法李曦(達(dá)人學(xué)社) Profile示例 實(shí)驗(yàn)描述實(shí)驗(yàn)結(jié)果展示 21 公用數(shù)據(jù)庫(kù)基因組表達(dá)譜數(shù)據(jù)挖掘

7、策略及分 析方法李曦(達(dá)人學(xué)社) Value:歸一化的相對(duì)表達(dá)量 Rank:探針表達(dá)值在所有表 達(dá)值中的排名的百分比。 Rank越高,表達(dá)越高。 22 公用數(shù)據(jù)庫(kù)基因組表達(dá)譜數(shù)據(jù)挖掘策略及分 析方法李曦(達(dá)人學(xué)社) Datasets示例 23 公用數(shù)據(jù)庫(kù)基因組表達(dá)譜數(shù)據(jù)挖掘策略及分 析方法李曦(達(dá)人學(xué)社) 24 公用數(shù)據(jù)庫(kù)基因組表達(dá)譜數(shù)據(jù)挖掘策略及分 析方法李曦(達(dá)人學(xué)社) 25 公用數(shù)據(jù)庫(kù)基因組表達(dá)譜數(shù)據(jù)挖掘策略及分 析方法李曦(達(dá)人學(xué)社) 芯 片 介 紹 26 公用數(shù)據(jù)庫(kù)基因組表達(dá)譜數(shù)據(jù)挖掘策略及分 析方法李曦(達(dá)人學(xué)社) 芯片注釋文件 27 公用數(shù)據(jù)庫(kù)基因組表達(dá)譜數(shù)據(jù)挖掘策略及分 析方法

8、李曦(達(dá)人學(xué)社) 樣本描述 28 公用數(shù)據(jù)庫(kù)基因組表達(dá)譜數(shù)據(jù)挖掘策略及分 析方法李曦(達(dá)人學(xué)社) 29 公用數(shù)據(jù)庫(kù)基因組表達(dá)譜數(shù)據(jù)挖掘策略及分 析方法李曦(達(dá)人學(xué)社) 30 公用數(shù)據(jù)庫(kù)基因組表達(dá)譜數(shù)據(jù)挖掘策略及分 析方法李曦(達(dá)人學(xué)社) 31 公用數(shù)據(jù)庫(kù)基因組表達(dá)譜數(shù)據(jù)挖掘策略及分 析方法李曦(達(dá)人學(xué)社) 32 公用數(shù)據(jù)庫(kù)基因組表達(dá)譜數(shù)據(jù)挖掘策略及分 析方法李曦(達(dá)人學(xué)社) 33 公用數(shù)據(jù)庫(kù)基因組表達(dá)譜數(shù)據(jù)挖掘策略及分 析方法李曦(達(dá)人學(xué)社) Limma法分析的TOP250結(jié)果 34 公用數(shù)據(jù)庫(kù)基因組表達(dá)譜數(shù)據(jù)挖掘策略及分 析方法李曦(達(dá)人學(xué)社) 35 公用數(shù)據(jù)庫(kù)基因組表達(dá)譜數(shù)據(jù)挖掘策略及分

9、析方法李曦(達(dá)人學(xué)社) 36 公用數(shù)據(jù)庫(kù)基因組表達(dá)譜數(shù)據(jù)挖掘策略及分 析方法李曦(達(dá)人學(xué)社) 37 公用數(shù)據(jù)庫(kù)基因組表達(dá)譜數(shù)據(jù)挖掘策略及分 析方法李曦(達(dá)人學(xué)社) 38 公用數(shù)據(jù)庫(kù)基因組表達(dá)譜數(shù)據(jù)挖掘策略及分 析方法李曦(達(dá)人學(xué)社) 韋恩圖 39 公用數(shù)據(jù)庫(kù)基因組表達(dá)譜數(shù)據(jù)挖掘策略及分 析方法李曦(達(dá)人學(xué)社) 40 公用數(shù)據(jù)庫(kù)基因組表達(dá)譜數(shù)據(jù)挖掘策略及分 析方法李曦(達(dá)人學(xué)社) 通路分析 41 公用數(shù)據(jù)庫(kù)基因組表達(dá)譜數(shù)據(jù)挖掘策略及分 析方法李曦(達(dá)人學(xué)社) 42 公用數(shù)據(jù)庫(kù)基因組表達(dá)譜數(shù)據(jù)挖掘策略及分 析方法李曦(達(dá)人學(xué)社) 43 公用數(shù)據(jù)庫(kù)基因組表達(dá)譜數(shù)據(jù)挖掘策略及分 析方法李曦(達(dá)人學(xué)社)

10、 44 公用數(shù)據(jù)庫(kù)基因組表達(dá)譜數(shù)據(jù)挖掘策略及分 析方法李曦(達(dá)人學(xué)社) 45 公用數(shù)據(jù)庫(kù)基因組表達(dá)譜數(shù)據(jù)挖掘策略及分 析方法李曦(達(dá)人學(xué)社) 生存分析驗(yàn)證 Survexpress http:/bioinformatica.mty.itesm.mx:8080/Biomatec/ SurvivaX.jsp KM Plotter 46 公用數(shù)據(jù)庫(kù)基因組表達(dá)譜數(shù)據(jù)挖掘策略及分 析方法李曦(達(dá)人學(xué)社) 輸入基因名 47 公用數(shù)據(jù)庫(kù)基因組表達(dá)譜數(shù)據(jù)挖掘策略及分 析方法李曦(達(dá)人學(xué)社) 48 公用數(shù)據(jù)庫(kù)基因組表達(dá)譜數(shù)據(jù)挖掘策略及分 析方法李曦(達(dá)人學(xué)社) 選擇分析表型 49 公用數(shù)據(jù)庫(kù)基因組表達(dá)譜數(shù)據(jù)挖掘策

11、略及分 析方法李曦(達(dá)人學(xué)社) 50 公用數(shù)據(jù)庫(kù)基因組表達(dá)譜數(shù)據(jù)挖掘策略及分 析方法李曦(達(dá)人學(xué)社) 51 公用數(shù)據(jù)庫(kù)基因組表達(dá)譜數(shù)據(jù)挖掘策略及分 析方法李曦(達(dá)人學(xué)社) 52 公用數(shù)據(jù)庫(kù)基因組表達(dá)譜數(shù)據(jù)挖掘策略及分 析方法李曦(達(dá)人學(xué)社) 53 公用數(shù)據(jù)庫(kù)基因組表達(dá)譜數(shù)據(jù)挖掘策略及分 析方法李曦(達(dá)人學(xué)社) 54 公用數(shù)據(jù)庫(kù)基因組表達(dá)譜數(shù)據(jù)挖掘策略及分 析方法李曦(達(dá)人學(xué)社) GEO數(shù)據(jù)本機(jī)處理 統(tǒng)計(jì)分析+作圖軟件 SPSS Graphad R 55 公用數(shù)據(jù)庫(kù)基因組表達(dá)譜數(shù)據(jù)挖掘策略及分 析方法李曦(達(dá)人學(xué)社) Kaplan-Meier法 單因素生存分析 分類變量 做生存曲線圖 Cox回歸

12、模型 單因素或多因素生存分析 分類或連續(xù)變量 計(jì)算HR和95%CI 生存分析 56 公用數(shù)據(jù)庫(kù)基因組表達(dá)譜數(shù)據(jù)挖掘策略及分 析方法李曦(達(dá)人學(xué)社) 57 公用數(shù)據(jù)庫(kù)基因組表達(dá)譜數(shù)據(jù)挖掘策略及分 析方法李曦(達(dá)人學(xué)社) 58 公用數(shù)據(jù)庫(kù)基因組表達(dá)譜數(shù)據(jù)挖掘策略及分 析方法李曦(達(dá)人學(xué)社) P值HR 59 公用數(shù)據(jù)庫(kù)基因組表達(dá)譜數(shù)據(jù)挖掘策略及分 析方法李曦(達(dá)人學(xué)社) 60 公用數(shù)據(jù)庫(kù)基因組表達(dá)譜數(shù)據(jù)挖掘策略及分 析方法李曦(達(dá)人學(xué)社) 61 公用數(shù)據(jù)庫(kù)基因組表達(dá)譜數(shù)據(jù)挖掘策略及分 析方法李曦(達(dá)人學(xué)社) 62 公用數(shù)據(jù)庫(kù)基因組表達(dá)譜數(shù)據(jù)挖掘策略及分 析方法李曦(達(dá)人學(xué)社) 63 公用數(shù)據(jù)庫(kù)基因組

13、表達(dá)譜數(shù)據(jù)挖掘策略及分 析方法李曦(達(dá)人學(xué)社) 雙擊彈出 64 公用數(shù)據(jù)庫(kù)基因組表達(dá)譜數(shù)據(jù)挖掘策略及分 析方法李曦(達(dá)人學(xué)社) 65 公用數(shù)據(jù)庫(kù)基因組表達(dá)譜數(shù)據(jù)挖掘策略及分 析方法李曦(達(dá)人學(xué)社) 66 公用數(shù)據(jù)庫(kù)基因組表達(dá)譜數(shù)據(jù)挖掘策略及分 析方法李曦(達(dá)人學(xué)社) 謝謝!謝謝! 腫瘤靶向藥物的個(gè)體化治療腫瘤靶向藥物的個(gè)體化治療 67 公用數(shù)據(jù)庫(kù)基因組表達(dá)譜數(shù)據(jù)挖掘策略及分 析方法李曦(達(dá)人學(xué)社) 數(shù)量性狀 連續(xù)變量,如:身高、體重、藥物劑量等 質(zhì)量性狀 分類變量,如:性別、療效、等級(jí)等 其他類型性狀 時(shí)間依賴性變量,如:生存期,中位生存時(shí)間等 研究表型 68 公用數(shù)據(jù)庫(kù)基因組表達(dá)譜數(shù)據(jù)挖掘策

14、略及分 析方法李曦(達(dá)人學(xué)社) 參數(shù)檢驗(yàn)(符合正態(tài)分布時(shí)) T檢驗(yàn)(獨(dú)立樣本或配對(duì)樣本):兩樣本均數(shù)比較 方差分析:兩個(gè)以上樣本均數(shù)比較 線性回歸分析:多個(gè)因素對(duì)因變量的影響 非參數(shù)檢驗(yàn)(不符合正態(tài)分布時(shí)) Mann-Whitney U 檢測(cè):兩獨(dú)立樣本 Kolmogorov-Smirnov 檢測(cè):兩獨(dú)立樣本 McNemar檢驗(yàn):配對(duì)樣本 Kruskal-Wallis檢驗(yàn):多獨(dú)立樣本 數(shù)量性狀常用統(tǒng)計(jì)分析方法 69 公用數(shù)據(jù)庫(kù)基因組表達(dá)譜數(shù)據(jù)挖掘策略及分 析方法李曦(達(dá)人學(xué)社) 卡方檢驗(yàn):?jiǎn)我蛩貙?duì)因變量的影響 邏輯回歸:多個(gè)因素對(duì)因變量的影響 質(zhì)量性狀常用統(tǒng)計(jì)分析方法 A:期望值5且樣本量40

15、,用 Pearson卡方。 B:1期望值5且樣本量40,用連 續(xù)校正。(僅用于四格表資料) C:期望值5或樣本量40,用Fisher 精確檢驗(yàn)。 70 公用數(shù)據(jù)庫(kù)基因組表達(dá)譜數(shù)據(jù)挖掘策略及分 析方法李曦(達(dá)人學(xué)社) 還有問題解決不了怎么辦?還有問題解決不了怎么辦? 71 公用數(shù)據(jù)庫(kù)基因組表達(dá)譜數(shù)據(jù)挖掘策略及分 析方法李曦(達(dá)人學(xué)社) 加入達(dá)人學(xué)社加入達(dá)人學(xué)社QQ群群 (加群請(qǐng)注明信息:?jiǎn)挝唬尤赫?qǐng)注明信息:?jiǎn)挝?專業(yè)專業(yè)+姓名,每人限加一個(gè)群)姓名,每人限加一個(gè)群) 、491043563 496353730、496740737 496974932、273757394 大神幫你解決高難文獻(xiàn)大神幫你解決高難文獻(xiàn) 群內(nèi)共享資源群內(nèi)共享資源 資源獲取技術(shù)教學(xué)視頻資源獲取技術(shù)教學(xué)視頻 同行分享交流(主要為同行分享交流(主要為 生物、醫(yī)學(xué)、化學(xué)專業(yè))生物、醫(yī)學(xué)、化學(xué)專業(yè)) 72 公用數(shù)據(jù)庫(kù)基

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論