




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、研究計(jì)劃基于機(jī)器學(xué)習(xí)的腫瘤細(xì)胞起源的研究1234研究依據(jù)研究目標(biāo)研究?jī)?nèi)容擬解決的關(guān)鍵問題5技術(shù)路線基于機(jī)器學(xué)習(xí)的腫瘤細(xì)胞起源的研究目 錄6研究方案與研究進(jìn)展研究依據(jù)研究意義有相當(dāng)比例的癌癥病例與轉(zhuǎn)移性腫瘤,需要進(jìn)一步的測(cè)試確定原發(fā)位置,其中許多是從來沒有完全診斷和保持癌癥的未知起源。很多醫(yī)學(xué)團(tuán)體認(rèn)為,利用癌癥“發(fā)源”的器官來對(duì)癌癥進(jìn)行定義就需要定義不同癌癥的治療策略。從那時(shí)候起,很多研究都表明,癌變的腫瘤或許會(huì)依賴其所發(fā)生的遺傳改變的類型來被分類或分群,這就意味著,開發(fā)新型療法就需要考慮和腫瘤相關(guān)的多個(gè)方面??茖W(xué)家們證明,腫瘤首次出現(xiàn)的組織位置實(shí)際上與驅(qū)動(dòng)突變的機(jī)制同樣重要,這一結(jié)果不僅為組織
2、起源在腫瘤發(fā)展中發(fā)揮作用提供了更多的證據(jù),也可能會(huì)引起與腫瘤生長(zhǎng)早期區(qū)域相關(guān)標(biāo)志物的發(fā)展。研究依據(jù)研究現(xiàn)狀2016年 Science雜志上發(fā)表了題為“Tissue of origin dictates branched-chain amino acid metabolism in mutant Kras-driven cancers”論文2016年 Science雜志上發(fā)表了”Location, location, location”論文2015 年Bioinformatics 發(fā)表“TumorTracer: a method to identify the tissue of origin
3、from the somatic mutations of a tumor specimen”研究目標(biāo)研究目標(biāo)優(yōu)化目前的分析流程,選擇最合理的機(jī)器學(xué)習(xí)算法構(gòu)建海量的核小體定位信息數(shù)據(jù)庫(kù),根據(jù)不同的DNA切口的pattern來找尋腫瘤起源組織信息擁有了基于機(jī)器學(xué)習(xí)的優(yōu)化算法SCI 文章1-2篇本項(xiàng)目旨在通過對(duì)cosmic77等大型數(shù)據(jù)庫(kù)中腫瘤起源組織的信息與其他特征的關(guān)聯(lián)分析,用機(jī)器學(xué)習(xí)的方法達(dá)到如下目標(biāo)3/ 研究?jī)?nèi)容第一部分第二部分第三部分第四部分機(jī)器學(xué)習(xí)特征數(shù)據(jù)的采集,通過突變基因、單核苷酸突變、三核苷酸變異信息、核小體定位等特征集來選取cosmic77數(shù)據(jù)庫(kù)中的有效樣本;3/ 研究?jī)?nèi)容第一
4、部分第二部分第三部分第四部分分析比對(duì)目前的機(jī)器學(xué)習(xí)算法,選擇最優(yōu)的學(xué)習(xí)算法,即最合理的數(shù)據(jù)敏感性和特異性的分布情況。集成學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)遺傳算法支持向量機(jī)3/ 研究?jī)?nèi)容第一部分第二部分第三部分第四部分通過AI中集成學(xué)習(xí)的方法對(duì)大樣本進(jìn)行train data,test data的隨機(jī)分組和10X以上的交叉驗(yàn)證;3/ 研究?jī)?nèi)容第一部分第二部分第三部分第四部分構(gòu)建分類樹算法,研究不同腫瘤在特征集上的差異4/ 擬解決的關(guān)鍵問題選取腫瘤大數(shù)據(jù)的特征變量抽取腫瘤大數(shù)據(jù)集中的特征數(shù)據(jù):?jiǎn)魏塑账嵬蛔兓颉⑷塑账嶙儺愋畔?、拷貝?shù)變異信息、核小體定位等。關(guān)鍵基因、突變集合用于精準(zhǔn)診斷。構(gòu)建核小體定位信息的二級(jí)數(shù)據(jù)庫(kù)
5、,需要樣本的積累。研究基于mysql數(shù)據(jù)庫(kù)的并行計(jì)算:mpi4py,增加海量數(shù)據(jù)分析的運(yùn)行效率5/ 技術(shù)路線6/ 研究方案樣本數(shù)據(jù)的選?。篊osmicMutantExport_v77.tsv.gz樣本特征數(shù)據(jù)提取:?jiǎn)魏塑账嵬蛔兓?、三核苷酸變異信息、拷貝?shù)變異信息、核小體定位等研究不同的機(jī)器學(xué)習(xí)算法在大數(shù)據(jù)集合中的表現(xiàn)構(gòu)建分類樹,研究不同腫瘤的特征差異根據(jù)數(shù)據(jù)量的情況,研究合理的并行計(jì)算的方法,mysql的并行存取以及Hadoop和spark等并行算法6/ 研究方案(樣本數(shù)據(jù)的選?。〤osmicMutantExport_v77.tsv.gzlabeled as “Genome.wide.scr
6、een”,not labeled as “cell-line”,然后選取Sample ID和tumor ID可以一一映射的數(shù)據(jù)樣本6/ 研究方案(樣本特征數(shù)據(jù)提?。┫到y(tǒng)突變基因單核苷酸突變信息三核苷酸變異信息核小體定位等6/ 研究基礎(chǔ)條件(工作基礎(chǔ))1) 基于集群服務(wù)器的Hadoop的環(huán)境2) PHP、R的交互環(huán)境構(gòu)建。3) 生物信息進(jìn)化樹分析的基礎(chǔ)。4) 基因組生物統(tǒng)計(jì)分析的基礎(chǔ)條件,大數(shù)據(jù)的條件。6/ 研究基礎(chǔ)條件(工作條件)1) 樣本信息的不斷完善和積累。2) 生物信息的條件,大數(shù)據(jù)分析的條件。7/ 研究進(jìn)展7/ 研究進(jìn)展(二分類情況)7/ 研究進(jìn)展(腫瘤分類學(xué)習(xí)分組)7/ 研究進(jìn)展(腫瘤分類學(xué)習(xí)分組的錯(cuò)分率,top3 group)7
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 事故新車保險(xiǎn)合同樣本
- 關(guān)于策劃合同標(biāo)準(zhǔn)文本
- 產(chǎn)品電商銷售合同樣本
- 2025簡(jiǎn)化版房屋買賣合同樣本
- 顧客反饋的總結(jié)與產(chǎn)品改進(jìn)計(jì)劃
- 借款受托支付合同標(biāo)準(zhǔn)文本
- 農(nóng)用機(jī)器買賣合同樣本
- 關(guān)于購(gòu)買商鋪合同樣本
- led景觀工程合同標(biāo)準(zhǔn)文本
- 養(yǎng)鴨合伙協(xié)議合同樣本
- 職稱評(píng)定打分細(xì)則(學(xué)院排名用)
- 檢驗(yàn)員基礎(chǔ)知識(shí)培訓(xùn).ppt
- 心理治療師復(fù)習(xí)
- 液壓常用元件符號(hào)
- 第十一章 地役權(quán)
- 重慶某高速公路合同段分離式隧道實(shí)施性施工組織設(shè)計(jì)(低瓦斯隧道)
- 風(fēng)機(jī)基礎(chǔ)土方開挖專項(xiàng)施工方案
- 藥店聘書樣板
- 虛偽的人yy頻道設(shè)計(jì) 第三者圖案模版頻道設(shè)計(jì)
- JTGF80+1-2019公路工程質(zhì)量檢驗(yàn)評(píng)定標(biāo)準(zhǔn)152頁(yè)
- PMMA合成方案PPT課件
評(píng)論
0/150
提交評(píng)論