版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、2013高教社杯全國(guó)大學(xué)生數(shù)學(xué)建模競(jìng)賽承 諾 書(shū)我們仔細(xì)閱讀了全國(guó)大學(xué)生數(shù)學(xué)建模競(jìng)賽章程和全國(guó)大學(xué)生數(shù)學(xué)建模競(jìng)賽參賽規(guī)則(以下簡(jiǎn)稱(chēng)為“競(jìng)賽章程和參賽規(guī)則”,可從全國(guó)大學(xué)生數(shù)學(xué)建模競(jìng)賽網(wǎng)站下載)。我們完全明白,在競(jìng)賽開(kāi)始后參賽隊(duì)員不能以任何方式(包括電話(huà)、電子郵件、網(wǎng)上咨詢(xún)等)與隊(duì)外的任何人(包括指導(dǎo)教師)研究、討論與賽題有關(guān)的問(wèn)題。我們知道,抄襲別人的成果是違反競(jìng)賽章程和參賽規(guī)則的,如果引用別人的成果或其他公開(kāi)的資料(包括網(wǎng)上查到的資料),必須按照規(guī)定的參考文獻(xiàn)的表述方式在正文引用處和參考文獻(xiàn)中明確列出。我們鄭重承諾,嚴(yán)格遵守競(jìng)賽章程和參賽規(guī)則,以保證競(jìng)賽的公正、公平性。如有違反競(jìng)賽章程和參賽
2、規(guī)則的行為,我們將受到嚴(yán)肅處理。我們授權(quán)全國(guó)大學(xué)生數(shù)學(xué)建模競(jìng)賽組委會(huì),可將我們的論文以任何形式進(jìn)行公開(kāi)展示(包括進(jìn)行網(wǎng)上公示,在書(shū)籍、期刊和其他媒體進(jìn)行正式或非正式發(fā)表等)。我們參賽選擇的題號(hào)是(從A/B/C/D中選擇一項(xiàng)填寫(xiě)): A 我們的參賽報(bào)名號(hào)為(如果賽區(qū)設(shè)置報(bào)名號(hào)的話(huà)):02014 所屬學(xué)校(請(qǐng)?zhí)顚?xiě)完整的全名): 東北農(nóng)業(yè)大學(xué)參賽隊(duì)員 (打印并簽名) :1. 張永明2. 卜憲勇3. 宋雪松指導(dǎo)教師或指導(dǎo)教師組負(fù)責(zé)人 (打印并簽名): 日期: 2013 年 8 月 24日賽區(qū)評(píng)閱編號(hào)(由賽區(qū)組委會(huì)評(píng)閱前進(jìn)行編號(hào)):2013高教社杯全國(guó)大學(xué)生數(shù)學(xué)建模競(jìng)賽編 號(hào) 專(zhuān) 用 頁(yè)賽區(qū)評(píng)閱編號(hào)(由
3、賽區(qū)組委會(huì)評(píng)閱前進(jìn)行編號(hào)):賽區(qū)評(píng)閱記錄(可供賽區(qū)評(píng)閱時(shí)使用):評(píng)閱人評(píng)分備注全國(guó)統(tǒng)一編號(hào)(由賽區(qū)組委會(huì)送交全國(guó)前編號(hào)):全國(guó)評(píng)閱編號(hào)(由全國(guó)組委會(huì)評(píng)閱前進(jìn)行編號(hào)):14地貧患者的基因篩查問(wèn)題解決方案摘要 本文解決的是地中海貧血的診斷問(wèn)題。人們到醫(yī)院就診時(shí),其是否患地中海貧血一般要通過(guò)化驗(yàn)人體內(nèi)各種元素的含量來(lái)協(xié)助醫(yī)生的診斷。為了解決此問(wèn)題,我們建立了馬氏距離判別法,fisher 判別模型及主成分分析賦權(quán)模型。 對(duì)于問(wèn)題一:我們首先提出了馬氏距離判別法和 fisher 模型來(lái)判別就診的人是否患有地中海貧血。我們選取表A1 中1-20號(hào)和21-40號(hào)的數(shù)據(jù)和已確診的結(jié)果作為模型確立的樣本, 用馬
4、氏距離判別法總體判斷的準(zhǔn)確率達(dá)到 88.33%, 在 fisher 判別法中,利用 Matlab 軟件求解得到 fisher 線(xiàn)性判別函數(shù),軟件分析的結(jié)果的正確判斷率為 93.33%,故最終我們選用 fisher 模型。 其次我們選用 fisher 模型對(duì)表 A1 中的41-60號(hào)就診人員的基因診斷結(jié)果進(jìn)行判別,得到如下結(jié)果: 診斷患病病例號(hào):41,42, 45,48,55,57, 診斷健康病例號(hào):43,44,46,47,49,50,51,52,53,54,56,58,59,60 對(duì)于問(wèn)題二:為了確定影響人們患地中海貧血的關(guān)鍵或主要因素,我們選取表A1中數(shù)據(jù)作為樣本,建立主成分分析賦權(quán)模型,通
5、過(guò)對(duì)表A1 中的數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化并確定相關(guān)系數(shù)矩陣,求出相關(guān)矩陣的特征值和特征向量,然后通過(guò)前m 個(gè)主成分的累計(jì)貢獻(xiàn)率滿(mǎn)足來(lái)確定貢獻(xiàn)率矩陣,從而得到各種元素的權(quán)值,又利用初始特征值需大于 1,再運(yùn)用逐步剔除法得出關(guān)鍵元素為:Mg Ca Na K 。 關(guān)鍵詞:fisher 模型; ;主成分分析法; Matlab; SPSS一 問(wèn)題重述地中海貧血(簡(jiǎn)稱(chēng)“地貧”)是全球廣為流行、危害極為嚴(yán)重的遺傳性溶血性疾病,全世界至少有3.45億人攜帶地中海貧血的致病基因。全球地中海貧血基因攜帶者頻率高達(dá)2.62%,包括中國(guó)南方在內(nèi)的東南亞地區(qū)、印度次大陸、地中海地區(qū)、中東、東非和太平洋地區(qū)都是該疾病的高發(fā)地區(qū)。由
6、于攜帶者婚配的下一代有1/4的機(jī)會(huì)患嚴(yán)重溶血性貧血癥狀的重癥地中海貧血,估計(jì)全球重型地中海貧血患兒的出生率不低于萬(wàn)分之四,因而構(gòu)成了嚴(yán)重的公共健康問(wèn)題。地貧是一種單基因遺傳的血紅蛋白病,目前沒(méi)有根治方法,患者輕則無(wú)任何臨床表現(xiàn),重則表現(xiàn)為“進(jìn)行性”溶血性貧血。醫(yī)學(xué)上通過(guò)大人群的基因篩查來(lái)預(yù)防地貧患兒的出生。附件(基因鏈.xls)中給出了60個(gè)人的基因鏈樣本(每個(gè)人的基因鏈均給出了110個(gè)基因)。按人員編號(hào)劃分:編號(hào)120是地貧患者的樣本,編號(hào)2140是健康人員的樣本,編號(hào)4160個(gè)是待篩查人員的樣本。(1)試設(shè)法找出描述地貧患者樣本與健康人樣本在基因鏈上的區(qū)別,建立數(shù)學(xué)模型和篩查方法,去預(yù)測(cè)待
7、篩查樣本是“地貧”還是“健康”。(2)設(shè)計(jì)圖示(可視化)方法,使所建立的數(shù)學(xué)模型盡可能清楚地表達(dá)“地貧”樣本與“健康”樣本在基因鏈上的區(qū)別。以及癌癥樣本中是否有子類(lèi)。二 問(wèn)題分析問(wèn)題一:我們根據(jù)已知確診病例的兩大總體(地中海貧血) 、(健康人)來(lái)對(duì)就診人員進(jìn)行分類(lèi),確定了兩種比較好判別病號(hào)是否患有地中海貧血的方法。一種是馬氏距離判別法, 首先取表A1 中病例號(hào) 1-20號(hào)和 21-40 號(hào)為樣本, 采用馬氏距離判別法1,得到判別公判別檢測(cè)數(shù)據(jù)并進(jìn)行回代,進(jìn)一步改進(jìn)模型。另一種是費(fèi)希爾模型1,利用 Matlab 軟件求解得到 fisher 線(xiàn)性判別函數(shù),由軟件分析的結(jié)果可知費(fèi)希爾模型有較高的判別
8、正確率。 問(wèn)題二:?jiǎn)栴}二其實(shí)是問(wèn)題一的延伸,根據(jù)建立的模型對(duì)就診病例進(jìn)行判別分析,分別采用距離判別法和 fisher 線(xiàn)性判別函數(shù),通過(guò) Matlab 軟件計(jì)算出結(jié)果。三問(wèn)題假設(shè)和符號(hào)說(shuō)明3.1 問(wèn)題假設(shè) 1. 假設(shè)所給數(shù)據(jù)精確無(wú)誤。 2. 假設(shè)樣品中化驗(yàn)的七種元素與是否患地中海貧血癥有一定的關(guān)系。 3. 40名確診病例與20名就診病例是隨機(jī)抽取的,無(wú)特殊情況,符合一般規(guī)律。 4. 假設(shè)此期間不會(huì)發(fā)生特大疾病災(zāi)害3.2 符號(hào)說(shuō)明n樣本點(diǎn)的個(gè)數(shù),即模型求解中作為已知的樣本點(diǎn)個(gè)數(shù)p地中海貧血癥診斷的化驗(yàn)指標(biāo)個(gè)數(shù),也即原始主成分個(gè)數(shù)G、GG為地中海貧血癥患者類(lèi),G為健康類(lèi)S協(xié)方差矩陣S i=1,2類(lèi)
9、內(nèi)離散度 i=1,2x病例號(hào)i在第 j 項(xiàng)指標(biāo)的化驗(yàn)數(shù)據(jù)結(jié)果x病例號(hào)i的化驗(yàn)結(jié)果x=(x,x,x)x第j項(xiàng)指標(biāo)的化驗(yàn)數(shù)據(jù)結(jié)果y病例號(hào)的Fisher判別函數(shù)值,i=1 表示病人,i=2 表示健康人d、d分別代表地中海貧血癥患者和健康人到其均值水平的馬氏距離X觀察樣本矩陣R指標(biāo)數(shù)據(jù)的相關(guān)矩陣第 個(gè)主成分方差貢獻(xiàn)率D主因子載荷矩陣四模型的建立與求解問(wèn)題一:基于費(fèi)希爾模型,對(duì)20名就診病例進(jìn)行判別分析的結(jié)果見(jiàn)表A.1。表A.141.健康42.健康43.貧血44.貧血45.健康46.貧血47.貧血48.健康49.貧血50.貧血51.貧血52.貧血53.貧血54.貧血55.健康56.貧血57.健康58.貧
10、血59.貧血60.貧血 屬于G類(lèi):43,44,46,47,49,50,51,52,53,54,56,58,59,60,總計(jì)16人;G類(lèi):41,42,45,48,55,57,總計(jì)4人。6.1 利用Fisher判別法的模型檢驗(yàn) 3 代入數(shù)據(jù)可得出下列結(jié)果:= -0.0108,= -0.1515,= -0.0812。進(jìn)行判別函數(shù)的檢驗(yàn),檢驗(yàn)其是否有效:計(jì)算統(tǒng)計(jì)量,其中,p為向量維數(shù),p = 7:給定顯著水平a=0.05,從F分布表中查出:所作出的判別函數(shù)有效問(wèn)題二:模型的建立及解答我們建立了多元統(tǒng)計(jì)的模型,將兩個(gè)變量,即癌癥病患和正常者分別設(shè)為1及0。其110個(gè)基因設(shè)為輸入層,且這110個(gè)基因標(biāo)號(hào)為
11、v29v110。首先針對(duì)這20個(gè)癌癥及20個(gè)正常樣本的110個(gè)基因進(jìn)行處理,利用統(tǒng)計(jì)軟件spss,對(duì)這114個(gè)基因進(jìn)行判別篩選,最終得到1個(gè)與之相關(guān)系數(shù)最大的基因,這些基因就成為了判斷一個(gè)人是否為病者的重要因素。通過(guò)這個(gè)軟件,還可以得到這1個(gè)基因的非標(biāo)準(zhǔn)化判別方程系數(shù),從而得出非標(biāo)準(zhǔn)化方程D。將題目所給的數(shù)據(jù)錄入到該軟件中,所得到的結(jié)果為:成份矩陣a成份1VAR00001-.055VAR00002.784VAR00003.786VAR00004.679VAR00005-.687VAR00006.721VAR00007.024VAR00008.114VAR00009-.729VAR00010.0
12、34VAR00011-.386VAR00012-.675VAR00013.617VAR00014.081VAR00015.795VAR00016-.316VAR00017.343VAR00018.323VAR00019.118VAR00020.345VAR00021-.404VAR00022-.731VAR00023.110VAR00024.151VAR00025.283VAR00026.292VAR00027.697VAR00028-.718VAR00029.809VAR00030-.221VAR00031.796VAR00032.119VAR00033-.433VAR00034-.313V
13、AR00035.677VAR00036.313VAR00037.854VAR00038.854VAR00039.854VAR00040.854VAR00041.449VAR00042-.846VAR00043-.005VAR00044-.096VAR00045.311VAR00046-.423VAR00047.867VAR00048-.178VAR00049.562VAR00050-.467VAR00051-.559VAR00052-.665VAR00053.858VAR00054-.690VAR00055.681VAR00056-.487VAR00057-.200VAR00058-.045V
14、AR00059-.588VAR00060.696VAR00061.186VAR00062-.690VAR00063.316VAR00064-.414VAR00065-.162VAR00066.538VAR00067-.223VAR00068-.403VAR00069-.268VAR00070.132VAR00071.448VAR00072-.435VAR00073.433VAR00074-.121VAR00075-.537VAR00076.726VAR00077.746VAR00078.825VAR00079-.399VAR00080.524VAR00081.866VAR00082-.017V
15、AR00083-.069VAR00084.381VAR00085-.876VAR00086.799VAR00087-.751VAR00088-.815VAR00089-.546VAR00090.261VAR00091-.241VAR00092.759VAR00093.166VAR00094-.626VAR00095-.050VAR00096.766VAR00097-.635VAR00098.343VAR00099.440VAR00100-.137VAR00101-.532VAR00102-.773VAR00103-.244VAR00104.332VAR00105.681VAR00106-.56
16、6VAR00107.077VAR00108.858VAR00109-.760VAR00110-.314提取方法 :主成份。a. 已提取了 1 個(gè)成份。成份矩陣a成份1VAR00001-.366VAR00002.263VAR00003.643VAR00004.419VAR00005-.445VAR00006.387VAR00007.144VAR00008.081VAR00009-.212VAR00010.271VAR00011-.574VAR00012-.109VAR00013.343VAR00014-.396VAR00015.600VAR00016-.318VAR00017.150VAR000
17、18-.202VAR00019.174VAR00020.368VAR00021-.409VAR00022-.473VAR00023.116VAR00024.163VAR00025.224VAR00026-.145VAR00027.009VAR00028-.133VAR00029.484VAR00030-.203VAR00031.572VAR00032.433VAR00033.245VAR00034-.070VAR00035.435VAR00036.003VAR00037.634VAR00038.634VAR00039.634VAR00040.634VAR00041.384VAR00042-.5
18、13VAR00043-.371VAR00044-.040VAR00045.389VAR00046-.497VAR00047.554VAR00048.400VAR00049.235VAR00050-.715VAR00051.095VAR00052-.352VAR00053.458VAR00054-.121VAR00055.443VAR00056-.515VAR00057.253VAR00058.211VAR00059-.099VAR00060.232VAR00061-.213VAR00062-.707VAR00063-.042VAR00064-.683VAR00065-.300VAR00066.
19、380VAR00067-.378VAR00068-.339VAR00069-.673VAR00070-.324VAR00071-.318VAR00072-.176VAR00073.101VAR00074.119VAR00075-.504VAR00076.540VAR00077.439VAR00078.611VAR00079-.192VAR00080.032VAR00081.682VAR00082.171VAR00083-.186VAR00084.538VAR00085-.685VAR00086.617VAR00087-.844VAR00088-.699VAR00089-.640VAR00090
20、.223VAR00091-.604VAR00092.498VAR00093.203VAR00094-.362VAR00095.570VAR00096.534VAR00097-.495VAR00098-.025VAR00099.152VAR00100-.705VAR00101-.884VAR00102-.778VAR00103.364VAR00104-.051VAR00105.628VAR00106-.104VAR00107.409VAR00108.641VAR00109-.088VAR00110.356提取方法 :主成份。a. 已提取了 1 個(gè)成份。這個(gè)顯示出與癌癥相關(guān)的基因大致只有這26個(gè),且表中右側(cè)為各項(xiàng)系數(shù),則可得非標(biāo)準(zhǔn)化判別 由SPss軟件可以算出方程則表示若D大于0,則該樣本為癌癥病者;若D小于0,則該樣本為正常者。所以,對(duì)于題目給出的20個(gè)待測(cè)樣本,我們將其對(duì)應(yīng)的41個(gè)基因表達(dá)水平代入到此方程中。所以求得這20個(gè)待測(cè)樣本的D值分別為41.393-8.4529-85.8241.068-3.87093.0568128.917.4152-28.7665.189652.6235.034310.23131.258-143.6414.69-83.623 13.522 50.46
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年高新技術(shù)企業(yè)委托招聘與研發(fā)團(tuán)隊(duì)構(gòu)建合同3篇
- 2025年食材配送企業(yè)冷鏈物流服務(wù)合同3篇
- 2025版共享單車(chē)運(yùn)維服務(wù)與用戶(hù)租賃合同范本3篇
- 2025年度旅游汽車(chē)租賃及戶(hù)外活動(dòng)策劃合同4篇
- 二零二五版高端養(yǎng)殖牛場(chǎng)合伙經(jīng)營(yíng)合同3篇
- 二零二五版科技創(chuàng)新園區(qū)黨建資源共享合作協(xié)議3篇
- 2025年度煤礦設(shè)備采購(gòu)及安裝服務(wù)二零二五版合同4篇
- 鄭州城建職業(yè)學(xué)院《中國(guó)民事訴訟法》2023-2024學(xué)年第一學(xué)期期末試卷
- 2024藥品采購(gòu)及質(zhì)量管理體系認(rèn)證合同3篇
- 2025年度市政工程承攬合同建設(shè)施工合同模板4篇
- 課題申報(bào)書(shū):GenAI賦能新質(zhì)人才培養(yǎng)的生成式學(xué)習(xí)設(shè)計(jì)研究
- 駱駝祥子-(一)-劇本
- 全國(guó)醫(yī)院數(shù)量統(tǒng)計(jì)
- 《中國(guó)香文化》課件
- 2024年醫(yī)美行業(yè)社媒平臺(tái)人群趨勢(shì)洞察報(bào)告-醫(yī)美行業(yè)觀察星秀傳媒
- 第六次全國(guó)幽門(mén)螺桿菌感染處理共識(shí)報(bào)告-
- 2024-2030年中國(guó)商務(wù)服務(wù)行業(yè)市場(chǎng)現(xiàn)狀調(diào)查及投資前景研判報(bào)告
- 高一英語(yǔ)必修一試卷(含答案)(適合測(cè)試)
- 中國(guó)的世界遺產(chǎn)智慧樹(shù)知到期末考試答案2024年
- 中國(guó)綠色食品市場(chǎng)調(diào)查與分析報(bào)告
- 手衛(wèi)生依從性調(diào)查表
評(píng)論
0/150
提交評(píng)論