登革熱創(chuàng)新實(shí)驗(yàn)報(bào)告_第1頁(yè)
登革熱創(chuàng)新實(shí)驗(yàn)報(bào)告_第2頁(yè)
登革熱創(chuàng)新實(shí)驗(yàn)報(bào)告_第3頁(yè)
登革熱創(chuàng)新實(shí)驗(yàn)報(bào)告_第4頁(yè)
登革熱創(chuàng)新實(shí)驗(yàn)報(bào)告_第5頁(yè)
已閱讀5頁(yè),還剩13頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、數(shù)學(xué)與計(jì)算科學(xué)學(xué)院創(chuàng)新性實(shí)驗(yàn)結(jié)題報(bào)告書實(shí)驗(yàn)題目:登革熱發(fā)病率隱藏的統(tǒng)計(jì)分析 實(shí)驗(yàn)成績(jī)(教師填寫): 學(xué) 院: 數(shù)學(xué)與計(jì)算科學(xué)學(xué)院 專 業(yè): 統(tǒng)計(jì)學(xué) 組 長(zhǎng): 薛亞妮 1400720218 小組成員: 譚建軍1400720214 指導(dǎo)教師: 祝光湖老師 目錄一、實(shí)驗(yàn)?zāi)康募爸饕獎(jiǎng)?chuàng)新性點(diǎn)3二、實(shí)驗(yàn)要求3三、實(shí)驗(yàn)原理33.1多元線性回歸基本理論與概述33.2多元線性回歸模型的建立43.3模型的檢驗(yàn)原理43.3.1擬合優(yōu)度檢驗(yàn)(R檢驗(yàn))53.3.2方程顯著性檢驗(yàn)(F檢驗(yàn))53.3.3變量顯著性檢驗(yàn)(T檢驗(yàn))5四、檢驗(yàn)結(jié)果與分析64.1多元線性回歸方程64.2方差分析74.3相關(guān)系數(shù)84.3廣東省各市回歸

2、分析84.4 圖形描述11五、心得體會(huì)16六、實(shí)驗(yàn)過(guò)程原始記錄(數(shù)據(jù),圖表,計(jì)算等)16一、實(shí)驗(yàn)?zāi)康募爸饕獎(jiǎng)?chuàng)新性點(diǎn)1.1目的:自變量和因變量之間沒(méi)有嚴(yán)格的、確定性的函數(shù)關(guān)系,回歸分析的可以設(shè)法找出最能代表它們之間關(guān)系的數(shù)學(xué)表達(dá)形式。利用統(tǒng)計(jì)學(xué)中的回歸分析來(lái)揭1.2創(chuàng)新點(diǎn):把有實(shí)際意義的數(shù)值與統(tǒng)計(jì)方法相結(jié)合,通過(guò)多元回歸分析理解它的應(yīng)用。二、實(shí)驗(yàn)要求1、了解統(tǒng)計(jì)分析 2、會(huì)具體應(yīng)用線性回歸分析 3、學(xué)會(huì)分析統(tǒng)計(jì)結(jié)果,具體要求可細(xì)分為:(1)找出廣東省各個(gè)區(qū)影響登革熱發(fā)病的因素及與之相關(guān)的社會(huì)、經(jīng)濟(jì)和人口等因素;(2)進(jìn)行各種回歸分析,如用多元線性回歸分析對(duì)數(shù)據(jù)進(jìn)行處理;(3)通過(guò)回歸分析,獲得導(dǎo)

3、致登革熱病發(fā)的關(guān)鍵因素。三、實(shí)驗(yàn)原理3.1多元線性回歸基本理論與概述由于事物之間的聯(lián)系經(jīng)常是多方面的,一個(gè)因變量的變化往往受到多個(gè)自變量的影響。由多個(gè)自變量的最優(yōu)組合共同來(lái)預(yù)測(cè)或估計(jì)因變量,比只用一個(gè)自變量進(jìn)行預(yù)測(cè)或估計(jì)更有效,更符合實(shí)際。因此多元線性回歸比一元線性回歸的實(shí)用意義更大。多元線性回歸是一種數(shù)理統(tǒng)計(jì)方法。設(shè)因變量為y,自變量為x,自變量有p個(gè), 它們的組觀測(cè)值為 .其多元線性回歸表達(dá)式為: 寫成矩陣形式為 : 是多元線性回歸方程的回歸系數(shù)?,F(xiàn)實(shí)生活中,我們常會(huì)遇到含有多個(gè)自變量的問(wèn)題,經(jīng)常要同時(shí)考察多個(gè)自變量對(duì)一個(gè)因變量的相關(guān)度,如在對(duì)廣東省21個(gè)市登革熱發(fā)病率隱藏的統(tǒng)計(jì)分析中 ,

4、我們會(huì)發(fā)現(xiàn)各個(gè)市的總?cè)丝跀?shù)、農(nóng)村人口、相對(duì)濕度、年降雨量、年平均溫度、年平均溫度、城鎮(zhèn)化比例、經(jīng)濟(jì)數(shù)據(jù)(GDP)、人口密度等都會(huì)對(duì)登革熱發(fā)病率產(chǎn)生影響。這就是多個(gè)自變量影響一個(gè)因變量的情況。在實(shí)際問(wèn)題中,這種考察多個(gè)自變量與一個(gè)因變量的依賴關(guān)系的問(wèn)題是大量存在的,在地質(zhì)學(xué)、生物學(xué)、環(huán)境學(xué)等各種領(lǐng)域中也會(huì)碰到類似的問(wèn)題,多元線性回歸是多元統(tǒng)計(jì)分析中的一個(gè)重要方法。3.2多元線性回歸模型的建立為了探究我國(guó)廣東省21個(gè)市在20042014期間影響登革熱的發(fā)病因素,我們收集了這幾年廣東省的患登革熱病例數(shù),并在統(tǒng)計(jì)局與氣象網(wǎng)等收集了各市20042014年期間的總?cè)丝跀?shù)量、農(nóng)村人口、相對(duì)濕度、年降雨量、年

5、平均溫度、年平均溫度、人口密度、城鎮(zhèn)化比例、經(jīng)濟(jì)數(shù)據(jù)(GDP)這幾個(gè)因素的數(shù)據(jù),利用統(tǒng)計(jì)學(xué)的多元線性回歸分析來(lái)揭示數(shù)據(jù)隱藏的關(guān)系,找出導(dǎo)致登革熱發(fā)病的因素。2.2自變量的選取登革熱病例數(shù)與總?cè)丝跀?shù)量、農(nóng)村人口、相對(duì)濕度、年降雨量、年平均溫度、城鎮(zhèn)化比例、經(jīng)濟(jì)數(shù)據(jù)(GDP)、人口密度等多種因素相關(guān)。我們?nèi)∵@些因素作為自變量。3.3模型的檢驗(yàn)原理統(tǒng)計(jì)檢驗(yàn)是由統(tǒng)計(jì)理論決定的,目的在于檢驗(yàn)?zāi)P偷慕y(tǒng)計(jì)學(xué)性質(zhì)。它是運(yùn)用數(shù)理統(tǒng)計(jì)的方法,對(duì)方程進(jìn)行檢驗(yàn)、對(duì)模型參數(shù)估計(jì)值的可靠性進(jìn)行檢驗(yàn)主要包括擬合優(yōu)度檢驗(yàn)、方程顯著性檢驗(yàn)、變量顯著性檢驗(yàn)等。在多元線性回歸模型中,為了了解回歸模型是否符合變量之間的客觀規(guī)律需要對(duì)

6、回歸模型進(jìn)行檢驗(yàn),以確定預(yù)測(cè)結(jié)果的可信程度。R檢驗(yàn)與F檢驗(yàn)都是將所有的自變量作為一個(gè)整體來(lái)檢驗(yàn)它與因變量的相關(guān)性程度以及回歸效果。3.3.1擬合優(yōu)度檢驗(yàn)(R檢驗(yàn))為了檢驗(yàn)肺結(jié)核發(fā)病率的多元線性回歸方程與數(shù)據(jù)的擬合程度,我,們采取擬合優(yōu)度檢驗(yàn)的方法來(lái)說(shuō)明擬合優(yōu)度檢驗(yàn)方法是構(gòu)造一個(gè)可以表征擬合程度的 指標(biāo)。定義為: 總變差平方和是各個(gè)觀察值與樣本均值之差的平方和,反映了全部數(shù)據(jù)之間的差異;殘差平方和是總變差平方和中未被回歸方程解釋的部分,由解 釋變量中未包含的一切因素對(duì)被解釋變量的影響而造成的;回歸平方和是總變差平方和中由回歸方程解釋的部分。稱為復(fù)可決系數(shù),在實(shí)際預(yù)測(cè)時(shí),首先根據(jù)選定的檢驗(yàn)水平A查

7、表得到相關(guān)系數(shù)的臨界值RA,要求RRA;如果R<RA,則預(yù)測(cè)結(jié)果不能使用。3.3.2方程顯著性檢驗(yàn)(F檢驗(yàn))解釋自變量與肺結(jié)核發(fā)病率之間的線性關(guān)系,我們計(jì)算統(tǒng)計(jì)量的值來(lái)說(shuō)明 總體上被解釋變量與所有解釋變量之間的線性關(guān)系是否顯著。F變量定義為:即統(tǒng)計(jì)量服從以( n,n-1-k) 為自由度的分布,其中n為選取數(shù)據(jù)的組數(shù)k為回歸方程的自由度通過(guò)查詢分布統(tǒng)計(jì)表,我們便可以得出在特定顯著度的條件下檢驗(yàn)的臨界值當(dāng)統(tǒng)計(jì)量的值大于臨界值時(shí),即可認(rèn)為在總體上,自變量與 肺結(jié)核發(fā)病率呈顯著的線性關(guān)系,即回歸方程中所含有自變量足以解釋因變量的變化存在,若F<FA,則認(rèn)為線性回歸方程顯著不成立。3.3.3

8、變量顯著性檢驗(yàn)(T檢驗(yàn))通過(guò) T檢驗(yàn)我們可以看出每個(gè)自變量對(duì)因變量的影響,T檢驗(yàn)則是t統(tǒng)計(jì)量對(duì)所有回歸模型的每一個(gè)系數(shù)逐一進(jìn)行檢驗(yàn),對(duì)于給定的檢驗(yàn)水平,查t分布表得到臨界值tA,若ti>tA時(shí),回歸系數(shù)bi有顯著意義,Xi應(yīng)保留在回歸方程.否則,應(yīng)去掉Xi,重新建立回歸方程.統(tǒng)計(jì)量t 定義為:其中為各變量系數(shù)的估計(jì)值, 為各變量系數(shù)估計(jì)值的標(biāo)難差,t檢驗(yàn)法得到的數(shù)據(jù)的相關(guān)性不一定能反映邏輯的相關(guān)性,還需要考慮自變量是否在邏輯上與因變量關(guān)系密切。T檢驗(yàn)則是t統(tǒng)計(jì)量對(duì)所有回歸模型的每一個(gè)系數(shù)逐一進(jìn)行檢驗(yàn),對(duì)于給定的檢驗(yàn)水平,查t分布表得到臨界值tA,若ti>tA時(shí),回歸系數(shù)bi有顯著意

9、義,Xi應(yīng)保留在回歸方程.否則,應(yīng)去掉Xi,重新建立回歸方程.四、檢驗(yàn)結(jié)果與分析本實(shí)驗(yàn)針對(duì)2014年數(shù)據(jù)進(jìn)行分析,找出影響登革熱發(fā)病的原因。4.1多元線性回歸方程以下根據(jù)2014年廣東省省病例數(shù)建立多元線性回歸模型,其中表示自變量(表示GDP,表示相對(duì)濕度,表示年均降雨量,表示日照時(shí)數(shù),表示年平均溫度,表示總?cè)丝跀?shù),表示農(nóng)村人口數(shù),表示城鎮(zhèn)化, 表示人口密度,Y表示因變量,即登革熱發(fā)病率。2014年:Y=0.11245848341188+12.0059463308907+0.396148619016271-0.317092286552617+343.272562649585+3.2576148

10、936427-5.04374482199255+11.2175867917586-0.848171971518785-9001.85057800703詳細(xì)數(shù)據(jù)見(jiàn)(表1)4.2方差分析年份顯著性水平Significance FF值20140.050.09942499419281192.352601462096534.3相關(guān)系數(shù)GDP相對(duì)濕度年降雨量日照時(shí)數(shù)平均溫度總?cè)丝跀?shù)農(nóng)村人口城鎮(zhèn)化比例人口密度登革熱患病人數(shù)0.6822250.1410740.222929-0.17143-0.0250.28095410.2737110.101804相關(guān)系數(shù)的絕對(duì)值在0.35以下是無(wú)直線關(guān)系,0.3以上是直線相

11、關(guān),0.3-0.5,是低相關(guān)關(guān)系,0.5-0.8是顯著關(guān)系(中等程度相關(guān)),,0.8以上是高度相關(guān)。根據(jù)數(shù)據(jù)得相對(duì)濕度、年降雨量、日照時(shí)數(shù)、平均溫度、總?cè)丝跀?shù)、農(nóng)村人口、城鎮(zhèn)化比例、人口密度的絕對(duì)值均小于0.3,說(shuō)明這些因素與登革熱病人數(shù)不是直線相關(guān),GDP因素的相關(guān)系數(shù)介于0.3-0.5之間,低度相關(guān)。4.3廣東省各市回歸分析4.3.1 利用Excel進(jìn)行數(shù)據(jù)回歸分析由回歸分析結(jié)果知最后一個(gè)因素的P值小于0.05,有顯著性,因此人口密度對(duì)登革熱患病人數(shù)影響最大。4.3.2 利用Mathematica軟件畫散點(diǎn)圖廣東省各市登革熱患病人數(shù)詳細(xì)數(shù)據(jù)見(jiàn)(表2)4.4 圖形描述4.4.1 患病人數(shù)與GDP的關(guān)系圖4.4.2 患病人數(shù)與相對(duì)濕度的關(guān)系圖4.4.3 患病人數(shù)與年降雨量的關(guān)系圖4.4.4 患病人數(shù)與日照時(shí)數(shù)的關(guān)系圖4.4.5 患病人數(shù)與平均溫度的關(guān)系圖4.4.6 患病人數(shù)與總?cè)丝跀?shù)的關(guān)系圖五、心得體會(huì),通過(guò)這次實(shí)驗(yàn)我了解到如何查找數(shù)據(jù),如何應(yīng)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論