回歸分析課設(shè)_第1頁
回歸分析課設(shè)_第2頁
回歸分析課設(shè)_第3頁
回歸分析課設(shè)_第4頁
回歸分析課設(shè)_第5頁
已閱讀5頁,還剩18頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、概率論與數(shù)理統(tǒng)計(jì)課程設(shè)計(jì)成 績 評 定 表學(xué)生姓名xx班級學(xué)號xx專 業(yè)信息與計(jì)算科學(xué)課程設(shè)計(jì)題目影響彩電銷售的回歸分析評語組長簽字:成績?nèi)掌?2013 年 7月 日課程設(shè)計(jì)任務(wù)書學(xué) 院理學(xué)院專 業(yè)信息與計(jì)算科學(xué)學(xué)生姓名xx班級學(xué)號xx課程設(shè)計(jì)題目影響彩電銷售的回歸分析實(shí)踐教學(xué)要求與任務(wù):要求:通過該課程設(shè)計(jì),使學(xué)生進(jìn)一步理解概率論與數(shù)理統(tǒng)計(jì)的基本概念、理論和方法;初步掌握Excel統(tǒng)計(jì)工作表在隨機(jī)模擬中是應(yīng)用,MATLAB統(tǒng)計(jì)軟件包作常見的統(tǒng)計(jì)檢驗(yàn)和統(tǒng)計(jì)分析;具備初步的運(yùn)用計(jì)算機(jī)完成數(shù)據(jù)處理的技能,使課堂中學(xué)習(xí)到理論得到應(yīng)用。任務(wù)(至少一個(gè)):1數(shù)據(jù)整理:收集數(shù)據(jù),錄入數(shù)據(jù),畫出相應(yīng)圖形;建

2、立數(shù)學(xué)模型,數(shù)據(jù)的輸入與整理,各種數(shù)據(jù)的圖形顯示。2一元、多元線性回歸模型:數(shù)據(jù)散點(diǎn)圖,殘差圖。運(yùn)用MATLAB統(tǒng)計(jì)軟件,對給定的數(shù)據(jù)擬合回歸方程。3單因素、多因素方差分析:正態(tài)總體的方差分析問題; MATLAB統(tǒng)計(jì)軟件中關(guān)于回歸分析的相關(guān)命令,能對結(jié)果進(jìn)行簡單分析。4假設(shè)檢驗(yàn): 用MATLAB 統(tǒng)計(jì)軟件對模型進(jìn)行回歸性的檢驗(yàn),參數(shù)的檢驗(yàn),和對殘差圖的分析。工作計(jì)劃與進(jìn)度安排:周三12節(jié):選題,設(shè)計(jì)解決問題方法 周三38節(jié):調(diào)試程序周四14節(jié):完成論文,答辯指導(dǎo)教師: 2013 年7月 日專業(yè)負(fù)責(zé)人:2013 年 7 月 日學(xué)院教學(xué)副院長:2013 年7 月 日 摘 要在市場的經(jīng)濟(jì)活動中,經(jīng)常

3、會遇到某一市場現(xiàn)象的發(fā)展和變化取決于幾個(gè)影響因素的情況,也就是一個(gè)因變量和自變量幾個(gè)有依存關(guān)系的情況。它們相互聯(lián)系,相互依存,因而它們之間存在著一定的關(guān)系,一般說來,變量之間的關(guān)系大致可分為兩類:一類是確定性的關(guān)系,也就是我們所熟知的函數(shù)關(guān)系:另一類是非確定性的關(guān)系。應(yīng)當(dāng)指出,確定性關(guān)系與相關(guān)關(guān)系之間往往無法截然區(qū)分。一方面,由于測量誤差等隨機(jī)因素的影響,確定性關(guān)系在實(shí)際中往往通過相關(guān)關(guān)系表現(xiàn)出來;另一方面,當(dāng)人們對客觀事物的內(nèi)部規(guī)律了解的更加深刻時(shí),相關(guān)關(guān)系又可能轉(zhuǎn)化為確定性關(guān)系。數(shù)據(jù)統(tǒng)計(jì)中研究變量之間相互關(guān)系的一種有效方法就是回歸分析。關(guān)鍵詞:回歸分析;變量;測量誤差;數(shù)據(jù)統(tǒng)計(jì);因素;目錄

4、1 設(shè)計(jì)目的12 設(shè)計(jì)題目13 設(shè)計(jì)原理23.1 二元線性回歸模型的建立23.2 結(jié)果的分析44 設(shè)計(jì)程序74.1 輸入數(shù)據(jù),觀察與的線性關(guān)系74.2 作回歸分析與檢驗(yàn)84.3 殘差分析94.4 方差分析105 設(shè)計(jì)總結(jié)12致謝12參考文獻(xiàn)1216影響彩電銷售的回歸分析1 設(shè)計(jì)目的熟練掌握概率論與數(shù)理統(tǒng)計(jì)在實(shí)際問題上的應(yīng)用。了解二元回歸方程,回歸系數(shù)的檢驗(yàn)方法及應(yīng)用二元回歸方程進(jìn)行預(yù)測的方法,并將所學(xué)的知識結(jié)合MATLAB對數(shù)據(jù)的處理解決實(shí)際問題,并用MATLAB軟件進(jìn)行解算并檢驗(yàn);學(xué)會應(yīng)用MATLAB軟件進(jìn)行二元回歸實(shí)驗(yàn)的分析方法2 設(shè)計(jì)題目下面是十個(gè)地區(qū)彩電的需求量與其價(jià)格以及消費(fèi)者可支配

5、收入的相關(guān)數(shù)據(jù),如表一所示。表一設(shè)定兩個(gè)自變量指標(biāo)分別為:價(jià)格,消費(fèi)者收入,彩電需求量作為因變量,則可建立如下的二元線性回歸模型:其中分別為未知參數(shù),為隨機(jī)誤差,與自變量無關(guān),服從。3 設(shè)計(jì)原理3.1 二元線性回歸模型的建立在實(shí)際問題中,經(jīng)常會出現(xiàn)兩個(gè)變量之間的相關(guān)關(guān)系不是線性的(即直線型),而是非線性的(即曲線型)。設(shè)其中有兩個(gè)變量與,我們可以用一個(gè)確定函數(shù)關(guān)系式:大致的描述與之間的相關(guān)關(guān)系,函數(shù)稱為關(guān)于的回歸函數(shù),方程成為關(guān)于的回歸方程。二元線性回歸處理的是兩個(gè)變量與之間的線性關(guān)系,可以設(shè)想的值由兩部分構(gòu)成:一部分由自變量的線性影響所致,表示的線性函數(shù);另一部分則由眾多其他因素,包括隨機(jī)因

6、素的影響所致,這一部分可以視為隨機(jī)誤差項(xiàng),記為??傻枚€性回歸模型 自變量是可以控制的隨機(jī)變量,成為回歸變量;固定的未知參數(shù),成為回歸系數(shù);稱為響應(yīng)變量或因變量。由于是隨機(jī)誤差,根據(jù)中心極限定理,通常假定是未知參數(shù)。 在根據(jù)專業(yè)知識或者散點(diǎn)圖,選擇合適的曲線,將其轉(zhuǎn)化成線性方程。 3.1.1 模型回歸系數(shù)的估計(jì)為了估計(jì)回歸系數(shù),假定試驗(yàn)得到兩個(gè)變量與的個(gè)數(shù)據(jù)對我們將這對觀測值代入式(1),得 ,這里互獨(dú)立的隨機(jī)變量,均服從正態(tài)分布,即 回歸系數(shù)估計(jì)的方法有多種,其中使用最廣泛的是最小二乘法,即要求選取的 的值使得述隨機(jī)誤差的平方和達(dá)到最小,即求使得函數(shù) 取得最小值的。由于是的二元函數(shù),利用微

7、積分中的函數(shù)存在極值的必要條件,分別對求偏導(dǎo)數(shù),并令其為0,構(gòu)成二元一次方程組,化簡后得到如下正規(guī)方程組,解方程組得到總體參數(shù)估計(jì)量,這里均已有的觀測數(shù)據(jù)。由此得到回歸方程: 帶入觀測,得到值稱為回歸預(yù)測值。3.2 結(jié)果的分析在實(shí)際問題中,對于給定的顯著性水平,查表可知的臨界值,如果有樣本觀測值計(jì)算得到的統(tǒng)計(jì)量的觀測值大于,則在顯著性水平下拒絕原假設(shè),如果統(tǒng)計(jì)量的觀測值不大于,則接受原假設(shè),即認(rèn)為因素的不同水平對總體無顯著影響。3.2.1 回歸方程顯著性的檢驗(yàn)建立二元線性回歸方程當(dāng)且僅當(dāng)變量之間存在線性相關(guān)關(guān)系時(shí)才是有意義的,因此必須對變量之間的線性相關(guān)的顯著性進(jìn)行檢驗(yàn),即對建立的回歸模型進(jìn)行

8、顯著性檢驗(yàn)。首先引入幾個(gè)概念:,稱為總偏差平方和,它表示觀測值總的分散程度;,稱為回歸平方和,它是由回歸變量的變化引起的,放映了回歸變量對變量線性關(guān)系的密切程度;,稱為殘差(剩余)平方和,它是由觀測誤差等其他因素起誤差,它的值越小說明回歸方程與原數(shù)據(jù)擬合越好??梢宰C明下列關(guān)系成立 即 我們主要考慮回歸平方和在總偏差和中所占的比重,記稱為復(fù)相關(guān)系數(shù),用的大小來評價(jià)模型的有效性,越大,則反映回歸變量與相應(yīng)變量之間的線性函數(shù)關(guān)系越密切。引入統(tǒng)計(jì)量。 定義,可知于給定的顯著水平 (一般這里取0.05或0.01),查表可得臨界值 如果,則認(rèn)為與之間的線性關(guān)系顯著;如果,則認(rèn)為與之間的線性關(guān)系不顯著,或者

9、不存在線性關(guān)系,在實(shí)際應(yīng)用中也可以通過對應(yīng)的概率來說明與之間的線性相關(guān)性顯著。 表3.1.1.1線性回歸的方差分析表方差來源平方和自由度F值臨界值顯著性回歸剩余總計(jì)(1)當(dāng)時(shí),認(rèn)為與之間的線性相關(guān)關(guān)系不顯著,或者不存在線性相關(guān)關(guān)系;(2)當(dāng)時(shí),認(rèn)為與之間的線性相關(guān)關(guān)系顯著;(3)當(dāng)時(shí),認(rèn)為與之間的線性相關(guān)關(guān)系特別顯著。3.2.2 回歸方程參數(shù)顯著性的檢驗(yàn)在回歸分析中,檢驗(yàn)就是對回歸參數(shù)的顯著性進(jìn)行檢驗(yàn);檢驗(yàn)是對回歸方程的顯著性進(jìn)行檢驗(yàn)。在一元回歸中,二者是等價(jià)的;但在多元回歸中,檢驗(yàn)通過則檢驗(yàn)一定能夠通過,而檢驗(yàn)通過檢驗(yàn)不一定通過。值就是方便大家判斷顯著性的,一般地,例如在時(shí),就拒絕原假設(shè),說

10、明線性顯著。 3.2.3 回歸系數(shù)的置信區(qū)間回歸方程(1)的回歸系數(shù)是一個(gè)點(diǎn)估計(jì)值,給定置信水平后,可得到他們對應(yīng)的置信區(qū)間,并且回歸區(qū)間越短越好,如果這個(gè)回歸系數(shù)的置信區(qū)間包含0點(diǎn),則說明該回歸變量的影響不顯著,需要進(jìn)一步地修改回歸方程,盡量是每個(gè)回歸系數(shù)的置信區(qū)間都不包含0點(diǎn)。3.2.4 利用模型預(yù)測在對所建立的回歸模型進(jìn)行相關(guān)程度檢驗(yàn)與分析之后,如果預(yù)測變量與相關(guān)變量的每一個(gè)給定值,帶入回歸模型,就可以求得一個(gè)相對應(yīng)的回歸預(yù)測值,稱為模型的點(diǎn)估計(jì)值。4 設(shè)計(jì)程序?yàn)榱搜芯窟@些數(shù)據(jù)中所蘊(yùn)含的規(guī)律,設(shè)定兩個(gè)自變量指標(biāo)分別為:價(jià)格,消費(fèi)者收入;彩電需求量作為因變量,畫出它們的散點(diǎn)圖 。4.1 輸

11、入數(shù)據(jù),觀察與的線性關(guān)系 在命令窗口輸入:>> x1=5919 6545 6236 6470 6740 6440 6800 7240 7571 7068'>> x2=762 912 1067 1116 1190 1292 1434 1596 1800 1930'>> y=2356 244 3207 3246 3115 3414 3530 3870 3963 4668'>> plot(x1,y,'r*',x2,y,'k*')生成如圖4.1的散點(diǎn)圖,可以看出, 和y大體成線性關(guān)系。 圖4.1 散

12、點(diǎn)圖4.2 作回歸分析與檢驗(yàn)(1)在命令窗口輸入:>> y=5919 6545 6236 6470 6740 6440 6800 7240 7571 7068'x1=2356 244 3207 3246 3115 3414 3530 3870 3963 4668'x2=762 912 1067 1116 1190 1292 1434 1596 1800 1930'x=ones(10,1),x1,x2; b,bint,r,rint,stats=regress(y,x,0.05); bstats生成結(jié)果:b = 1.0e+003 * 5.2073 -0.0002

13、 0.0016stats = 1.0e+004 * 0.0001 0.0020 0.0000 4.6373即得到回歸系數(shù)為5.2073,-0.0002, 0.0016,負(fù)相關(guān)系數(shù) ,對應(yīng)的概率,可知回歸方程 從以上數(shù)據(jù)看來,該模型線性回歸顯著。4.3 殘差分析在命令窗口輸入:rcoplot(r,rint)出現(xiàn)圖4.1.3.1從殘差圖可以看出,數(shù)據(jù)的殘差離零點(diǎn)較近,且殘差的置信區(qū)間均包含零點(diǎn),這說明回歸模型能較好的符合原始數(shù)據(jù)。 圖4.3.1殘差圖4.4 方差分析在命令窗口輸入:x=3.5,4.5,3.3,4,3.9,2.27,2.35,2.29,2.36,2.33,1.17,1.15,1.14

14、,1.19,1.20;a=3.5,4.5,3.3,4,3.9;b=2.27,2.35,2.29,2.36,2.33;c=1.17,1.15,1.14,1.19,1.20;f1=sum(x(1,:)-mean(x).2);f2=(sum(mean(a)-mean(x)2)+sum(mean(b)-mean(x)2)+sum(mean(c)-mean(x)2)*3;st=f1sa=f2se=f1-f2st = 18.8169sa = 10.7618se =8.0551結(jié)論:彩電銷售量與消費(fèi)者收入水平正相關(guān),與彩電的價(jià)格負(fù)相關(guān),較好地體現(xiàn)了實(shí)際的經(jīng)濟(jì)意義(一般來說,隨著消費(fèi)者收入的增加,彩電的需求是

15、增加的;隨著彩電價(jià)格的提升,彩電的需求是下降的。),并且較好地通過了相關(guān)的檢驗(yàn)??梢姡疚乃俣ǖ亩€性回歸方程各個(gè)方面表現(xiàn)良好,即最終建立的二元線性回歸模型為: 。在該二元線性回歸方程中,的系數(shù)說明要增加彩電的銷售量在很大程度上取決于消費(fèi)者的收入。的系數(shù)為負(fù)數(shù),說明要增加彩電銷售量,商家也應(yīng)該適當(dāng)調(diào)整彩電價(jià)格,以低價(jià)優(yōu)惠來吸引顧客。5 設(shè)計(jì)總結(jié)通過對概率論與數(shù)理統(tǒng)計(jì)的這道實(shí)際問題的解決,不僅使我更加深刻的理解了概率論與數(shù)理統(tǒng)計(jì)的基礎(chǔ)知識,對線性回歸及線性回歸的方差分析、相關(guān)系數(shù)的顯著性檢驗(yàn)有了更深刻的了解,而且使我對這些知識在實(shí)際中的應(yīng)用產(chǎn)生了濃厚的興趣,同時(shí)對我學(xué)習(xí)好概率論與數(shù)理統(tǒng)計(jì)這門課有很大幫助。在實(shí)現(xiàn)這道題的過程中我應(yīng)用MATLAB軟件,學(xué)會了這個(gè)軟件的一些新的應(yīng)用,更加熟練的操作該軟件進(jìn)行一些數(shù)據(jù)上的處理。致謝本論文是張玉春老師指導(dǎo)下完成的。她嚴(yán)肅的科學(xué)態(tài)度,嚴(yán)謹(jǐn)?shù)闹螌W(xué)精神,精益求精的工作作風(fēng),深深地感染和激勵(lì)著我。在此,我向張老師致以誠摯的謝意和崇高的敬意。同時(shí)我還要感謝我的同學(xué)們,在論文設(shè)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論