版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、4:回歸分析0:引言:1:在國民經(jīng)濟產(chǎn)值與資金、勞動力的關系,我們用線性最小二乘法或非線性最小二乘法估計了其中的參數(shù)。有無進一步研究的必要?2:從數(shù)理統(tǒng)計的觀點 看,這里涉及的都是隨機變量,我們根據(jù)樣本計算出的那些系數(shù),只是它們的一個(點)估計,如果置信區(qū)間太大,甚至包含了零點,那么系數(shù)的估計值是沒有多大意義的。另外,也可以用方差分析方法對模型的誤差進行分析,對擬合的優(yōu)劣給出評價,簡單地說,回歸分析就是對擬合問題作的統(tǒng)計分析。3:舉一個例子說明統(tǒng)計分析的必要性:(1)問題甲得到一組數(shù)據(jù):X=0,1,2,3,4,Y=1.0,1.3,1.5,2.0,2.3;問題乙得到一組數(shù)據(jù):X=0,1,2,3,
2、4,Z=0.6,1.95,0.9,2.85,1.8;(2)兩組數(shù)據(jù)的散點圖:Xk,Yk用+表示; Xk,Zk用*表示。(3)MATLAB 實現(xiàn) to huiguibiyao.mX=0,1,2,3,4;Y=1.0,1.3,1.5,2.0,2.3;Z=0.6,1.95,0.9,2.85,1.8;a=polyfit(X,Y,1)a;b=polyfit(X,Z,1)b;plot(X,Y,+r);hold onplot(X,Z,*b);hold onfplot(0.33*x+0.96,0 4);hold on得到:a=0.33 0.96; b=0.33 0.96.結論:兩者擬合的結果是同一條直線y=0.
3、33x+0.96(z=0.33x+0.96)但是它們的意義卻大不一樣。人們對結果a的信任度很高;人們對結果b的信任度很低.4:統(tǒng)計分析的任務:(對可信度作出定量評價)建立因變量y與自變量之間x1,x2,xm的回歸模型(經(jīng)驗公式);對回歸模型的可信度進行檢驗;判斷每個自變量xi(i=1,2,m)對y的影響是否顯著;診斷回歸模型是否適合這組數(shù)據(jù);利用回歸模型對y進行預報或控制。二實際問題:1:合金強度與碳含量:合金強度y與其中碳含量x有比較密切的關系。(如下):用polyfit(x,y,1)擬合得:y=ax+b;a=140.6194,b=27.0269;上述結果的可信度?x對y影響是否顯著?有無異
4、常點?2:年齡與運動能力:將17至29歲的運動員每兩周歲一組分為7組,每組兩人測量起旋轉定向能力,以考察年齡對這種運動能力的影響,現(xiàn)得到一組數(shù)據(jù)如下表,試建立二者的關系:散點圖形狀:兩端低,用二次曲線擬合:ploy(X,Y,2)但需進一步分析?3:商品銷售量與價格: 某廠生產(chǎn)的一種電器的銷售量y與競爭對手的價格x1和本廠的價格x2有關:試根據(jù)這些數(shù)據(jù)建立與和的關系式,對得到的模型和系數(shù)進行檢驗;如果某市本廠產(chǎn)品售價160(元),競爭對手的售價170元,預測商品在該市的銷售量。三:多元線性回歸: 回歸分析中最簡單的形式是:y=0+1x均為標量, 0,1為回歸系數(shù),稱一元線性回歸。推廣:x是多元變
5、量:這里y對回歸系數(shù)=(0,1,m)是線性的,稱為多元線性回歸。不難看出,對x作變換,(2)將化為(1)的形式,所以(1)稱為線性回歸的標準形。1:模型: 在回歸分析中自變量x=(x1,x2, ,xm)是影響因變量的主要因素,是人們能控制的或能觀察的,而y還受到隨機因素的干擾,可以合理地假定這種干擾服從0均值的正態(tài)分布,于是模型記作: 現(xiàn)得到n個獨立觀測數(shù)據(jù)(yi,xi1,xim),i=1,2,n,nm,由(3)得:2:參數(shù)估計:(1)方法: 用最小二乘法估計模型(3)中參數(shù)。 由(4)式這組數(shù)據(jù)的誤差平方和為:(2)殘差:稱為殘差平方和(或剩余平方和)。即3:統(tǒng)計分析:(不證明,直接給出結果
6、)(5):回歸平方和:其中Q是由(10)式定義的殘差平方和,反映隨機誤差對y的影響。U稱為回歸平方和,反映自變量對y的影響。4:回歸模型的假設檢驗:(1)檢驗的必要性:(2)檢驗的方法一:(F分布檢驗) 可令原假設為H0:j=0(j=1,,m);注意:接受H0只說明y與x1,,xm線性關系不顯著,可能存在非線性關系,如平方關系。5:回歸系數(shù)的假設檢驗和區(qū)間關系。(1)原因:當上面H0被拒絕時(即線性模型成立時)j不全為0;但不排除其中若干個等于0;應進一步做如下m個檢驗(j=1,m):(2)檢驗方法(t檢驗)思考:6:利用回歸模型進行預測:7:MATLAB實現(xiàn):(在MATLAB統(tǒng)計工具箱中用r
7、egress實現(xiàn)多元線性回歸)(1)用法:Y,X同上;alpha為顯著性水平(確省時設定為0.05);b,bint為回歸系數(shù)估計值和它們的置信區(qū)間;r,rint為殘差(向量)及置信區(qū)間;stats是用于檢驗回歸模型的統(tǒng)計量,有3個數(shù)值:第1個是R*R(見(16)式),第2個是F(見(15)式),第3個是與F對應的概率p,p時拒絕H0,回歸模型成立。Rcoplot(r,rint)畫殘差及置信區(qū)間圖。四:幾個實際問題用回歸模型求解。1:合金強度與碳含量問題:(1)建立模型:(2)編程(用regress和rcoplot求解)to hejing.mx1=0.1:0.01:0.18;x=x1,0.2,0
8、.21,0.23;Y=42,41.5,45,45.5,45,47.5,49,55,50,55,55.5,60.5;X=ones(12,1),x;b,bint,r,rint,stats=regress(Y,X);bbintstatsrcoplot(r,rint);(3)結果:殘差圖除第8個數(shù)據(jù)外,其余殘差置信區(qū)間均包含0點,剔除第8個點。(即第8個點為異常點)(4)剔除異常點后重新計算:to hejing2.mb = 27.0992 137.8085bint = 23.8563 30.3421 117.8534 157.7636stats = 0.9644 244.0571 0.00002:商品
9、銷售量與價格問題:(1)建立模型:(2)編程計算:to shangping.mX1=120,140,190,130,155,175,125,145,180,150;X2=100,110,90,150,210,150,250,270,300,250;Y=102,100,120,77,46,93,26,69,65,85;X=ones(10,1) X1 X2;b,bint,r,rint,stats=regress(Y,X);bbintstats(3)結果:b = 66.5176 0.4139 -0.2698bint = -32.5060 165.5411 -0.2018 1.0296 -0.4611
10、 -0.0785stats = 0.6527 6.5786 0.0247五:多項式回歸及問題求解:1:多項式回歸的MATLAB實現(xiàn):(1)一元多項式回歸:(2)多元多項式回歸:rstool(X,Y,model,alpha);輸入數(shù)據(jù)X,Y分別為nm矩陣和n維向量,alpha為顯著性水平(缺省時為0.05);model由下列4個模型中選擇1個(用字符串輸入,缺省時設定為線性模型):2:運動能力問題求解:(1)選用二次模型:(2)編程計算:to yundong.mX1=17:2:29;X=X1,X1;y=20.48,25.13,26.15,30.0,26.1,20.3,19.35,24.35,28
11、.11,26.3,31.4,26.92,25.7,21.3;P,S=polyfit(X,y,2);P(3)結果:P = -0.2003 8.9782 -72.2150;a1=-0.2003 a2= 8.9782 a3=-72.2150.(4):檢驗:A:擬合圖:上面S是一個數(shù)據(jù)結構,用于它函數(shù)的計算;如Y,delta=polyconf(P,X,S);Y得到Y的擬合值:Y = Columns 1 through 7 22.5243 26.0582 27.9896 28.3186 27.0450 24.1689 19.6904 Columns 8 through 14 22.5243 26.058
12、2 27.9896 28.3186 27.0450 24.1689 19.6904。作X與Y的連續(xù)曲線,擬合效果如圖:B: 相關系數(shù)(R*R)和殘差(s):Y1=mean(y);requare=sum(Y-Y1).2)/sum(y-Y1).2)s=sqrt(sum(y-Y).2)/12)requare = 0.6980s = 2.0831(5)結論:尚能接受的結果。3:商品銷售量與價格模型的修正:(1)改用純二次模型:即:(2)編程計算:to shangpingerci.mX1=120,140,190,130,155,175,125,145,180,150;X2=100,110,90,150,210,150,250,270,300,250;y=102,100,120,77,46,93,26,69,65,85;X=X1 X2;rstool(X,y,purequadratic)(3)結果:A:得到如圖的交互式畫面:to shangpingerci.m給出兩幅圖形:左邊是x2(=151)固定時的曲線y(x1)及其置區(qū)間;右邊是x1(=188)固定時的曲線y(x2)及其置區(qū)間;在圖下方窗口,可改變x1,x2的值。B:Expor
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024美金結算支付合同范本6篇
- 2025年度拆除工程合同糾紛調解協(xié)議范本4篇
- 二零二五年度生物科技產(chǎn)業(yè)園廠址租賃及研發(fā)合作框架協(xié)議2篇
- 與消防隊合作協(xié)議 2篇
- 2024跨境商業(yè)交易商議與協(xié)議制作詳解版
- 2025年度老舊廠房拆遷安置房購置合同4篇
- 2025年度礦產(chǎn)資源測繪勞務分包合同(新版)4篇
- 2024年獨家品牌代理協(xié)議
- 2025年度產(chǎn)業(yè)園租賃與運營一體化合同4篇
- 2024年03月浙江杭銀理財崗位招考筆試歷年參考題庫附帶答案詳解
- 巖土工程勘察課件0巖土工程勘察
- 《腎上腺腫瘤》課件
- 2024-2030年中國典當行業(yè)發(fā)展前景預測及融資策略分析報告
- 《乘用車越野性能主觀評價方法》
- 幼師個人成長發(fā)展規(guī)劃
- 2024-2025學年北師大版高二上學期期末英語試題及解答參考
- 動物醫(yī)學類專業(yè)生涯發(fā)展展示
- 批發(fā)面包采購合同范本
- 乘風化麟 蛇我其誰 2025XX集團年終總結暨頒獎盛典
- 2024年大數(shù)據(jù)分析公司與中國政府合作協(xié)議
- 一年級數(shù)學(上)計算題專項練習匯編
評論
0/150
提交評論