




已閱讀5頁,還剩39頁未讀, 繼續(xù)免費(fèi)閱讀
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第十章 統(tǒng)計(jì)回歸模型,10.1 牙膏的銷售量 10.2 軟件開發(fā)人員的薪金 10.3 酶促反應(yīng) 10.4 投資額與國民生產(chǎn)總值和 物價(jià)指數(shù),回歸模型是用統(tǒng)計(jì)分析方法建立的最常用的一類模型,數(shù)學(xué)建模的基本方法,機(jī)理分析,測試分析,通過對數(shù)據(jù)的統(tǒng)計(jì)分析,找出與數(shù)據(jù)擬合最好的模型,不涉及回歸分析的數(shù)學(xué)原理和方法,通過實(shí)例討論如何選擇不同類型的模型,對軟件得到的結(jié)果進(jìn)行分析,對模型進(jìn)行改進(jìn),由于客觀事物內(nèi)部規(guī)律的復(fù)雜及人們認(rèn)識程度的限制,無法分析實(shí)際對象內(nèi)在的因果關(guān)系,建立合乎機(jī)理規(guī)律的數(shù)學(xué)模型。,10.1 牙膏的銷售量,問題,建立牙膏銷售量與價(jià)格、廣告投入之間的模型,預(yù)測在不同價(jià)格和廣告費(fèi)用下的牙膏銷售量,收集了30個(gè)銷售周期本公司牙膏銷售量、價(jià)格、廣告費(fèi)用,及同期其它廠家同類牙膏的平均售價(jià),基本模型,y 公司牙膏銷售量,x1其它廠家與本公司價(jià)格差,x2公司廣告費(fèi)用,x1, x2解釋變量(回歸變量, 自變量),y被解釋變量(因變量),0, 1 , 2 , 3 回歸系數(shù),隨機(jī)誤差(均值為零的正態(tài)分布隨機(jī)變量),MATLAB 統(tǒng)計(jì)工具箱,模型求解,b,bint,r,rint,stats=regress(y,x,alpha),輸入,x= n4數(shù)據(jù)矩陣, 第1列為全1向量,alpha(置信水平,0.05),b的估計(jì)值,bintb的置信區(qū)間,r 殘差向量y-xb,rintr的置信區(qū)間,Stats 檢驗(yàn)統(tǒng)計(jì)量 R2,F, p,yn維數(shù)據(jù)向量,輸出,由數(shù)據(jù) y,x1,x2估計(jì),結(jié)果分析,y的90.54%可由模型確定,F遠(yuǎn)超過F檢驗(yàn)的臨界值,p遠(yuǎn)小于=0.05,2的置信區(qū)間包含零點(diǎn)(右端點(diǎn)距零點(diǎn)很近),x2對因變量y 的影響不太顯著,x22項(xiàng)顯著,可將x2保留在模型中,模型從整體上看成立,銷售量預(yù)測,價(jià)格差x1=其它廠家價(jià)格x3-本公司價(jià)格x4,估計(jì)x3,調(diào)整x4,控制價(jià)格差x1=0.2元,投入廣告費(fèi)x2=650萬元,銷售量預(yù)測區(qū)間為 7.8230,8.7636(置信度95%),上限用作庫存管理的目標(biāo)值,下限用來把握公司的現(xiàn)金流,若估計(jì)x3=3.9,設(shè)定x4=3.7,則可以95%的把握知道銷售額在 7.83203.7 29(百萬元)以上,(百萬支),模型改進(jìn),x1和x2對y的影響?yīng)毩?兩模型銷售量預(yù)測比較,(百萬支),區(qū)間 7.8230,8.7636,區(qū)間 7.8953,8.7592,(百萬支),控制價(jià)格差x1=0.2元,投入廣告費(fèi)x2=6.5百萬元,預(yù)測區(qū)間長度更短,略有增加,x2=6.5,x1=0.2,x1,x1,x2,x2,兩模型 與x1,x2關(guān)系的比較,交互作用影響的討論,價(jià)格差 x1=0.1,價(jià)格差 x1=0.3,加大廣告投入使銷售量增加 ( x2大于6百萬元),價(jià)格差較小時(shí)增加的速率更大,x2,完全二次多項(xiàng)式模型,MATLAB中有命令rstool直接求解,從輸出 Export 可得,10.2 軟件開發(fā)人員的薪金,資歷 從事專業(yè)工作的年數(shù);管理 1=管理人員,0=非管理人員;教育 1=中學(xué),2=大學(xué),3=更高程度,建立模型研究薪金與資歷、管理責(zé)任、教育程度的關(guān)系,分析人事策略的合理性,作為新聘用人員薪金的參考,分析與假設(shè),y 薪金,x1 資歷(年),x2 = 1 管理人員,x2 = 0 非管理人員,1=中學(xué)2=大學(xué)3=更高,資歷每加一年薪金的增長是常數(shù); 管理、教育、資歷之間無交互作用,教育,線性回歸模型,a0, a1, , a4是待估計(jì)的回歸系數(shù),是隨機(jī)誤差,模型求解,R2,F, p 模型整體上可用,資歷增加1年薪金增長546,管理人員薪金多6883,中學(xué)程度薪金比更高的少2994,大學(xué)程度薪金比更高的多148,a4置信區(qū)間包含零點(diǎn),解釋不可靠!,殘差分析方法,結(jié)果分析,殘差,e 與資歷x1的關(guān)系,e與管理教育組合的關(guān)系,殘差全為正,或全為負(fù),管理教育組合處理不當(dāng),殘差大概分成3個(gè)水平, 6種管理教育組合混在一起,未正確反映 。,應(yīng)在模型中增加管理x2與教育x3, x4的交互項(xiàng),進(jìn)一步的模型,增加管理x2與教育x3, x4的交互項(xiàng),R2,F有改進(jìn),所有回歸系數(shù)置信區(qū)間都不含零點(diǎn),模型完全可用,消除了不正常現(xiàn)象,異常數(shù)據(jù)(33號)應(yīng)去掉,e x1,e 組合,去掉異常數(shù)據(jù)后的結(jié)果,e x1,e 組合,R2: 0.957 0.999 0.9998 F: 226 554 36701 置信區(qū)間長度更短,殘差圖十分正常,最終模型的結(jié)果可以應(yīng)用,模型應(yīng)用,制訂6種管理教育組合人員的“基礎(chǔ)”薪金(資歷為0),中學(xué):x3=1, x4=0 ;大學(xué):x3=0, x4=1; 更高:x3=0, x4=0,x1= 0; x2 = 1 管理,x2 = 0 非管理,大學(xué)程度管理人員比更高程度管理人員的薪金高,大學(xué)程度非管理人員比更高程度非管理人員的薪金略低,對定性因素(如管理、教育),可以引入0-1變量處理,0-1變量的個(gè)數(shù)應(yīng)比定性因素的水平少1,軟件開發(fā)人員的薪金,殘差分析方法可以發(fā)現(xiàn)模型的缺陷,引入交互作用項(xiàng)常常能夠改善模型,剔除異常數(shù)據(jù),有助于得到更好的結(jié)果,注:可以直接對6種管理教育組合引入5個(gè)0-1變量,10.3 酶促反應(yīng),問題,研究酶促反應(yīng)(酶催化反應(yīng))中嘌呤霉素對反應(yīng)速度與底物(反應(yīng)物)濃度之間關(guān)系的影響,建立數(shù)學(xué)模型,反映該酶促反應(yīng)的速度與底物濃度以及經(jīng)嘌呤霉素處理與否之間的關(guān)系,設(shè)計(jì)了兩個(gè)實(shí)驗(yàn) :酶經(jīng)過嘌呤霉素處理;酶未經(jīng)嘌呤霉素處理。實(shí)驗(yàn)數(shù)據(jù)見下表:,方案,基本模型,Michaelis-Menten模型,y 酶促反應(yīng)的速度, x 底物濃度,1 , 2 待定系數(shù),底物濃度較小時(shí),反應(yīng)速度大致與濃度成正比; 底物濃度很大、漸進(jìn)飽和時(shí),反應(yīng)速度趨于固定值。,酶促反應(yīng)的基本性質(zhì),實(shí)驗(yàn)數(shù)據(jù),線性化模型,經(jīng)嘌呤霉素處理后實(shí)驗(yàn)數(shù)據(jù)的估計(jì)結(jié)果,對1 , 2非線性,線性化模型結(jié)果分析,x較大時(shí),y有較大偏差,1/x較小時(shí)有很好的線性趨勢,1/x較大時(shí)出現(xiàn)很大的起落,參數(shù)估計(jì)時(shí),x較?。?/x很大)的數(shù)據(jù)控制了回歸參數(shù)的確定,beta,R,J = nlinfit (x,y,model,beta0),beta的置信區(qū)間,MATLAB 統(tǒng)計(jì)工具箱,輸入,x自變量數(shù)據(jù)矩陣 y 因變量數(shù)據(jù)向量,beta 參數(shù)的估計(jì)值R 殘差,J 估計(jì)預(yù)測誤差的Jacobi矩陣,model 模型的函數(shù)M文件名 beta0 給定的參數(shù)初值,輸出,betaci =nlparci(beta,R,J),非線性模型參數(shù)估計(jì),function y=f1(beta, x) y=beta(1)*x./(beta(2)+x);,x= ; y= ; beta0=195.8027 0.04841; beta,R,J=nlinfit(x,y,f1,beta0); betaci=nlparci(beta,R,J); beta, betaci,beta0線性化模型估計(jì)結(jié)果,非線性模型結(jié)果分析,畫面左下方的Export 輸出其它統(tǒng)計(jì)結(jié)果。,拖動畫面的十字線,得 y的預(yù)測值和預(yù)測區(qū)間,剩余標(biāo)準(zhǔn)差s= 10.9337,最終反應(yīng)速度為 半速度點(diǎn)(達(dá)到最終速度一半時(shí)的x值 )為,其它輸出,命令nlintool 給出交互畫面,o 原始數(shù)據(jù) + 擬合結(jié)果,混合反應(yīng)模型,x1為底物濃度, x2為一示性變量 x2=1表示經(jīng)過處理,x2=0表示未經(jīng)處理 1是未經(jīng)處理的最終反應(yīng)速度 1是經(jīng)處理后最終反應(yīng)速度的增長值 2是未經(jīng)處理的反應(yīng)的半速度點(diǎn) 2是經(jīng)處理后反應(yīng)的半速度點(diǎn)的增長值,在同一模型中考慮嘌呤霉素處理的影響,o 原始數(shù)據(jù) + 擬合結(jié)果,混合模型求解,用nlinfit 和 nlintool命令,估計(jì)結(jié)果和預(yù)測,剩余標(biāo)準(zhǔn)差s= 10.4000,2置信區(qū)間包含零點(diǎn),表明2對因變量y的影響不顯著,簡化的混合模型,簡化的混合模型形式簡單,參數(shù)置信區(qū)間不含零點(diǎn),剩余標(biāo)準(zhǔn)差 s = 10.5851,比一般混合模型略大,估計(jì)結(jié)果和預(yù)測,一般混合模型與簡化混合模型預(yù)測比較,簡化混合模型的預(yù)測區(qū)間較短,更為實(shí)用、有效,預(yù)測區(qū)間為預(yù)測值 ,注:非線性模型擬合程度的評價(jià)無法直接利用線性模型的方法,但R2 與s仍然有效。,酶促反應(yīng),反應(yīng)速度與底物濃度的關(guān)系,非線性關(guān)系,求解線性模型,求解非線性模型,嘌呤霉素處理對反應(yīng)速度與底物濃度關(guān)系的影響,混合模型,簡化模型,10.4 投資額與國民生產(chǎn)總值和物價(jià)指數(shù),問題,建立投資額模型,研究某地區(qū)實(shí)際投資額與國民生產(chǎn)總值 ( GNP ) 及物價(jià)指數(shù) ( PI ) 的關(guān)系,2.0688,3073.0,424.5,20,1.0000,1185.9,195.0,10,1.9514,2954.7,474.9,19,0.9601,1077.6,166.4,9,1.7842,2631.7,401.9,18,0.9145,992.7,144.2,8,1.6342,2417.8,423.0,17,0.8679,944.0,149.3,7,1.5042,2163.9,386.6,16,0.8254,873.4,133.3,6,1.4005,1918.3,324.1,15,0.7906,799.0,122.8,5,1.3234,1718.0,257.9,14,0.7676,756.0,125.7,4,1.2579,1549.2,206.1,13,0.7436,691.1,113.5,3,1.1508,1434.2,228.7,12,0.7277,637.7,97.4,2,1.0575,1326.4,229.8,11,0.7167,596.7,90.9,1,物價(jià) 指數(shù),國民生產(chǎn)總值,投資額,年份 序號,物價(jià) 指數(shù),國民生產(chǎn)總值,投資額,年份序號,根據(jù)對未來GNP及PI的估計(jì),預(yù)測未來投資額,該地區(qū)連續(xù)20年的統(tǒng)計(jì)數(shù)據(jù),時(shí)間序列中同一變量的順序觀測值之間存在自相關(guān),以時(shí)間為序的數(shù)據(jù),稱為時(shí)間序列,分析,許多經(jīng)濟(jì)數(shù)據(jù)在時(shí)間上有一定的滯后性,需要診斷并消除數(shù)據(jù)的自相關(guān)性,建立新的模型,若采用普通回歸模型直接處理,將會出現(xiàn)不良后果,投資額與國民生產(chǎn)總值和物價(jià)指數(shù),基本回歸模型,投資額與 GNP及物價(jià)指數(shù)間均有很強(qiáng)的線性關(guān)系,t 年份, yt 投資額,x1t GNP, x2t 物價(jià)指數(shù),0, 1, 2 回歸系數(shù),t 對t相互獨(dú)立的零均值正態(tài)隨機(jī)變量,基本回歸模型的結(jié)果與分析,MATLAB 統(tǒng)計(jì)工具箱,剩余標(biāo)準(zhǔn)差 s=12.7164,沒有考慮時(shí)間序列數(shù)據(jù)的滯后性影響,R20.9908,擬合度高,模型優(yōu)點(diǎn),模型缺點(diǎn),可能忽視了隨機(jī)誤差存在自相關(guān);如果存在自相關(guān)性,用此模型會有不良后果,自相關(guān)性的定性診斷,殘差診斷法,模型殘差,作殘差 etet-1 散點(diǎn)圖,大部分點(diǎn)落在第1, 3象限,大部分點(diǎn)落在第2, 4象限,自相關(guān)性直觀判斷,在MATLAB工作區(qū)中輸出,et為隨機(jī)誤差t 的估計(jì)值,自回歸性的定量診斷,自回歸模型,自相關(guān)系數(shù),0, 1, 2 回歸系數(shù),= 0, 0, 0,如何估計(jì),如何消除自相關(guān)性,D-W檢驗(yàn),ut 對t相互獨(dú)立的零均值正態(tài)隨機(jī)變量,D-W統(tǒng)計(jì)量與D-W檢驗(yàn),檢驗(yàn)水平,樣本容量,回歸變量數(shù)目,檢驗(yàn)臨界值dL和dU,由DW值的大小確定自相關(guān)性,廣義差分變換,以*0, 1 , 2 為回歸系數(shù)的普通回歸模型,原模型 DW值,無自相關(guān),有自相關(guān),新模型,新模型,步驟,原模型,變換,不能確定,投資額新模型的建立,DWold dL,作變換,原模型殘差et,樣本容量n=20,回歸變量數(shù)目k=3,=0.05,臨界值dL=1.10, dU=1.54,總體效果良好,剩余標(biāo)準(zhǔn)差 snew= 9.8277 sold=12.7164,投資額新模型的建立,新模型的自相
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025屆河北省滄州市滄衡八縣聯(lián)考高三一模語文試題(解析版)
- 2024-2025學(xué)年四川省瀘州市高一下學(xué)期入學(xué)檢測語文試題(解析版)
- 安全管理范圍
- 環(huán)境工程造價(jià)課件
- 食材采購標(biāo)準(zhǔn)和配送服務(wù)方案
- 使用設(shè)備臺賬管理制度
- 供應(yīng)鏈服務(wù)商管理制度
- 供熱公司公章管理制度
- 供熱特種設(shè)備管理制度
- 供電公司物資部倉庫管理制度
- DB65-T 4824-2024 干旱區(qū)蒸散發(fā)量計(jì)算規(guī)范
- 地域文化(專)-終結(jié)性考試-國開(SC)-參考資料
- 我是為了您的孩子 您是為了我的學(xué)生-期中測試家長會 課件
- 2023年中考物理復(fù)習(xí)《三類液面高度變化問題的深度解析》
- 車站值班員(高級)技能鑒定理論題庫(濃縮400題)
- 2024年-2025年公路養(yǎng)護(hù)工理論知識考試題及答案
- 2024-2025學(xué)年小學(xué)信息技術(shù)(信息科技)五年級全一冊義務(wù)教育版(2024)教學(xué)設(shè)計(jì)合集
- 退役軍人事務(wù)員(五級)職業(yè)資格考試題及答案
- 云南省昆明市2024年小升初語文真題試卷及答案
- 2024年貴州省貴陽市中考生物地理合卷試題(含答案逐題解析)
- DL∕T 740-2014 電容型驗(yàn)電器
評論
0/150
提交評論