數(shù)理統(tǒng)計模型課件_第1頁
數(shù)理統(tǒng)計模型課件_第2頁
數(shù)理統(tǒng)計模型課件_第3頁
數(shù)理統(tǒng)計模型課件_第4頁
數(shù)理統(tǒng)計模型課件_第5頁
已閱讀5頁,還剩201頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

數(shù)理統(tǒng)計模型數(shù)理統(tǒng)計模型數(shù)理統(tǒng)計模型主要內(nèi)容數(shù)理統(tǒng)計模型概述描述性統(tǒng)計推論性統(tǒng)計模型統(tǒng)計模型中常見的錯誤統(tǒng)計模型建立程式舉例書籍能培養(yǎng)我們的道德情操,給我們巨大的精神力量,鼓舞我們前進(jìn)數(shù)理統(tǒng)計模型數(shù)理統(tǒng)計模型數(shù)理統(tǒng)計模型主要內(nèi)容數(shù)理統(tǒng)計模型概述1主要內(nèi)容數(shù)理統(tǒng)計模型概述描述性統(tǒng)計推論性統(tǒng)計模型統(tǒng)計模型中常見的錯誤統(tǒng)計模型建立程式舉例主要內(nèi)容數(shù)理統(tǒng)計模型概述2第一節(jié)數(shù)理統(tǒng)計模型概述一、統(tǒng)計分析概述

統(tǒng)計分析通過計算研究對象的特征的樣本平均值、方差,或者所占百分比,研究樣本特征值與母體特征值的關(guān)系,研究變量之間的關(guān)系,特別是因果關(guān)系,從而發(fā)現(xiàn)被研究對象的發(fā)展規(guī)律,或者驗(yàn)證有關(guān)假想、結(jié)論是否成立,驗(yàn)證有關(guān)理論在新的時空中是否成立。進(jìn)而可以針對深層原因,引出改變客觀世界的策略。第一節(jié)數(shù)理統(tǒng)計模型概述一、統(tǒng)計分析概述3二、統(tǒng)計的兩種功能描述與推理描述性統(tǒng)計(descriptivestatistics)描述性統(tǒng)計是概括所取得數(shù)據(jù)的共有性質(zhì)。推論性統(tǒng)計(inferentialstatistics)。推論性統(tǒng)計幫助研究人員對數(shù)據(jù)做出判斷。二、統(tǒng)計的兩種功能描述與推理4三、管理研究中統(tǒng)計分析的功能統(tǒng)計分析的方法可以為管理研究提供一種清晰精確的形式化語言;統(tǒng)計分析是進(jìn)行科學(xué)預(yù)測、探索未來的重要方法;統(tǒng)計分析技術(shù)是處理調(diào)查研究資料的必要工具。三、管理研究中統(tǒng)計分析的功能5第二節(jié)描述性統(tǒng)計模型一、集中趨勢分析(一)含義:集中量數(shù)也稱集中趨勢量數(shù),是用一個數(shù)值去代表一組數(shù)據(jù)的一般水平。常用的集中量數(shù)有平均數(shù)、中位數(shù)和眾數(shù)。平均數(shù)是所有測量數(shù)據(jù)的算術(shù)平均值,中位數(shù)是將測量數(shù)據(jù)按大小順序一分為二的變量屬性值,即位于排列順序中間位置的數(shù)值,眾數(shù)是測量數(shù)據(jù)中出現(xiàn)頻率最高的數(shù)值。第二節(jié)描述性統(tǒng)計模型一、集中趨勢分析6例有一組數(shù)據(jù)是9位工人本月的產(chǎn)量:96、96、97、99、100、101、102、104、155。則:平均數(shù)為105.5,中位數(shù)為100,眾數(shù)為96。例有一組數(shù)據(jù)是9位工人本月的產(chǎn)量:96、96、97、99、17(二)集中趨勢分析的作用集中量數(shù)說明某一管理現(xiàn)象在一定條件下,其數(shù)量的一般水平。集中量數(shù)可以對于在不同空間的同類現(xiàn)象進(jìn)行比較。集中量數(shù)可以對一定管理現(xiàn)象在不同時間中的變化進(jìn)行比較,以說明這些現(xiàn)象的發(fā)展趨勢和規(guī)律。集中量數(shù)可以用來分析某些管理現(xiàn)象之間的依存關(guān)系。(二)集中趨勢分析的作用8二、離散趨勢分析(一)含義離散趨勢分析是反映測量數(shù)據(jù)的分散程度,其常用指標(biāo)有:極差(range)與標(biāo)準(zhǔn)差(standarddeviation)。極差是測量數(shù)據(jù)中的最大值與最小值之間的差異,由兩個極端值來決定,只適用于定距與定比數(shù)據(jù)。標(biāo)準(zhǔn)差綜合反映所有數(shù)據(jù)的分散程度,與平均數(shù)配套使用,適用于定距于定比數(shù)據(jù),其計算式為:其中,為標(biāo)準(zhǔn)差,x為樣本值,X為平均數(shù),N為樣本總數(shù)。二、離散趨勢分析(一)含義9三、頻數(shù)與頻率分析為直觀地反映一組測量數(shù)據(jù)的分布狀況,經(jīng)常用頻數(shù)與頻率分析。頻數(shù)分布描述測量值中各屬性值出現(xiàn)的次數(shù),頻率分布則是用比率的形式來表示,各屬性值除以樣本總數(shù)即可得到該屬性值的頻率。三、頻數(shù)與頻率分析為直觀地反映一組測量數(shù)10頻數(shù)分布也可轉(zhuǎn)化為可視化的表達(dá)方式,如長條圖、直方圖、餅圖。在SPSS統(tǒng)計軟件中,具體操作是:在統(tǒng)計菜單(statiatics)中單擊摘要(summarize)、頻數(shù)(frequencies),并在頻數(shù)對話框中選擇所要的圖表(charts),即可獲得這些圖表。頻數(shù)分布也可轉(zhuǎn)化為可視化的表達(dá)方式,如長條圖、直方圖、餅圖。11第三節(jié)推論性統(tǒng)計模型統(tǒng)計推斷的功能

從隨機(jī)樣本中推斷總體參數(shù)特征、以統(tǒng)計為基礎(chǔ)驗(yàn)證假設(shè)。第三節(jié)推論性統(tǒng)計模型統(tǒng)計推斷的功能12一、雙變量的回歸分析與相關(guān)分析回歸分析模型收入——X居民儲蓄量——Y一、雙變量的回歸分析與相關(guān)分析回歸分析模型收入——X13(一)回歸模型XY(一)回歸模型XY141、回歸模型的概念強(qiáng)的正相關(guān)弱的正相關(guān)中間程度的正相關(guān)|r

|=0.936|r

|=0.560|r

|=0.3390強(qiáng)的負(fù)相關(guān)弱的負(fù)相關(guān)中間程度的負(fù)相關(guān)1、回歸模型的概念強(qiáng)的正相關(guān)弱的正相關(guān)中間程度的正相關(guān)|r15確立X與Y的關(guān)聯(lián)性回歸…尋找“Y”與“X”關(guān)系的方法什么是回歸?描述“Y”與“X”關(guān)系的數(shù)學(xué)方法-創(chuàng)建過程的“模型”?;貧w分析相關(guān)是告訴關(guān)系的程度,回歸分析是找出Y=F(X)的函數(shù)關(guān)系式回歸…尋找“Y”與“X”關(guān)系的方法回歸分析相關(guān)是告訴關(guān)系的16單純線性回歸回歸分析的階段此章的因子為一個,因子和輸出值(Y)的關(guān)系為直線關(guān)系的單純線性回歸(SimpleLinearRegression)Data收集用散點(diǎn)圖確認(rèn)關(guān)系用最小二乘法推斷總體進(jìn)行方差分析畫直線(LineFitting)分析殘差單純線性回歸回歸分析的階段此章的因子為一個,因子和輸出值(Y17通過樣本推測的直線未知的真實(shí)直線Yi=+xi+i

(i=1,.…,n)i

是相互獨(dú)立的遵守N(0,2)的概率變量單純線性回歸模型εiei(xi,yi)xy在這里,εi~iidN(0,σ2)Model

定義

一個獨(dú)立變量(x)與

一個從屬變量(Y)間的關(guān)系方程式化后顯示的方法通過樣本推測的直線未知的真實(shí)直線Yi=+xi+18將誤差平方和最小化的推斷方法,找出將殘差平方最小化的直線.420410400390380370360350340330320350400450獨(dú)立變量從屬變量最小平方和的單純回歸單純回歸直線與回歸直線的差異直線是以“最小平方和推斷法(leastsquareestimation)”的原則畫出的.從資料的點(diǎn)到直線的距離的平方和最小化.將誤差平方和最小化的推斷方法,找出將殘差平方最小化的直線.19ebScatterPlotYvs.XwithFittedLineY=a+bX直線的方程式是

Y=a+bXa是常數(shù),b是斜率.“擬合線”是包括實(shí)際點(diǎn)和直線的平方差的和最小化后形成的直線.實(shí)際資料的點(diǎn)和直線的差異稱為殘差(residuals(e)).擬合線,回歸方程式構(gòu)造ebScatterPlotYvs.XwithFit201.回歸模型的參數(shù)確定y=a+bx由歷史數(shù)據(jù)得一組x、y值,可求出參數(shù)a、b由最小二乘法得:1.回歸模型的參數(shù)確定y=a+bx21例某企業(yè)年投入資本(十萬元)x與銷售量(萬臺)y的歷史數(shù)據(jù)如下:yx101.920.912.440.46.451.27.060.37.078例某企業(yè)年投入資本(十萬元)x與銷售量(萬臺)y的歷史數(shù)據(jù)如22例yxx2xy101.93.61020.912.4153.711.140.46.440.962.5651.27.0498.460.37.0492.12.834.7296.3324.2平均0.566.9459.264.843.88648.16例yxx2xy101.93.61020.912.4153.723計算結(jié)果某企業(yè)年投入資本(十萬元)x與銷售量(萬臺)y的歷史數(shù)據(jù)如下:計算結(jié)果某企業(yè)年投入資本(十萬元)x與銷售量(萬臺)y的歷史242、用軟件進(jìn)行回歸分析的運(yùn)算(1)一元回歸模型的軟件運(yùn)算a.圖象分析b.回歸運(yùn)算2、用軟件進(jìn)行回歸分析的運(yùn)算(1)一元回歸模型的軟件運(yùn)算25二、二元回歸模型的軟件運(yùn)算

運(yùn)算步驟二、二元回歸模型的軟件運(yùn)算運(yùn)算步驟261、統(tǒng)計值說明各統(tǒng)計值在計算機(jī)參數(shù)輸出中的位置:mnmn-1…m2m1bSenSen-1…Se2Se1Sebr2SeyFdfSSregSSresid1、統(tǒng)計值說明各統(tǒng)計值在計算機(jī)參數(shù)輸出中的位置:mnmn-1271、統(tǒng)計值說明(1)解釋變量、被解釋變量:y=m1x1+m2x2+b(2)系數(shù)m1,m2,...,mn——系數(shù)是解釋變量對預(yù)測值的貢獻(xiàn)解釋變量被解釋變量1、統(tǒng)計值說明(1)解釋變量、被解釋變量:解釋變量被解釋變量281、統(tǒng)計值說明(3)系數(shù)的標(biāo)準(zhǔn)誤差值Se1,Se2,...,Sen——系數(shù)m1,m2,...,mn的標(biāo)準(zhǔn)誤差值。sqrt(∑(Y-Y’)^2/(N-2))/sqrt(∑(X-x)^2)其中,X為自變量,Y為因變量觀測值,Y‘為線形擬合值,X平均值計為x

——真值在系數(shù)估值正負(fù)1倍的標(biāo)準(zhǔn)差區(qū)間概率是2/3Seb——常數(shù)項b的標(biāo)準(zhǔn)誤差值1、統(tǒng)計值說明(3)系數(shù)的標(biāo)準(zhǔn)誤差值291、統(tǒng)計值說明(4)判定系數(shù)——r2——Y的估計值與實(shí)際值之比范圍在0到1之間。如果為1,則樣本有很好的相關(guān)性,Y的估計值與實(shí)際值之間沒有差別。而在另一方面,如果判定系數(shù)為0,則回歸方程不能用來預(yù)測Y值。1、統(tǒng)計值說明(4)判定系數(shù)——r2301、統(tǒng)計值說明(5)Y估計值的標(biāo)準(zhǔn)誤差——Sey——真值在Y估值正負(fù)1的標(biāo)準(zhǔn)差區(qū)間概率是2/3(6)F統(tǒng)計值或F觀察值——F使用F統(tǒng)計可以判斷因變量和自變量之間是否偶爾發(fā)生過觀察到的關(guān)系。(7)置信度——df用于在統(tǒng)計表上查找F臨界值。所查得的值和函數(shù)LINEST返回的F統(tǒng)計值的比值可用來判斷模型的置信度。1、統(tǒng)計值說明(5)Y估計值的標(biāo)準(zhǔn)誤差——Sey311、統(tǒng)計值說明(8)回歸平方和SSreg(9)殘差平方和SSresid1、統(tǒng)計值說明(8)回歸平方和SSreg32作業(yè)4某企業(yè)的資金投入X與銷售收入Y如下表:試用一元回歸方法求出回歸線,說明兩者的相關(guān)關(guān)系并對X=57萬元企業(yè)銷售額進(jìn)行預(yù)測。X(萬元)Y(萬元)110130218180323200435250542310作業(yè)4某企業(yè)的資金投入X與銷售收入Y如下表:試用一元回歸方法33例2某市國內(nèi)生產(chǎn)總值y與固定資產(chǎn)投入X1、勞動力投入X2的歷史數(shù)據(jù)如下表,試用線性回歸方法確定其參數(shù)值。序號yX1X2153911264191438221154923417512043196160562071807229例2某市國內(nèi)生產(chǎn)總值y與固定資產(chǎn)投入X1、勞動力投34例2-2.087972.65182248.34758Y=2.65X1-2.09X2+48.35預(yù)測:x1=82,X2=35y=?Y=192.71例2-2.0879735作業(yè)2000年某企業(yè)產(chǎn)品銷售量Y與企業(yè)銷售投入量X1、銷售點(diǎn)增加量X2歷史數(shù)據(jù)如下表,試用回歸方法求其參數(shù)值。說明兩者的相關(guān)關(guān)系并對(X1=140,X2=41)的Y值進(jìn)行預(yù)測。作業(yè)2000年某企業(yè)產(chǎn)品銷售量Y與企業(yè)銷售投入量X1、銷售點(diǎn)36作業(yè)序號YX1X2142205262237383509480701259977156120891871609920819011030923012031作業(yè)序號YX1X214220526223738350948037三、參數(shù)估計(一)含義參數(shù)估計是從樣本的統(tǒng)計值來估計總體的參數(shù)值,其邏輯程序是先有樣本分布,再推測總體。當(dāng)樣本對總體參數(shù)進(jìn)行估計時,有兩種估計方法:點(diǎn)估計(poimestimation)與區(qū)間估計(intervalestimation)。1、點(diǎn)估計點(diǎn)估計是將樣本中某統(tǒng)計量的值作為相應(yīng)總體參數(shù)值的單一估計。

三、參數(shù)估計(一)含義38例:想了解某種新產(chǎn)品在各省會城市的銷售量,我們可抽去一些省會城市調(diào)查其銷售量,然后求其平均值,即為平均銷售量估計。當(dāng)然,如果另外抽取幾個城市,就會發(fā)現(xiàn)其平均銷售量不完全一致,這說明點(diǎn)估計值本身就是一個隨機(jī)變量。例:想了解某種新產(chǎn)品在各省會城市的銷售量392、區(qū)間估計

區(qū)間估計不是采用通常度量準(zhǔn)確性的方法,如允許估計值與真實(shí)值有百分之幾的誤差,而要判斷真實(shí)值有多大可能落在樣本統(tǒng)計值分布的某一范圍、(置饋區(qū)間)之內(nèi)。這一范圍越大,估計值的準(zhǔn)確性就越低。統(tǒng)計值落在允許偏差的范圍的概率越大,故計值的可靠性就越高。一般來說,在管理研究中,置信水平選擇95%或99%,即O.95或0.99的概率,真實(shí)值落在偏差范圍之內(nèi),允許不超過0.05或O.01的概率超出此范圍。2、區(qū)間估計區(qū)間估計不是采用通常度量準(zhǔn)40四、假設(shè)檢驗(yàn)(一)含義

假設(shè)檢驗(yàn)是先對總體參數(shù)作出假設(shè),然后從樣本統(tǒng)計值去檢驗(yàn)它是否與假設(shè)參數(shù)值一致。四、假設(shè)檢驗(yàn)(一)含義41(二)假設(shè)檢驗(yàn)中兩類錯誤在假設(shè)檢驗(yàn)中存在兩類錯誤:樣本是隨機(jī)抽取的,但也有意外,例如樣本沒有反映典型特征。當(dāng)我們錯誤地將偶然發(fā)生的事件當(dāng)作非偶然發(fā)生的,進(jìn)而錯誤地將虛無假設(shè)否定,則就犯了第一類錯誤;如果將原本錯誤的事件認(rèn)為是正確的,沒有否定本該否定的虛無假設(shè),則就犯了第二類錯誤。(二)假設(shè)檢驗(yàn)中兩類錯誤在假設(shè)檢驗(yàn)中存在兩類錯誤:樣本是隨機(jī)42(三)t檢驗(yàn)(t-test)是檢驗(yàn)定距或定類變量的相關(guān)性,即在定距或定類尺度上,兩群體之間是否存在差異。T檢驗(yàn)是未知正態(tài)總體X的方差,對數(shù)學(xué)期望μ作假設(shè)檢驗(yàn);檢驗(yàn)是未知正態(tài)總體X的數(shù)學(xué)期望μ,對方差作假設(shè)檢驗(yàn)。

(三)t檢驗(yàn)(t-test)是檢驗(yàn)定距或定類變量的相關(guān)性,即43例:

有MBA資格的人員是否比企業(yè)管理專業(yè)的本科畢業(yè)生表現(xiàn)要好?男性與女性對激勵的反映是否相同?此類問題可通過t檢驗(yàn)來分析研究變量中不同群體的平均數(shù)是否有顯著差異,亦即針對具有兩個子類別的定類變量(男性與女性、MBA與本科生)進(jìn)行檢驗(yàn),看這兩個群體在定距或定比尺度上(反映程度、表現(xiàn)程度等)的平均數(shù)是否存在顯著差異。例:有MBA資格的人員是否比企業(yè)管理專業(yè)的本44T檢驗(yàn)方法選擇分析平均值比較獨(dú)立樣本t檢驗(yàn)選擇分組變量選擇置信水平選擇置信水平輸出結(jié)果T檢驗(yàn)方法選擇分析平均值比較獨(dú)立樣本t檢驗(yàn)選擇分組變量選擇置45(四)方差分析1、含義:方差分析(ANOVA)是檢驗(yàn)因變量是定距或定比尺度時,兩個以上群體之間的平均的顯著差異。(四)方差分析1、含義:46例:4組促銷人員之間是否存在顯著差異:一組被送到學(xué)校系統(tǒng)學(xué)習(xí)營銷課程;一組通過實(shí)地考察在職訓(xùn)練,一組由經(jīng)驗(yàn)豐富的銷售經(jīng)理進(jìn)行指導(dǎo),一組沒有接受上述訓(xùn)練。利用方差分析來確定不同群體之間是否存在顯著差異可通過F統(tǒng)計量獲得。例:4組促銷人員之間是否存在顯著差異:一472、具體方法選擇分析平均值比較單因素方差分析選擇兩變量輸出結(jié)果2、具體方法選擇分析平均值比較單因素方差分析選擇兩變量輸出結(jié)48(五)χ2檢驗(yàn)1、含義

χ2檢驗(yàn)(chi:squaretest)是用于檢驗(yàn)兩個定類變量發(fā)生頻次之間是否存在差異。(五)χ2檢驗(yàn)1、含義49例:在超市隨機(jī)選擇90位顧客征求他們對三種飲料的偏好,如果40位選擇甲,30位選擇乙,20位選擇丙,即觀測頻次為(40,30,20),如果虛無假設(shè)(三種飲料的顧客偏好不存在差異)成立,其期望頻次應(yīng)為(30,30,30),x檢驗(yàn)就是要判斷觀測頻次(40,30,20)與期望頻次(30,30,30)之間的差異是否顯著。例:在超市隨機(jī)選擇90位顧客征求他們對三種飲502、方法選擇分析描述統(tǒng)計建立交叉表統(tǒng)計選擇χ2輸出結(jié)果2、方法選擇分析描述統(tǒng)計建立交叉表統(tǒng)計選擇χ2輸出結(jié)果51第四節(jié)統(tǒng)計分析中的常見錯誤一、樣本平均值當(dāng)作母體平均值對待

樣本平均值當(dāng)作母體平均值對待,不做顯著性檢驗(yàn),是常見錯誤之一第四節(jié)統(tǒng)計分析中的常見錯誤一、樣本平均值當(dāng)作母體平均值對待52例:在營銷研究中針對某產(chǎn)品設(shè)計了兩種郵購廣告,分別用隨機(jī)抽樣的方法對居民郵寄廣告,甲廣告寄出200份,有44位居民訂購了相應(yīng)的產(chǎn)品,乙廣告寄出400,有1oo位居民訂購了該產(chǎn)品。此時很容易算出,甲廣告的訂購率為22%,己廣告的訂購率是25%。我們是否可以依此就得出結(jié)論:乙廣告設(shè)計比甲廣告設(shè)計的好(乙廣告的訂購率高于甲廣告)?

常見的錯誤就是直接依據(jù)兩組樣本的比例值(甲廣告的訂購率為22%,乙廣告的訂購率是25%)來做結(jié)論,認(rèn)為乙廣告優(yōu)于甲廣告(乙廣告的訂購率高于甲廠告)。例:在營銷研究中針對某產(chǎn)品設(shè)計了兩種郵購53結(jié)論:事實(shí)上,乙廣告未必優(yōu)于甲廣告,因?yàn)閮蓚€比例值是分別基于200個樣本和400個樣本得出的。如果繼續(xù)擴(kuò)大樣本容量,甲乙兩個廣告的訂購率就可能發(fā)生變化。我們要做的事情,就是依據(jù)這兩組樣本數(shù)據(jù)(甲組200個,乙組400個)來推斷甲乙兩種廣告設(shè)計的優(yōu)劣。這是顯著性的檢驗(yàn)的問題。顯著性檢驗(yàn)的結(jié)果是,不能認(rèn)為兩者具有顯著性差異。結(jié)論:事實(shí)上,乙廣告未必優(yōu)于甲廣告,因?yàn)?4二、做相關(guān)分析時不做顯著性檢驗(yàn)做相關(guān)分析時不做顯著性檢驗(yàn),用簡單相關(guān)分析替代偏相關(guān)分析,是又一常見錯誤。偏相關(guān)表示在消除其他變量的影響之后,自變量與因變量之間的關(guān)聯(lián)程度。二、做相關(guān)分析時不做顯著性檢驗(yàn)做相關(guān)分析時不做顯著性檢驗(yàn),55例:分析工人的勞動生產(chǎn)率與文化水平之間的關(guān)聯(lián)時,要受到年齡因素的影響。偏相關(guān)分析首先用一元回歸分析年齡與文化水平之間的關(guān)系,回歸方程的殘差(多項說明不能由文化水平來解釋年齡的偏差;然后求勞動生產(chǎn)率與年齡之間的回歸方程及殘差,反映不能由年齡來解釋勞動生產(chǎn)率的偏差;最后第三個回歸方程來分析第一、第二個回歸方程殘差之間的關(guān)聯(lián),它表示消除年齡對其他兩個變量的影響后文化水平與勞動生產(chǎn)率之間的關(guān)聯(lián),由此算出相關(guān)系數(shù)即為偏相關(guān)系數(shù)。同樣,偏相關(guān)系數(shù)的計算公式無需記憶,多數(shù)統(tǒng)計軟件都可以輸出該系數(shù)值。例:分析工人的勞動生產(chǎn)率與文化水平之間56結(jié)論:偏相關(guān)系數(shù)與簡單相關(guān)系數(shù)在意義上是不同的,簡單相關(guān)系數(shù)將其他因素作為剩余因素,任其變化而忽略不計。偏相關(guān)系數(shù)是在其他變量的關(guān)系保持不變的情況下,分析與另一變量之間的關(guān)系。值得注意的是,偏相關(guān)系數(shù)可以表示兩變量之間的關(guān)聯(lián)強(qiáng)度,但不能反映二者之間變化的定量關(guān)系結(jié)論:偏相關(guān)系數(shù)與簡單相關(guān)系數(shù)在意義上是不57三、在獲得數(shù)據(jù)之后,沒有能力與知識、運(yùn)用恰當(dāng)?shù)慕y(tǒng)計方法,引出科學(xué)的結(jié)論(一)引出科學(xué)結(jié)論的基本方法:(1)對對象系所處狀況的統(tǒng)計,如收入的均值、方差,各種態(tài)度的百分比,某個特征量的分布等;(2)兩組人群的某特征量的均值的比較,檢驗(yàn)有無顯著性差異,如培訓(xùn)前后業(yè)務(wù)水平、兩種激勵政策的效果差異、兩種管理方法的效果有無顯著差異。進(jìn)一步檢驗(yàn)兩個隨機(jī)變量構(gòu)分布是否相同。三、在獲得數(shù)據(jù)之后,沒有能力與知識、運(yùn)用恰當(dāng)?shù)慕y(tǒng)計方法,引出58

(3)方差分析,用以解決多組的平均值有無顯著性差異,找出哪些因素有交叉作用;還可以從多個因素中(每個因素有多個水平),找出對效果有顯著作用的因素,俗稱找出關(guān)鍵原因。(4)相關(guān)研究用于研究變量之間是否存在相關(guān)關(guān)系,包括簡單相關(guān)關(guān)系、等級相關(guān)關(guān)系、品質(zhì)相關(guān)關(guān)系(如抽煙與癌癥的相關(guān)關(guān)系、包裝偏愛與文化程度的相關(guān)關(guān)系等),及偏相關(guān)關(guān)系(即兩個變量之間的“純”相關(guān)關(guān)系)。(3)方差分析,用以解決多組的平均值有無顯著性差59回歸模型是用統(tǒng)計分析方法建立的最常用的一類模型數(shù)學(xué)建模的基本方法機(jī)理分析測試分析通過對數(shù)據(jù)的統(tǒng)計分析,找出與數(shù)據(jù)擬合最好的模型不涉及回歸分析的數(shù)學(xué)原理和方法通過實(shí)例討論如何選擇不同類型的模型對軟件得到的結(jié)果進(jìn)行分析,對模型進(jìn)行改進(jìn)由于客觀事物內(nèi)部規(guī)律的復(fù)雜及人們認(rèn)識程度的限制,無法分析實(shí)際對象內(nèi)在的因果關(guān)系,建立合乎機(jī)理規(guī)律的數(shù)學(xué)模型?;貧w模型是用統(tǒng)計分析方法建立的最常用的一類模型數(shù)學(xué)建模的基6010.1牙膏的銷售量

問題建立牙膏銷售量與價格、廣告投入之間的模型預(yù)測在不同價格和廣告費(fèi)用下的牙膏銷售量收集了30個銷售周期本公司牙膏銷售量、價格、廣告費(fèi)用,及同期其它廠家同類牙膏的平均售價9.260.556.804.253.70307.930.055.803.853.80298.510.256.754.003.7527.38-0.055.503.803.851銷售量(百萬支)價格差(元)廣告費(fèi)用(百萬元)其它廠家價格(元)本公司價格(元)銷售周期10.1牙膏的銷售量問題建立牙膏銷售量與價格、廣告投入61基本模型y~公司牙膏銷售量x1~其它廠家與本公司價格差x2~公司廣告費(fèi)用x2yx1yx1,x2~解釋變量(回歸變量,自變量)y~被解釋變量(因變量)0,1

,2,3~回歸系數(shù)~隨機(jī)誤差(均值為零的正態(tài)分布隨機(jī)變量)基本模型y~公司牙膏銷售量x1~其它廠家與本公司價格差x262MATLAB統(tǒng)計工具箱

模型求解[b,bint,r,rint,stats]=regress(y,x,alpha)

輸入

x=~n4數(shù)據(jù)矩陣,第1列為全1向量alpha(置信水平,0.05)

b~的估計值bint~b的置信區(qū)間r~殘差向量y-xb

rint~r的置信區(qū)間Stats~檢驗(yàn)統(tǒng)計量

R2,F,p

y~n維數(shù)據(jù)向量輸出

由數(shù)據(jù)y,x1,x2估計參數(shù)參數(shù)估計值置信區(qū)間17.3244[5.728228.9206]1.3070[0.68291.9311]-3.6956[-7.49890.1077]0.3486[0.03790.6594]R2=0.9054F=82.9409p=0.00000123MATLAB統(tǒng)計工具箱模型求解[b,bint,r,rin63結(jié)果分析y的90.54%可由模型確定參數(shù)參數(shù)估計值置信區(qū)間17.3244[5.728228.9206]1.3070[0.68291.9311]-3.6956[-7.49890.1077]0.3486[0.03790.6594]R2=0.9054F=82.9409p=0.00000123F遠(yuǎn)超過F檢驗(yàn)的臨界值p遠(yuǎn)小于=0.05

2的置信區(qū)間包含零點(diǎn)(右端點(diǎn)距零點(diǎn)很近)x2對因變量y的影響不太顯著x22項顯著可將x2保留在模型中模型從整體上看成立結(jié)果分析y的90.54%可由模型確定參數(shù)參數(shù)估計值置信區(qū)間64銷售量預(yù)測價格差x1=其它廠家價格x3-本公司價格x4估計x3調(diào)整x4控制價格差x1=0.2元,投入廣告費(fèi)x2=650萬元銷售量預(yù)測區(qū)間為[7.8230,8.7636](置信度95%)上限用作庫存管理的目標(biāo)值下限用來把握公司的現(xiàn)金流若估計x3=3.9,設(shè)定x4=3.7,則可以95%的把握知道銷售額在7.83203.729(百萬元)以上控制x1通過x1,x2預(yù)測y(百萬支)銷售量預(yù)測價格差x1=其它廠家價格x3-本公司價格x4估計65模型改進(jìn)x1和x2對y的影響?yīng)毩?/p>

參數(shù)參數(shù)估計值置信區(qū)間17.3244[5.728228.9206]1.3070[0.68291.9311]-3.6956[-7.49890.1077]0.3486[0.03790.6594]R2=0.9054F=82.9409p=0.00000123參數(shù)參數(shù)估計值置信區(qū)間29.1133[13.701344.5252]11.1342[1.977820.2906]-7.6080[-12.6932-2.5228]0.6712[0.25381.0887]-1.4777[-2.8518-0.1037]R2=0.9209F=72.7771p=0.000030124x1和x2對y的影響有交互作用模型改進(jìn)x1和x2對y的影響?yīng)毩?shù)參數(shù)估計值置信區(qū)間1766兩模型銷售量預(yù)測比較(百萬支)區(qū)間[7.8230,8.7636]區(qū)間[7.8953,8.7592](百萬支)控制價格差x1=0.2元,投入廣告費(fèi)x2=6.5百萬元預(yù)測區(qū)間長度更短略有增加兩模型銷售量預(yù)測比較(百萬支)區(qū)間[7.8230,8.7667x2=6.5x1=0.2x1x1x2x2兩模型與x1,x2關(guān)系的比較x2=6.5x1=0.2x1x1x2x2兩模型與x168交互作用影響的討論價格差x1=0.1價格差x1=0.3加大廣告投入使銷售量增加(x2大于6百萬元)價格差較小時增加的速率更大x2價格優(yōu)勢會使銷售量增加價格差較小時更需要靠廣告來吸引顧客的眼球交互作用影響的討論價格差x1=0.1價格差x1=0.369完全二次多項式模型MATLAB中有命令rstool直接求解x1x2從輸出Export可得完全二次多項式模型MATLAB中有命令rstool直接求解7010.2軟件開發(fā)人員的薪金資歷~從事專業(yè)工作的年數(shù);管理~1=管理人員,0=非管理人員;教育~

1=中學(xué),2=大學(xué),3=更高程度建立模型研究薪金與資歷、管理責(zé)任、教育程度的關(guān)系分析人事策略的合理性,作為新聘用人員薪金的參考

編號薪金資歷管理教育0113876111021160810303187011130411283102編號薪金資歷管理教育422783716124318838160244174831601451920717024619346200146名軟件開發(fā)人員的檔案資料

10.2軟件開發(fā)人員的薪金資歷~從事專業(yè)工作的年數(shù)71分析與假設(shè)y~薪金,x1~資歷(年)x2=

1~管理人員,x2=

0~非管理人員1=中學(xué)2=大學(xué)3=更高資歷每加一年薪金的增長是常數(shù);管理、教育、資歷之間無交互作用

教育線性回歸模型a0,a1,…,a4是待估計的回歸系數(shù),是隨機(jī)誤差中學(xué):x3=1,x4=0;大學(xué):x3=0,x4=1;更高:x3=0,x4=0分析與假設(shè)y~薪金,x1~資歷(年)x2=1~管72模型求解參數(shù)參數(shù)估計值置信區(qū)間a011032[1025811807]a1546[484608]a26883[62487517]a3-2994[-3826-2162]a4148[-636931]R2=0.957F=226p=0.000R2,F,p模型整體上可用資歷增加1年薪金增長546管理人員薪金多6883中學(xué)程度薪金比更高的少2994大學(xué)程度薪金比更高的多148a4置信區(qū)間包含零點(diǎn),解釋不可靠!中學(xué):x3=1,x4=0;大學(xué):x3=0,x4=1;更高:x3=0,x4=0.x2=

1~管理,x2=

0~非管理x1~資歷(年)模型求解參數(shù)參數(shù)估計值置信區(qū)間a011032[1025873殘差分析方法

結(jié)果分析殘差e與資歷x1的關(guān)系

e與管理—教育組合的關(guān)系

殘差全為正,或全為負(fù),管理—教育組合處理不當(dāng)

殘差大概分成3個水平,6種管理—教育組合混在一起,未正確反映。應(yīng)在模型中增加管理x2與教育x3,x4的交互項

組合123456管理010101教育112233管理與教育的組合殘差分析方法結(jié)果分析殘差e與資歷x1的關(guān)系e與管理—教74進(jìn)一步的模型增加管理x2與教育x3,x4的交互項參數(shù)參數(shù)估計值置信區(qū)間a011204[1104411363]a1497[486508]a27048[68417255]a3-1727[-1939-1514]a4-348[-545–152]a5-3071[-3372-2769]a61836[15712101]R2=0.999F=554p=0.000R2,F有改進(jìn),所有回歸系數(shù)置信區(qū)間都不含零點(diǎn),模型完全可用

消除了不正常現(xiàn)象

異常數(shù)據(jù)(33號)應(yīng)去掉

e~x1

e~組合進(jìn)一步的模型增加管理x2與教育x3,x4的交互項參數(shù)參數(shù)估75去掉異常數(shù)據(jù)后的結(jié)果參數(shù)參數(shù)估計值置信區(qū)間a011200[1113911261]a1498[494503]a27041[69627120]a3-1737[-1818-1656]a4-356[-431–281]a5-3056[-3171–2942]a61997[18942100]R2=0.9998F=36701p=0.0000e~x1

e~組合R2:0.9570.9990.9998F:226

55436701置信區(qū)間長度更短殘差圖十分正常最終模型的結(jié)果可以應(yīng)用去掉異常數(shù)據(jù)后的結(jié)果參數(shù)參數(shù)估計值置信區(qū)間a011200[176模型應(yīng)用

制訂6種管理—教育組合人員的“基礎(chǔ)”薪金(資歷為0)組合管理教育系數(shù)“基礎(chǔ)”薪金101a0+a39463211a0+a2+a3+a513448302a0+a410844412a0+a2+a4+a619882503a011200613a0+a218241中學(xué):x3=1,x4=0;大學(xué):x3=0,x4=1;更高:x3=0,x4=0x1=

0;x2=

1~管理,x2=

0~非管理大學(xué)程度管理人員比更高程度管理人員的薪金高

大學(xué)程度非管理人員比更高程度非管理人員的薪金略低

模型應(yīng)用制訂6種管理—教育組合人員的“基礎(chǔ)”薪金(資歷為077對定性因素(如管理、教育),可以引入0-1變量處理,0-1變量的個數(shù)應(yīng)比定性因素的水平少1軟件開發(fā)人員的薪金殘差分析方法可以發(fā)現(xiàn)模型的缺陷,引入交互作用項常常能夠改善模型

剔除異常數(shù)據(jù),有助于得到更好的結(jié)果注:可以直接對6種管理—教育組合引入5個0-1變量

對定性因素(如管理、教育),可以引入0-1變量處理,0-1變7810.3酶促反應(yīng)

問題研究酶促反應(yīng)(酶催化反應(yīng))中嘌呤霉素對反應(yīng)速度與底物(反應(yīng)物)濃度之間關(guān)系的影響

建立數(shù)學(xué)模型,反映該酶促反應(yīng)的速度與底物濃度以及經(jīng)嘌呤霉素處理與否之間的關(guān)系

設(shè)計了兩個實(shí)驗(yàn):酶經(jīng)過嘌呤霉素處理;酶未經(jīng)嘌呤霉素處理。實(shí)驗(yàn)數(shù)據(jù)見下表:

方案底物濃度(ppm)0.020.060.110.220.561.10反應(yīng)速度處理764797107123139159152191201207200未處理6751848698115131124144158160/10.3酶促反應(yīng)問題研究酶促反應(yīng)(酶催化反應(yīng))中嘌呤霉79線性化模型

經(jīng)嘌呤霉素處理后實(shí)驗(yàn)數(shù)據(jù)的估計結(jié)果

參數(shù)參數(shù)估計值(×10-3)置信區(qū)間(×10-3)15.107[3.5396.676]20.247[0.1760.319]R2=0.8557F=59.2975p=0.0000對1

,2非線性

對1,2線性

線性化模型經(jīng)嘌呤霉素處理后實(shí)驗(yàn)數(shù)據(jù)的估計結(jié)果參數(shù)參數(shù)估計80線性化模型結(jié)果分析

x較大時,y有較大偏差1/x較小時有很好的線性趨勢,1/x較大時出現(xiàn)很大的起落

參數(shù)估計時,x較?。?/x很大)的數(shù)據(jù)控制了回歸參數(shù)的確定

1/y1/xxy線性化模型結(jié)果分析x較大時,y有較大偏差1/x較小時有81[beta,R,J]=nlinfit(x,y,’model’,beta0)beta的置信區(qū)間MATLAB統(tǒng)計工具箱

輸入

x~自變量數(shù)據(jù)矩陣y~因變量數(shù)據(jù)向量beta~參數(shù)的估計值R~殘差,J~估計預(yù)測誤差的Jacobi矩陣

model~模型的函數(shù)M文件名beta0~給定的參數(shù)初值

輸出

betaci=nlparci(beta,R,J)非線性模型參數(shù)估計functiony=f1(beta,x)y=beta(1)*x./(beta(2)+x);x=;y=;beta0=[195.80270.04841];[beta,R,J]=nlinfit(x,y,’f1’,beta0);betaci=nlparci(beta,R,J);beta,betacibeta0~線性化模型估計結(jié)果[beta,R,J]=nlinfit(x,y,’mod82非線性模型結(jié)果分析參數(shù)參數(shù)估計值置信區(qū)間1212.6819[197.2029228.1609]20.0641[0.04570.0826]畫面左下方的Export輸出其它統(tǒng)計結(jié)果。拖動畫面的十字線,得y的預(yù)測值和預(yù)測區(qū)間剩余標(biāo)準(zhǔn)差s=10.9337最終反應(yīng)速度為半速度點(diǎn)(達(dá)到最終速度一半時的x值)為其它輸出命令nlintool給出交互畫面o~原始數(shù)據(jù)+~擬合結(jié)果

非線性模型結(jié)果分析參數(shù)參數(shù)估計值置信區(qū)間1212.681983混合反應(yīng)模型

x1為底物濃度,x2為一示性變量

x2=1表示經(jīng)過處理,x2=0表示未經(jīng)處理

β1是未經(jīng)處理的最終反應(yīng)速度

γ1是經(jīng)處理后最終反應(yīng)速度的增長值

β2是未經(jīng)處理的反應(yīng)的半速度點(diǎn)

γ2是經(jīng)處理后反應(yīng)的半速度點(diǎn)的增長值在同一模型中考慮嘌呤霉素處理的影響混合反應(yīng)模型x1為底物濃度,x2為一示性變量在84o~原始數(shù)據(jù)+~擬合結(jié)果混合模型求解用nlinfit和nlintool命令估計結(jié)果和預(yù)測剩余標(biāo)準(zhǔn)差s=10.4000

參數(shù)參數(shù)估計值置信區(qū)間1160.2802[145.8466174.7137]20.0477[0.03040.0650]152.4035[32.413072.3941]20.0164[-0.00750.0403]2置信區(qū)間包含零點(diǎn),表明2對因變量y的影響不顯著參數(shù)初值(基于對數(shù)據(jù)的分析)經(jīng)嘌呤霉素處理的作用不影響半速度點(diǎn)參數(shù)未經(jīng)處理經(jīng)處理o~原始數(shù)據(jù)混合模型求解用nlinfit和nlinto85o~原始數(shù)據(jù)+~擬合結(jié)果未經(jīng)處理經(jīng)處理簡化的混合模型

簡化的混合模型形式簡單,參數(shù)置信區(qū)間不含零點(diǎn)剩余標(biāo)準(zhǔn)差s=10.5851,比一般混合模型略大估計結(jié)果和預(yù)測參數(shù)參數(shù)估計值置信區(qū)間1166.6025[154.4886178.7164]20.0580[0.04560.0703]142.0252[28.941955.1085]o~原始數(shù)據(jù)未經(jīng)處理經(jīng)處理簡化的混合模型簡化的混合模型形86一般混合模型與簡化混合模型預(yù)測比較實(shí)際值一般模型預(yù)測值Δ(一般模型)簡化模型預(yù)測值Δ(簡化模型)6747.34439.207842.73585.44465147.34439.207842.73585.44468489.28569.571084.73567.0478……………191190.83299.1484189.05748.8438201190.83299.1484189.05748.8438207200.968811.0447198.183710.1812200200.968811.0447198.183710.1812簡化混合模型的預(yù)測區(qū)間較短,更為實(shí)用、有效預(yù)測區(qū)間為預(yù)測值Δ一般混合模型與簡化混合模型預(yù)測比較實(shí)際值一般模型預(yù)測值Δ(一87注:非線性模型擬合程度的評價無法直接利用線性模型的方法,但R2與s仍然有效。酶促反應(yīng)

反應(yīng)速度與底物濃度的關(guān)系非線性關(guān)系求解線性模型

求解非線性模型機(jī)理分析嘌呤霉素處理對反應(yīng)速度與底物濃度關(guān)系的影響混合模型

發(fā)現(xiàn)問題,得參數(shù)初值引入0-1變量簡化模型

檢查參數(shù)置信區(qū)間是否包含零點(diǎn)注:非線性模型擬合程度的評價無法直接利用線性模型的方法,但R8810.4投資額與國民生產(chǎn)總值和物價指數(shù)

問題建立投資額模型,研究某地區(qū)實(shí)際投資額與國民生產(chǎn)總值(GNP)及物價指數(shù)(

PI

)的關(guān)系2.06883073.0424.5201.00001185.9195.0101.95142954.7474.9190.96011077.6166.491.78422631.7401.9180.9145992.7144.281.63422417.8423.0170.8679944.0149.371.50422163.9386.6160.8254873.4133.361.40051918.3324.1150.7906799.0122.851.32341718.0257.9140.7676756.0125.741.25791549.2206.1130.7436691.1113.531.15081434.2228.7120.7277637.797.421.05751326.4229.8110.7167596.790.91物價指數(shù)國民生產(chǎn)總值投資額年份序號物價指數(shù)國民生產(chǎn)總值投資額年份序號根據(jù)對未來GNP及PI的估計,預(yù)測未來投資額

該地區(qū)連續(xù)20年的統(tǒng)計數(shù)據(jù)

10.4投資額與國民生產(chǎn)總值和物價指數(shù)問題建立投資額89時間序列中同一變量的順序觀測值之間存在自相關(guān)以時間為序的數(shù)據(jù),稱為時間序列

分析許多經(jīng)濟(jì)數(shù)據(jù)在時間上有一定的滯后性

需要診斷并消除數(shù)據(jù)的自相關(guān)性,建立新的模型若采用普通回歸模型直接處理,將會出現(xiàn)不良后果

投資額與國民生產(chǎn)總值和物價指數(shù)

……………………1.32341718.0257.9140.7676756.0125.741.25791549.2206.1130.7436691.1113.531.15081434.2228.7120.7277637.797.421.05751326.4229.8110.7167596.790.91物價指數(shù)國民生產(chǎn)總值投資額年份序號物價指數(shù)國民生產(chǎn)總值投資額年份序號時間序列中同一變量的順序觀測值之間存在自相關(guān)以時間為序的數(shù)據(jù)90基本回歸模型投資額與GNP及物價指數(shù)間均有很強(qiáng)的線性關(guān)系t~年份,yt~投資額,x1t~GNP,x2t~物價指數(shù)0,1,2~回歸系數(shù)x1tytx2tytt~對t相互獨(dú)立的零均值正態(tài)隨機(jī)變量基本回歸模型投資額與GNP及物價指數(shù)間均有很強(qiáng)的線性關(guān)系t91基本回歸模型的結(jié)果與分析

MATLAB統(tǒng)計工具箱

參數(shù)參數(shù)估計值置信區(qū)間0322.7250[224.3386421.1114]10.6185[0.47730.7596]2-859.4790[-1121.4757-597.4823]R2=0.9908F=919.8529p=0.0000剩余標(biāo)準(zhǔn)差s=12.7164沒有考慮時間序列數(shù)據(jù)的滯后性影響R2=0.9908,擬合度高模型優(yōu)點(diǎn)模型缺點(diǎn)可能忽視了隨機(jī)誤差存在自相關(guān);如果存在自相關(guān)性,用此模型會有不良后果基本回歸模型的結(jié)果與分析MATLAB統(tǒng)計工具箱參數(shù)參數(shù)92自相關(guān)性的定性診斷

殘差診斷法模型殘差作殘差et~et-1散點(diǎn)圖大部分點(diǎn)落在第1,3象限t

存在正的自相關(guān)大部分點(diǎn)落在第2,4象限自相關(guān)性直觀判斷在MATLAB工作區(qū)中輸出et為隨機(jī)誤差t的估計值et-1ett

存在負(fù)的自相關(guān)基本回歸模型的隨機(jī)誤差項t

存在正的自相關(guān)自相關(guān)性的定性診斷殘差診斷法模型殘差作殘差et~et-193自回歸性的定量診斷自回歸模型ρ~自相關(guān)系數(shù)0,1,2~回歸系數(shù)ρ=

0無自相關(guān)性ρ>

0ρ<

0如何估計ρ

如何消除自相關(guān)性D-W統(tǒng)計量D-W檢驗(yàn)

ut~對t相互獨(dú)立的零均值正態(tài)隨機(jī)變量存在負(fù)自相關(guān)性存在正自相關(guān)性廣義差分法

自回歸性的定量診斷自回歸模型ρ~自相關(guān)系數(shù)0,1,94D-W統(tǒng)計量與D-W檢驗(yàn)

檢驗(yàn)水平,樣本容量,回歸變量數(shù)目D-W分布表n較大DW4-dU44-dLdUdL20正自相關(guān)負(fù)自相關(guān)不能確定不能確定無自相關(guān)檢驗(yàn)臨界值dL和dU由DW值的大小確定自相關(guān)性D-W統(tǒng)計量與D-W檢驗(yàn)檢驗(yàn)水平,樣本容量,回歸變量數(shù)目D95廣義差分變換

以*0,1

,2

為回歸系數(shù)的普通回歸模型原模型DW值D-W檢驗(yàn)無自相關(guān)有自相關(guān)廣義差分繼續(xù)此過程原模型新模型新模型

步驟

原模型變換不能確定增加數(shù)據(jù)量;選用其它方法

廣義差分變換以*0,1,2為回歸系數(shù)的普通回96投資額新模型的建立

DWold<dL

作變換

原模型殘差et樣本容量n=20,回歸變量數(shù)目k=3,=0.05

查表臨界值dL=1.10,dU=1.54DWold=0.8754原模型有正自相關(guān)DW4-dU44-dLdUdL20正自相關(guān)負(fù)自相關(guān)不能確定不能確定無自相關(guān)投資額新模型的建立DWold<dL作變換原模型殘差97參數(shù)參數(shù)估計值置信區(qū)間*0163.4905[1265.45922005.2178]10.6990[0.57510.8247]2-1009.0333[-1235.9392-782.1274]R2=0.9772F=342.8988p=0.0000總體效果良好剩余標(biāo)準(zhǔn)差

snew=9.8277<sold=12.7164投資額新模型的建立

參數(shù)參數(shù)估計值置信區(qū)間*0163.4905[1265.4598新模型的自相關(guān)性檢驗(yàn)dU<DWnew<

4-dU

新模型殘差et樣本容量n=19,回歸變量數(shù)目k=3,=0.05

查表臨界值dL=1.08,dU=1.53DWnew=1.5751新模型無自相關(guān)性DW4-dU44-dLdUdL20正自相關(guān)負(fù)自相關(guān)不能確定不能確定無自相關(guān)新模型還原為原始變量一階自回歸模型新模型的自相關(guān)性檢驗(yàn)dU<DWnew<4-dU新模型99一階自回歸模型殘差et比基本回歸模型要小新模型et~*,原模型et~+殘差圖比較新模型?t~*,新模型?t~+擬合圖比較模型結(jié)果比較基本回歸模型一階自回歸模型一階自回歸模型殘差et比基本回歸模型要小新模型et~*,100投資額預(yù)測對未來投資額yt作預(yù)測,需先估計出未來的國民生產(chǎn)總值x1t和物價指數(shù)x2t設(shè)已知t=21時,x1t=3312,x2t=2.1938一階自回歸模型2.06883073.0424.5201.95142954.7474.9191.78422631.7401.9180.7436691.1113.530.7277637.797.420.7167596.790.91物價指數(shù)國民生產(chǎn)總值投資額年份序號物價指數(shù)國民生產(chǎn)總值投資額年份序號一階自回歸模型基本回歸模型?t

較小是由于yt-1=424.5過小所致投資額預(yù)測對未來投資額yt作預(yù)測,需先估計出未來的國民生產(chǎn)101謝謝!謝謝!102 謝謝大家! 謝謝大家!103數(shù)理統(tǒng)計模型數(shù)理統(tǒng)計模型數(shù)理統(tǒng)計模型主要內(nèi)容數(shù)理統(tǒng)計模型概述描述性統(tǒng)計推論性統(tǒng)計模型統(tǒng)計模型中常見的錯誤統(tǒng)計模型建立程式舉例書籍能培養(yǎng)我們的道德情操,給我們巨大的精神力量,鼓舞我們前進(jìn)數(shù)理統(tǒng)計模型數(shù)理統(tǒng)計模型數(shù)理統(tǒng)計模型主要內(nèi)容數(shù)理統(tǒng)計模型概述104主要內(nèi)容數(shù)理統(tǒng)計模型概述描述性統(tǒng)計推論性統(tǒng)計模型統(tǒng)計模型中常見的錯誤統(tǒng)計模型建立程式舉例主要內(nèi)容數(shù)理統(tǒng)計模型概述105第一節(jié)數(shù)理統(tǒng)計模型概述一、統(tǒng)計分析概述

統(tǒng)計分析通過計算研究對象的特征的樣本平均值、方差,或者所占百分比,研究樣本特征值與母體特征值的關(guān)系,研究變量之間的關(guān)系,特別是因果關(guān)系,從而發(fā)現(xiàn)被研究對象的發(fā)展規(guī)律,或者驗(yàn)證有關(guān)假想、結(jié)論是否成立,驗(yàn)證有關(guān)理論在新的時空中是否成立。進(jìn)而可以針對深層原因,引出改變客觀世界的策略。第一節(jié)數(shù)理統(tǒng)計模型概述一、統(tǒng)計分析概述106二、統(tǒng)計的兩種功能描述與推理描述性統(tǒng)計(descriptivestatistics)描述性統(tǒng)計是概括所取得數(shù)據(jù)的共有性質(zhì)。推論性統(tǒng)計(inferentialstatistics)。推論性統(tǒng)計幫助研究人員對數(shù)據(jù)做出判斷。二、統(tǒng)計的兩種功能描述與推理107三、管理研究中統(tǒng)計分析的功能統(tǒng)計分析的方法可以為管理研究提供一種清晰精確的形式化語言;統(tǒng)計分析是進(jìn)行科學(xué)預(yù)測、探索未來的重要方法;統(tǒng)計分析技術(shù)是處理調(diào)查研究資料的必要工具。三、管理研究中統(tǒng)計分析的功能108第二節(jié)描述性統(tǒng)計模型一、集中趨勢分析(一)含義:集中量數(shù)也稱集中趨勢量數(shù),是用一個數(shù)值去代表一組數(shù)據(jù)的一般水平。常用的集中量數(shù)有平均數(shù)、中位數(shù)和眾數(shù)。平均數(shù)是所有測量數(shù)據(jù)的算術(shù)平均值,中位數(shù)是將測量數(shù)據(jù)按大小順序一分為二的變量屬性值,即位于排列順序中間位置的數(shù)值,眾數(shù)是測量數(shù)據(jù)中出現(xiàn)頻率最高的數(shù)值。第二節(jié)描述性統(tǒng)計模型一、集中趨勢分析109例有一組數(shù)據(jù)是9位工人本月的產(chǎn)量:96、96、97、99、100、101、102、104、155。則:平均數(shù)為105.5,中位數(shù)為100,眾數(shù)為96。例有一組數(shù)據(jù)是9位工人本月的產(chǎn)量:96、96、97、99、1110(二)集中趨勢分析的作用集中量數(shù)說明某一管理現(xiàn)象在一定條件下,其數(shù)量的一般水平。集中量數(shù)可以對于在不同空間的同類現(xiàn)象進(jìn)行比較。集中量數(shù)可以對一定管理現(xiàn)象在不同時間中的變化進(jìn)行比較,以說明這些現(xiàn)象的發(fā)展趨勢和規(guī)律。集中量數(shù)可以用來分析某些管理現(xiàn)象之間的依存關(guān)系。(二)集中趨勢分析的作用111二、離散趨勢分析(一)含義離散趨勢分析是反映測量數(shù)據(jù)的分散程度,其常用指標(biāo)有:極差(range)與標(biāo)準(zhǔn)差(standarddeviation)。極差是測量數(shù)據(jù)中的最大值與最小值之間的差異,由兩個極端值來決定,只適用于定距與定比數(shù)據(jù)。標(biāo)準(zhǔn)差綜合反映所有數(shù)據(jù)的分散程度,與平均數(shù)配套使用,適用于定距于定比數(shù)據(jù),其計算式為:其中,為標(biāo)準(zhǔn)差,x為樣本值,X為平均數(shù),N為樣本總數(shù)。二、離散趨勢分析(一)含義112三、頻數(shù)與頻率分析為直觀地反映一組測量數(shù)據(jù)的分布狀況,經(jīng)常用頻數(shù)與頻率分析。頻數(shù)分布描述測量值中各屬性值出現(xiàn)的次數(shù),頻率分布則是用比率的形式來表示,各屬性值除以樣本總數(shù)即可得到該屬性值的頻率。三、頻數(shù)與頻率分析為直觀地反映一組測量數(shù)113頻數(shù)分布也可轉(zhuǎn)化為可視化的表達(dá)方式,如長條圖、直方圖、餅圖。在SPSS統(tǒng)計軟件中,具體操作是:在統(tǒng)計菜單(statiatics)中單擊摘要(summarize)、頻數(shù)(frequencies),并在頻數(shù)對話框中選擇所要的圖表(charts),即可獲得這些圖表。頻數(shù)分布也可轉(zhuǎn)化為可視化的表達(dá)方式,如長條圖、直方圖、餅圖。114第三節(jié)推論性統(tǒng)計模型統(tǒng)計推斷的功能

從隨機(jī)樣本中推斷總體參數(shù)特征、以統(tǒng)計為基礎(chǔ)驗(yàn)證假設(shè)。第三節(jié)推論性統(tǒng)計模型統(tǒng)計推斷的功能115一、雙變量的回歸分析與相關(guān)分析回歸分析模型收入——X居民儲蓄量——Y一、雙變量的回歸分析與相關(guān)分析回歸分析模型收入——X116(一)回歸模型XY(一)回歸模型XY1171、回歸模型的概念強(qiáng)的正相關(guān)弱的正相關(guān)中間程度的正相關(guān)|r

|=0.936|r

|=0.560|r

|=0.3390強(qiáng)的負(fù)相關(guān)弱的負(fù)相關(guān)中間程度的負(fù)相關(guān)1、回歸模型的概念強(qiáng)的正相關(guān)弱的正相關(guān)中間程度的正相關(guān)|r118確立X與Y的關(guān)聯(lián)性回歸…尋找“Y”與“X”關(guān)系的方法什么是回歸?描述“Y”與“X”關(guān)系的數(shù)學(xué)方法-創(chuàng)建過程的“模型”?;貧w分析相關(guān)是告訴關(guān)系的程度,回歸分析是找出Y=F(X)的函數(shù)關(guān)系式回歸…尋找“Y”與“X”關(guān)系的方法回歸分析相關(guān)是告訴關(guān)系的119單純線性回歸回歸分析的階段此章的因子為一個,因子和輸出值(Y)的關(guān)系為直線關(guān)系的單純線性回歸(SimpleLinearRegression)Data收集用散點(diǎn)圖確認(rèn)關(guān)系用最小二乘法推斷總體進(jìn)行方差分析畫直線(LineFitting)分析殘差單純線性回歸回歸分析的階段此章的因子為一個,因子和輸出值(Y120通過樣本推測的直線未知的真實(shí)直線Yi=+xi+i

(i=1,.…,n)i

是相互獨(dú)立的遵守N(0,2)的概率變量單純線性回歸模型εiei(xi,yi)xy在這里,εi~iidN(0,σ2)Model

定義

一個獨(dú)立變量(x)與

一個從屬變量(Y)間的關(guān)系方程式化后顯示的方法通過樣本推測的直線未知的真實(shí)直線Yi=+xi+121將誤差平方和最小化的推斷方法,找出將殘差平方最小化的直線.420410400390380370360350340330320350400450獨(dú)立變量從屬變量最小平方和的單純回歸單純回歸直線與回歸直線的差異直線是以“最小平方和推斷法(leastsquareestimation)”的原則畫出的.從資料的點(diǎn)到直線的距離的平方和最小化.將誤差平方和最小化的推斷方法,找出將殘差平方最小化的直線.122ebScatterPlotYvs.XwithFittedLineY=a+bX直線的方程式是

Y=a+bXa是常數(shù),b是斜率.“擬合線”是包括實(shí)際點(diǎn)和直線的平方差的和最小化后形成的直線.實(shí)際資料的點(diǎn)和直線的差異稱為殘差(residuals(e)).擬合線,回歸方程式構(gòu)造ebScatterPlotYvs.XwithFit1231.回歸模型的參數(shù)確定y=a+bx由歷史數(shù)據(jù)得一組x、y值,可求出參數(shù)a、b由最小二乘法得:1.回歸模型的參數(shù)確定y=a+bx124例某企業(yè)年投入資本(十萬元)x與銷售量(萬臺)y的歷史數(shù)據(jù)如下:yx101.920.912.440.46.451.27.060.37.078例某企業(yè)年投入資本(十萬元)x與銷售量(萬臺)y的歷史數(shù)據(jù)如125例yxx2xy101.93.61020.912.4153.711.140.46.440.962.5651.27.0498.460.37.0492.12.834.7296.3324.2平均0.566.9459.264.843.88648.16例yxx2xy101.93.61020.912.4153.7126計算結(jié)果某企業(yè)年投入資本(十萬元)x與銷售量(萬臺)y的歷史數(shù)據(jù)如下:計算結(jié)果某企業(yè)年投入資本(十萬元)x與銷售量(萬臺)y的歷史1272、用軟件進(jìn)行回歸分析的運(yùn)算(1)一元回歸模型的軟件運(yùn)算a.圖象分析b.回歸運(yùn)算2、用軟件進(jìn)行回歸分析的運(yùn)算(1)一元回歸模型的軟件運(yùn)算128二、二元回歸模型的軟件運(yùn)算

運(yùn)算步驟二、二元回歸模型的軟件運(yùn)算運(yùn)算步驟1291、統(tǒng)計值說明各統(tǒng)計值在計算機(jī)參數(shù)輸出中的位置:mnmn-1…m2m1bSenSen-1…Se2Se1Sebr2SeyFdfSSregSSresid1、統(tǒng)計值說明各統(tǒng)計值在計算機(jī)參數(shù)輸出中的位置:mnmn-11301、統(tǒng)計值說明(1)解釋變量、被解釋變量:y=m1x1+m2x2+b(2)系數(shù)m1,m2,...,mn——系數(shù)是解釋變量對預(yù)測值的貢獻(xiàn)解釋變量被解釋變量1、統(tǒng)計值說明(1)解釋變量、被解釋變量:解釋變量被解釋變量1311、統(tǒng)計值說明(3)系數(shù)的標(biāo)準(zhǔn)誤差值Se1,Se2,...,Sen——系數(shù)m1,m2,...,mn的標(biāo)準(zhǔn)誤差值。sqrt(∑(Y-Y’)^2/(N-2))/sqrt(∑(X-x)^2)其中,X為自變量,Y為因變量觀測值,Y‘為線形擬合值,X平均值計為x

——真值在系數(shù)估值正負(fù)1倍的標(biāo)準(zhǔn)差區(qū)間概率是2/3Seb——常數(shù)項b的標(biāo)準(zhǔn)誤差值1、統(tǒng)計值說明(3)系數(shù)的標(biāo)準(zhǔn)誤差值1321、統(tǒng)計值說明(4)判定系數(shù)——r2——Y的估計值與實(shí)際值之比范圍在0到1之間。如果為1,則樣本有很好的相關(guān)性,Y的估計值與實(shí)際值之間沒有差別。而在另一方面,如果判定系數(shù)為0,則回歸方程不能用來預(yù)測Y值。1、統(tǒng)計值說明(4)判定系數(shù)——r21331、統(tǒng)計值說明(5)Y估計值的標(biāo)準(zhǔn)誤差——Sey——真值在Y估值正負(fù)1的標(biāo)準(zhǔn)差區(qū)間概率是2/3(6)F統(tǒng)計值或F觀察值——F使用F統(tǒng)計可以判斷因變量和自變量之間是否偶爾發(fā)生過觀察到的關(guān)系。(7)置信度——df用于在統(tǒng)計表上查找F臨界值。所查得的值和函數(shù)LINEST返回的F統(tǒng)計值的比值可用來判斷模型的置信度。1、統(tǒng)計值說明(5)Y估計值的標(biāo)準(zhǔn)誤差——Sey1341、統(tǒng)計值說明(8)回歸平方和SSreg(9)殘差平方和SSresid1、統(tǒng)計值說明(8)回歸平方和SSreg135作業(yè)4某企業(yè)的資金投入X與銷售收入Y如下表:試用一元回歸方法求出回歸線,說明兩者的相關(guān)關(guān)系并對X=57萬元企業(yè)銷售額進(jìn)行預(yù)測。X(萬元)Y(萬元)110130218180323200435250542310作業(yè)4某企業(yè)的資金投入X與銷售收入Y如下表:試用一元回歸方法136例2某市國內(nèi)生產(chǎn)總值y與固定資產(chǎn)投入X1、勞動力投入X2的歷史數(shù)據(jù)如下表,試用線性回歸方法確定其參數(shù)值。序號yX1X21539112641914382211549234

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論