數(shù)理統(tǒng)計(jì)模型_第1頁
數(shù)理統(tǒng)計(jì)模型_第2頁
數(shù)理統(tǒng)計(jì)模型_第3頁
數(shù)理統(tǒng)計(jì)模型_第4頁
數(shù)理統(tǒng)計(jì)模型_第5頁
已閱讀5頁,還剩61頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

數(shù)理統(tǒng)計(jì)模型第一頁,共六十六頁,編輯于2023年,星期六主要內(nèi)容數(shù)理統(tǒng)計(jì)模型概述描述性統(tǒng)計(jì)推論性統(tǒng)計(jì)模型統(tǒng)計(jì)模型中常見的錯(cuò)誤統(tǒng)計(jì)模型建立程式第二頁,共六十六頁,編輯于2023年,星期六第一節(jié)數(shù)理統(tǒng)計(jì)模型概述一、統(tǒng)計(jì)分析概述統(tǒng)計(jì)分析通過計(jì)算研究對象的特征的樣本平均值、方差,或者所占百分比,研究樣本特征值與母體特征值的關(guān)系,研究變量之間的關(guān)系,特別是因果關(guān)系,從而發(fā)現(xiàn)被研究對象的發(fā)展規(guī)律,或者驗(yàn)證有關(guān)假想、結(jié)論是否成立,驗(yàn)證有關(guān)理論在新的時(shí)空中是否成立。進(jìn)而可以針對深層原因,引出改變客觀世界的策略。第三頁,共六十六頁,編輯于2023年,星期六二、統(tǒng)計(jì)的兩種功能描述與推理描述性統(tǒng)計(jì)(descriptivestatistics)描述性統(tǒng)計(jì)是概括所取得數(shù)據(jù)的共有性質(zhì)。推論性統(tǒng)計(jì)(inferentialstatistics)。推論性統(tǒng)計(jì)幫助研究人員對數(shù)據(jù)做出判斷。第四頁,共六十六頁,編輯于2023年,星期六三、管理研究中統(tǒng)計(jì)分析的功能

統(tǒng)計(jì)分析的方法可以為管理研究提供一種清晰精確的形式化語言;統(tǒng)計(jì)分析是進(jìn)行科學(xué)預(yù)測、探索未來的重要方法;統(tǒng)計(jì)分析技術(shù)是處理調(diào)查研究資料的必要工具。第五頁,共六十六頁,編輯于2023年,星期六第二節(jié)描述性統(tǒng)計(jì)模型一、集中趨勢分析(一)含義:集中量數(shù)也稱集中趨勢量數(shù),是用一個(gè)數(shù)值去代表一組數(shù)據(jù)的一般水平。常用的集中量數(shù)有平均數(shù)、中位數(shù)和眾數(shù)。平均數(shù)是所有測量數(shù)據(jù)的算術(shù)平均值,中位數(shù)是將測量數(shù)據(jù)按大小順序一分為二的變量屬性值,即位于排列順序中間位置的數(shù)值,眾數(shù)是測量數(shù)據(jù)中出現(xiàn)頻率最高的數(shù)值。第六頁,共六十六頁,編輯于2023年,星期六例有一組數(shù)據(jù)是9位工人本月的產(chǎn)量:96、96、97、99、100、101、102、104、155,則:平均數(shù)為105.5,中位數(shù)為100,眾數(shù)為96。第七頁,共六十六頁,編輯于2023年,星期六(二)集中趨勢分析的作用集中量數(shù)說明某一管理現(xiàn)象在一定條件下,其數(shù)量的一般水平。集中量數(shù)可以對于在不同空間的同類現(xiàn)象進(jìn)行比較。集中量數(shù)可以對一定管理現(xiàn)象在不同時(shí)間中的變化進(jìn)行比較,以說明這些現(xiàn)象的發(fā)展趨勢和規(guī)律。集中量數(shù)可以用來分析某些管理現(xiàn)象之間的依存關(guān)系。第八頁,共六十六頁,編輯于2023年,星期六二、離散趨勢分析(一)含義離散趨勢分析是反映測量數(shù)據(jù)的分散程度,其常用指標(biāo)有:極差(range)與標(biāo)準(zhǔn)差(standarddeviation)。極差是測量數(shù)據(jù)中的最大值與最小值之間的差異,由兩個(gè)極端值來決定,只適用于定距與定比數(shù)據(jù)。標(biāo)準(zhǔn)差綜合反映所有數(shù)據(jù)的分散程度,與平均數(shù)配套使用,適用于定距于定比數(shù)據(jù),其計(jì)算式為:其中,為標(biāo)準(zhǔn)差,x為樣本值,X為平均數(shù),N為樣本總數(shù)。第九頁,共六十六頁,編輯于2023年,星期六三、頻數(shù)與頻率分析為直觀地反映一組測量數(shù)據(jù)的分布狀況,經(jīng)常用頻數(shù)與頻率分析。頻數(shù)分布描述測量值中各屬性值出現(xiàn)的次數(shù),頻率分布則是用比率的形式來表示,各屬性值除以樣本總數(shù)即可得到該屬性值的頻率。第十頁,共六十六頁,編輯于2023年,星期六

頻數(shù)分布也可轉(zhuǎn)化為可視化的表達(dá)方式,如長條圖、直方圖、餅圖。在SPSS統(tǒng)計(jì)軟件中,具體操作是:在統(tǒng)計(jì)菜單(statiatics)中單擊摘要(summarize)、頻數(shù)(frequencies),并在頻數(shù)對話框中選擇所要的圖表(charts),即可獲得這些圖表第十一頁,共六十六頁,編輯于2023年,星期六第三節(jié)推論性統(tǒng)計(jì)模型統(tǒng)計(jì)推斷的功能從隨機(jī)樣本中推斷總體參數(shù)特征、以統(tǒng)計(jì)為基礎(chǔ)驗(yàn)證假設(shè)。第十二頁,共六十六頁,編輯于2023年,星期六一、雙變量的回歸分析與相關(guān)分析4.4.1回歸分析模型收入——X居民儲蓄量——Y第十三頁,共六十六頁,編輯于2023年,星期六(一)回歸模型XY第十四頁,共六十六頁,編輯于2023年,星期六1、回歸模型的概念強(qiáng)的正相關(guān)弱的正相關(guān)中間程度的正相關(guān)|r

|=0.936|r

|=0.560|r

|=0.3390強(qiáng)的負(fù)相關(guān)弱的負(fù)相關(guān)中間程度的負(fù)相關(guān)第十五頁,共六十六頁,編輯于2023年,星期六確立X與Y的關(guān)聯(lián)性回歸…尋找“Y”與“X”關(guān)系的方法什么是回歸?描述“Y”與“X”關(guān)系的數(shù)學(xué)方法-創(chuàng)建過程的“模型”?;貧w分析

相關(guān)是告訴關(guān)系的程度,回歸分析是找出Y=F(X)的函數(shù)關(guān)系式

第十六頁,共六十六頁,編輯于2023年,星期六單純線性回歸回歸分析的階段Data收集用散點(diǎn)圖確認(rèn)關(guān)系用最小二乘法推斷總體進(jìn)行方差分析畫直線(LineFitting)分析殘差此章的因子為一個(gè),因子和輸出值(Y)的關(guān)系為直線關(guān)系的單純線性回歸(SimpleLinearRegression)第十七頁,共六十六頁,編輯于2023年,星期六通過樣本推測的直線未知的真實(shí)直線Yi=+xi+i

(i=1,.…,n)i

是相互獨(dú)立的遵守N(0,2)的概率變量單純線性回歸模型εiei(xi,yi)xy在這里,εi~iidN(0,σ2)Model

定義

一個(gè)獨(dú)立變量(x)與

一個(gè)從屬變量(Y)間的關(guān)系方程式化后顯示的方法第十八頁,共六十六頁,編輯于2023年,星期六將誤差平方和最小化的推斷方法,找出將殘差平方最小化的直線.420410400390380370360350340330320350400450獨(dú)立變量從屬變量最小平方和的單純回歸單純回歸直線與回歸直線的差異(誤差)直線是以“最小平方和推斷法(leastsquareestimation)”的原則畫出的.從資料的點(diǎn)到直線的距離的平方和最小化.第十九頁,共六十六頁,編輯于2023年,星期六ebScatterPlotYvs.XwithFittedLineY=a+bX直線的方程式是

Y=a+bXa是

常數(shù),b是斜率.

“擬合線”是包括實(shí)際點(diǎn)和直線的平方差的和最小化后形成的直線.

實(shí)際資料的點(diǎn)和直線的差異稱為殘差(residuals(e)).擬合線,回歸方程式構(gòu)造第二十頁,共六十六頁,編輯于2023年,星期六1.回歸模型的參數(shù)確定y=a+bx由歷史數(shù)據(jù)得一組x、y值,可求出參數(shù)a、b由最小二乘法得:第二十一頁,共六十六頁,編輯于2023年,星期六例某企業(yè)年投入資本(十萬元)x與銷售量(萬臺)y的歷史數(shù)據(jù)如下:yx101.920.912.440.46.451.27.060.37.078第二十二頁,共六十六頁,編輯于2023年,星期六例yxx2xy101.93.61020.912.4153.711.140.46.440.962.5651.27.0498.460.37.0492.12.834.7296.3324.2平均0.566.9459.264.843.88648.16第二十三頁,共六十六頁,編輯于2023年,星期六計(jì)算結(jié)果某企業(yè)年投入資本(十萬元)x與銷售量(萬臺)y的歷史數(shù)據(jù)如下:第二十四頁,共六十六頁,編輯于2023年,星期六2、用軟件進(jìn)行回歸分析的運(yùn)算

(1)一元回歸模型的軟件運(yùn)算

a.圖象分析

b.回歸運(yùn)算第二十五頁,共六十六頁,編輯于2023年,星期六二、二元回歸模型的軟件運(yùn)算

運(yùn)算步驟第二十六頁,共六十六頁,編輯于2023年,星期六1、統(tǒng)計(jì)值的說明各統(tǒng)計(jì)值在計(jì)算機(jī)參數(shù)輸出中的位置:mnmn-1…m2m1bSenSen-1…Se2Se1Sebr2SeyFdfSSregSSresid第二十七頁,共六十六頁,編輯于2023年,星期六1、統(tǒng)計(jì)值說明(1)解釋變量、被解釋變量:

y=m1x1+m2x2+b(2)系數(shù)

m1,m2,...,mn——系數(shù)是解釋變量對預(yù)測值的貢獻(xiàn)解釋變量被解釋變量第二十八頁,共六十六頁,編輯于2023年,星期六1、統(tǒng)計(jì)值說明

(3)系數(shù)的標(biāo)準(zhǔn)誤差值se1,se2,...,sen系數(shù)m1,m2,...,mn的標(biāo)準(zhǔn)誤差值?!嬷翟谙禂?shù)估值正負(fù)1的標(biāo)準(zhǔn)差區(qū)間概率是2/3Seb——常數(shù)項(xiàng)b的標(biāo)準(zhǔn)誤差值第二十九頁,共六十六頁,編輯于2023年,星期六1、統(tǒng)計(jì)值說明(4)判定系數(shù)——r2——Y的估計(jì)值與實(shí)際值之比范圍在0到1之間。如果為1,則樣本有很好的相關(guān)性,Y的估計(jì)值與實(shí)際值之間沒有差別。而在另一方面,如果判定系數(shù)為0,則回歸方程不能用來預(yù)測Y值。第三十頁,共六十六頁,編輯于2023年,星期六1、統(tǒng)計(jì)值說明(5)Y估計(jì)值的標(biāo)準(zhǔn)誤差——sey——真值在Y估值正負(fù)1的標(biāo)準(zhǔn)差區(qū)間概率是2/3(6)F統(tǒng)計(jì)值或F觀察值——F使用F統(tǒng)計(jì)可以判斷因變量和自變量之間是否偶爾發(fā)生過觀察到的關(guān)系。(7)置信度——df用于在統(tǒng)計(jì)表上查找F臨界值。所查得的值和函數(shù)LINEST返回的F統(tǒng)計(jì)值的比值可用來判斷模型的置信度。第三十一頁,共六十六頁,編輯于2023年,星期六1、統(tǒng)計(jì)值說明(8)回歸平方和ssreg(9)殘差平方和ssresid第三十二頁,共六十六頁,編輯于2023年,星期六作業(yè)4某企業(yè)的資金投入X與銷售收入Y如下表:試用一元回歸方法求出回歸線,說明兩者的相關(guān)關(guān)系并對X=57萬元企業(yè)銷售額進(jìn)行預(yù)測。X(萬元)Y(萬元)110130218180323200435250542310第三十三頁,共六十六頁,編輯于2023年,星期六例2

某市國內(nèi)生產(chǎn)總值y與固定資產(chǎn)投入X1、勞動力投入X2的歷史數(shù)據(jù)如下表,試用線性回歸方法確定其參數(shù)值。序號yX1X2153911264191438221154923417512043196160562071807229第三十四頁,共六十六頁,編輯于2023年,星期六例2-2.087972.65182248.34758Y=2.65X1-2.09X2+48.35預(yù)測:x1=82,X2=35y=?Y=192.71第三十五頁,共六十六頁,編輯于2023年,星期六作業(yè)2000年某企業(yè)產(chǎn)品銷售量Y與企業(yè)銷售投入量X1、銷售點(diǎn)增加量X2歷史數(shù)據(jù)如下表,試用回歸方法求其參數(shù)值。說明兩者的相關(guān)關(guān)系并對(X1=140,X2=41)的Y值進(jìn)行預(yù)測。第三十六頁,共六十六頁,編輯于2023年,星期六作業(yè)序號YX1X2142205262237383509480701259977156120891871609920819011030923012031第三十七頁,共六十六頁,編輯于2023年,星期六三、參數(shù)估計(jì)(一)含義參數(shù)估計(jì)是從樣本的統(tǒng)計(jì)值來估計(jì)總體的參數(shù)值,其邏輯程序是先有樣本分布,再推測總體。當(dāng)樣本對總體參數(shù)進(jìn)行估計(jì)時(shí),有兩種估計(jì)方法:點(diǎn)估計(jì)(poimestimation)與區(qū)間估計(jì)(intervalestimation)。1、點(diǎn)估計(jì)點(diǎn)估計(jì)是將樣本中某統(tǒng)計(jì)量的值作為相應(yīng)總體參數(shù)值的單一估計(jì)。第三十八頁,共六十六頁,編輯于2023年,星期六例:想了解某種新產(chǎn)品在各省會城市的銷售量,我們可抽去一些省會城市調(diào)查其銷售量,然后求其平均值,即為平均銷售量估計(jì)。當(dāng)然,如果另外抽取幾個(gè)城市,就會發(fā)現(xiàn)其平均銷售量不完全一致,這說明點(diǎn)估計(jì)值本身就是一個(gè)隨機(jī)變量。第三十九頁,共六十六頁,編輯于2023年,星期六2、區(qū)間估計(jì)區(qū)間估計(jì)不是采用通常度量準(zhǔn)確性的方法,如允許估計(jì)值與真實(shí)值有百分之幾的誤差,而要判斷真實(shí)值有多大可能落在樣本統(tǒng)計(jì)值分布的某一范圍、(置饋區(qū)間)之內(nèi)。這一范圍越大,估計(jì)值的準(zhǔn)確性就越低。統(tǒng)計(jì)值落在允許偏差的范圍的概率越大,故計(jì)值的可靠性就越高。一般來說,在管理研究中,置信水平選擇95%或99%,即O.95或0.99的概率,真實(shí)值落在偏差范圍之內(nèi),允許不超過0.05或O.01的概率超出此范圍。第四十頁,共六十六頁,編輯于2023年,星期六四、假設(shè)檢驗(yàn)(一)含義假設(shè)檢驗(yàn)是先對總體參數(shù)作出假設(shè),然后從樣本統(tǒng)計(jì)值去檢驗(yàn)它是否與假設(shè)參數(shù)值一致。第四十一頁,共六十六頁,編輯于2023年,星期六(二)假設(shè)檢驗(yàn)中兩類錯(cuò)誤在假設(shè)檢驗(yàn)中存在兩類錯(cuò)誤:樣本是隨機(jī)抽取的,但也有意外,例如樣本沒有反映典型特征。當(dāng)我們錯(cuò)誤地將偶然發(fā)生的事件當(dāng)作非偶然發(fā)生的,進(jìn)而錯(cuò)誤地將虛無假設(shè)否定,則就犯了第一類錯(cuò)誤;如果將原本錯(cuò)誤的事件認(rèn)為是正確的,沒有否定本該否定的虛無假設(shè),則就犯了第二類錯(cuò)誤。第四十二頁,共六十六頁,編輯于2023年,星期六(三)t檢驗(yàn)(t-test)是檢驗(yàn)定距或定類變量的相關(guān)性,即在定距或定類尺度上,兩群體之間是否存在差異。第四十三頁,共六十六頁,編輯于2023年,星期六例:有MBA資格的人員是否比企業(yè)管理專業(yè)的本科畢業(yè)生表現(xiàn)要好?男性與女性對激勵(lì)的反映是否相同?此類問題可通過t檢驗(yàn)來分析研究變量中不同群體的平均數(shù)是否有顯著差異,亦即針對具有兩個(gè)子類別的定類變量(男性與女性、MBA與本科生)進(jìn)行檢驗(yàn),看這兩個(gè)群體在定距或定比尺度上(反映程度、表現(xiàn)程度等)的平均數(shù)是否存在顯著差異。第四十四頁,共六十六頁,編輯于2023年,星期六T檢驗(yàn)方法選擇分析平均值比較獨(dú)立樣本t檢驗(yàn)選擇分組變量選擇置信水平選擇置信水平輸出結(jié)果第四十五頁,共六十六頁,編輯于2023年,星期六(四)方差分析1、含義:方差分析(ANOVA)是檢驗(yàn)因變量是定距或定比尺度時(shí),兩個(gè)以上群體之間的平均的顯著差異。第四十六頁,共六十六頁,編輯于2023年,星期六例:4組促銷人員之間是否存在顯著差異:一組被送到學(xué)校系統(tǒng)學(xué)習(xí)營銷課程;一組通過實(shí)地考察在職訓(xùn)練,一組由經(jīng)驗(yàn)豐富的銷售經(jīng)理進(jìn)行指導(dǎo),一組沒有接受上述訓(xùn)練。利用方差分析來確定不同群體之間是否存在顯著差異可通過F統(tǒng)計(jì)量獲得。第四十七頁,共六十六頁,編輯于2023年,星期六2、具體方法選擇分析平均值比較單因素方差分析選擇兩變量輸出結(jié)果第四十八頁,共六十六頁,編輯于2023年,星期六(五)χ2檢驗(yàn)1、含義χ2檢驗(yàn)(chi:squaretest)是用于檢驗(yàn)兩個(gè)定類變量發(fā)生頻次之間是否存在差異第四十九頁,共六十六頁,編輯于2023年,星期六例:在超市隨機(jī)選擇90位顧客征求他們對三種飲料的偏好,如果40位選擇甲,30位選擇乙,20位選擇丙,即觀測頻次為(40,30,20),如果虛無假設(shè)(三種飲料的顧客偏好不存在差異)成立,其期望頻次應(yīng)為(30,30,30),x檢驗(yàn)就是要判斷觀測頻次(40,30,20)與期望頻次(30,30,30)之間的差異是否顯著。第五十頁,共六十六頁,編輯于2023年,星期六2、方法選擇分析描述統(tǒng)計(jì)建立交叉表統(tǒng)計(jì)選擇χ2輸出結(jié)果第五十一頁,共六十六頁,編輯于2023年,星期六第四節(jié)統(tǒng)計(jì)分析中的常見錯(cuò)誤一、樣本平均值當(dāng)作母體平均值對待樣本平均值當(dāng)作母體平均值對待,不做顯著性檢驗(yàn),是常見錯(cuò)誤之一第五十二頁,共六十六頁,編輯于2023年,星期六例:在營銷研究中針對某產(chǎn)品設(shè)計(jì)了兩種郵購廣告,分別用隨機(jī)抽樣的方法對居民郵寄廣告,甲廣告寄出200份,有44位居民訂購了相應(yīng)的產(chǎn)品,乙廣告寄出400,有1oo位居民訂購了該產(chǎn)品。此時(shí)很容易算出,甲廣告的訂購率為22%,己廣告的訂購率是25%。我們是否可以依此就得出結(jié)論:乙廣告設(shè)計(jì)比甲廣告設(shè)計(jì)的好(乙廣告的訂購率高于甲廣告)?

常見的錯(cuò)誤就是直接依據(jù)兩組樣本的比例值(甲廣告的訂購率為22%,乙廣告的訂購率是25%)來做結(jié)論,認(rèn)為乙廣告優(yōu)于甲廣告(乙廣告的訂購率高于甲廠告)。第五十三頁,共六十六頁,編輯于2023年,星期六結(jié)論:事實(shí)上,乙廣告未必優(yōu)于甲廣告,因?yàn)閮蓚€(gè)比例值是分別基于200個(gè)樣本和400個(gè)樣本得出的。如果繼續(xù)擴(kuò)大樣本容量,甲乙兩個(gè)廣告的訂購率就可能發(fā)生變化。我們要做的事情,就是依據(jù)這兩組樣本數(shù)據(jù)(甲組200個(gè),乙組400個(gè))來推斷甲乙兩種廣告設(shè)計(jì)的優(yōu)劣。這是顯著性的檢驗(yàn)的問題。顯著性檢驗(yàn)的結(jié)果是,不能認(rèn)為兩者具有顯著性差異。第五十四頁,共六十六頁,編輯于2023年,星期六二、做相關(guān)分析時(shí)不做顯著性檢驗(yàn)做相關(guān)分析時(shí)不做顯著性檢驗(yàn),用簡單相關(guān)分析替代偏相關(guān)分析,是又一常見錯(cuò)誤。偏相關(guān)表示在消除其他變量的影響之后,自變量與因變量之間的關(guān)聯(lián)程度。第五十五頁,共六十六頁,編輯于2023年,星期六例:分析工人的勞動生產(chǎn)率與文化水平之間的關(guān)聯(lián)時(shí),要受到年齡因素的影響。偏相關(guān)分析首先用一元回歸分析年齡與文化水平之間的關(guān)系,回歸方程的殘差(多項(xiàng)說明不能由文化水平來解釋年齡的偏差;然后求勞動生產(chǎn)率與年齡之間的回歸方程及殘差,反映不能由年齡來解釋勞動生產(chǎn)率的偏差;最后第三

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論