商務(wù)統(tǒng)計(jì)學(xué)習(xí)講座

上傳人：活*** IP屬地：寧夏上傳時(shí)間：2021-05-26 格式：PPT 頁數(shù)：246 大?。?80.50KB 積分：35 舉報(bào) 版權(quán)申訴

已閱讀5頁，還剩241頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、商務(wù)統(tǒng)計(jì)學(xué)習(xí)講座雷欽禮雷欽禮前言一、商務(wù)統(tǒng)計(jì)課程的性質(zhì) 二、商務(wù)統(tǒng)計(jì)學(xué)習(xí)的方法一、商務(wù)統(tǒng)計(jì)課程的性質(zhì) 1、商務(wù)統(tǒng)計(jì)是全面系統(tǒng)論述商務(wù)與經(jīng)濟(jì) 統(tǒng)計(jì)活動(dòng)全過程中所用統(tǒng)計(jì)理論與方法的綜合性課程，在調(diào)查分析師證書系列課程中是具有提綱挈領(lǐng)作用的一門課程。 2、商務(wù)統(tǒng)計(jì)課程的內(nèi)容都是碩士研究生入學(xué)考試必考的內(nèi)容，是任何一個(gè)統(tǒng)計(jì) 人員和調(diào)查分析人員都必須掌握的統(tǒng)計(jì) 學(xué)的核心知識(shí)。二、商務(wù)統(tǒng)計(jì)學(xué)習(xí)的方法 1、商務(wù)統(tǒng)計(jì)是一門應(yīng)用性統(tǒng)計(jì)學(xué)課程，在學(xué) 習(xí)過程中應(yīng)注重各種基本概念的含義和各種方法的基本原理與應(yīng)用，要掌握每種方法的使用條件、計(jì)算步驟、以及結(jié)果的意義與解釋。 2、要在理解和領(lǐng)會(huì)中記憶和

2、掌握課程的內(nèi)容。如對(duì)于各種統(tǒng)計(jì)分布的復(fù)雜的密度函數(shù)公式就不需記憶，但卻需要熟練掌握其概念定義以及分布函數(shù)表的使用方法。第一章第一章緒論緒論一、統(tǒng)計(jì)學(xué)的性質(zhì)一、統(tǒng)計(jì)學(xué)的性質(zhì) 二、統(tǒng)計(jì)學(xué)的作用二、統(tǒng)計(jì)學(xué)的作用三、統(tǒng)計(jì)學(xué)的基本概念四、統(tǒng)計(jì)指標(biāo)體系的設(shè)計(jì) 一、統(tǒng)計(jì)學(xué)的性質(zhì) （一）統(tǒng)計(jì)活動(dòng)的內(nèi)容與階段對(duì)各種數(shù)據(jù)資料的搜集、整理、分析和推斷的活動(dòng)過程稱為統(tǒng)計(jì)活動(dòng)，一項(xiàng)完整的統(tǒng)計(jì)活動(dòng)過程可分為統(tǒng)計(jì)資料的搜集整理和統(tǒng)計(jì)資料的分析推斷兩大階段。（二）統(tǒng)計(jì)學(xué)的定義與分科統(tǒng)計(jì)學(xué)就是關(guān)于數(shù)據(jù)資料的搜集、整理、分析和推斷的科學(xué)。關(guān)于統(tǒng)計(jì)資料的搜集整理和分析推斷的理論與方法構(gòu)成了統(tǒng)計(jì)學(xué)的全

3、部?jī)?nèi)容。（1）理論統(tǒng)計(jì)學(xué)與應(yīng)用統(tǒng)計(jì)學(xué) （2）描述統(tǒng)計(jì)學(xué)與推斷統(tǒng)計(jì)學(xué) 二、統(tǒng)計(jì)學(xué)的作用（一）統(tǒng)計(jì)學(xué)在科學(xué)研究中的作用提出假說并判定假說的正確與否（二）統(tǒng)計(jì)學(xué)在生產(chǎn)中的作用通過試驗(yàn)分析找出最佳工藝，并對(duì)生產(chǎn)過程進(jìn)行統(tǒng)計(jì)質(zhì)量控制。（三）統(tǒng)計(jì)學(xué)在管理中的作用抽樣調(diào)查了解社會(huì)與市場(chǎng)，為決策提供依據(jù)；并可建立各種社會(huì)與經(jīng)濟(jì)發(fā)展模型，定量地模擬社會(huì)與經(jīng) 濟(jì)的運(yùn)行，既可分析社會(huì)與經(jīng)濟(jì)的發(fā)展及其結(jié) 構(gòu)變化，又可進(jìn)行政策效果的評(píng)價(jià)。三、統(tǒng)計(jì)學(xué)的基本概念（一）總體和個(gè)體組成統(tǒng)計(jì)活動(dòng)研究對(duì)象的全部事物的全體集合，就稱為統(tǒng)計(jì)總體，簡(jiǎn)稱總體或母體；而總體中的各個(gè)事物則稱為個(gè)體，總體中個(gè)體的數(shù)

4、量稱為總體容量。 1、自然物體總體與人為劃定個(gè)體的總體； 2、有限總體與無限總體； 3、具體總體與設(shè)想總體（抽象總體）。三、統(tǒng)計(jì)學(xué)的基本概念（二）統(tǒng)計(jì)指標(biāo)及其測(cè)度（二）統(tǒng)計(jì)指標(biāo)及其測(cè)度用來測(cè)度統(tǒng)計(jì)活動(dòng)研究對(duì)象某種特征數(shù)量的概念稱為統(tǒng)計(jì)指標(biāo)，簡(jiǎn)稱指標(biāo)。其中，測(cè)度總體特征數(shù)量的概念稱為總體指標(biāo)，而測(cè)度個(gè)體特征數(shù)量的概念則稱為個(gè)體指標(biāo)。指標(biāo)的測(cè)度計(jì)量尺度有（指標(biāo)的測(cè)度計(jì)量尺度有（1 1）定類尺度，（2）定序尺度，（3）定距尺度，（4）定比尺度。三、統(tǒng)計(jì)學(xué)的基本概念（三）樣本和統(tǒng)計(jì)推斷 1、樣本從總體中隨機(jī)抽出的部分個(gè)體所組成的集合稱為樣本或子樣，樣本中所含個(gè)體的數(shù)目稱為樣

5、本容量。 2、統(tǒng)計(jì)推斷根據(jù)樣本觀測(cè)資料來對(duì)總體的分布狀況和分布特征進(jìn)行推斷。 3、樣本數(shù)據(jù)的分類（1）橫截面數(shù)據(jù)，（2）時(shí)間序列數(shù)據(jù)。四、統(tǒng)計(jì)指標(biāo)體系及其設(shè)計(jì) （一）統(tǒng)計(jì)指標(biāo)體系的定義反映總體及其所含個(gè)體的各個(gè)方面特征數(shù)量的一系列相互聯(lián)系、相互補(bǔ)充的統(tǒng)計(jì)指標(biāo)所形成的體系，稱為統(tǒng)計(jì)指標(biāo)體系。（二）構(gòu)建統(tǒng)計(jì)指標(biāo)體系的意義（三）指標(biāo)體系中指標(biāo)的分類 1、水平指標(biāo)（1）存量指標(biāo)與流量指標(biāo)，（2）實(shí)物指標(biāo)與價(jià)值指標(biāo)。 2、比率指標(biāo)（1）比例相對(duì)指標(biāo)，（2）比值相對(duì)指標(biāo)，（3）動(dòng)態(tài)相對(duì)指標(biāo)，（4）彈性相對(duì)指標(biāo)，（5）強(qiáng)度相對(duì)指標(biāo)。（四）指標(biāo)體系設(shè)計(jì)的內(nèi)容 1 1、確定統(tǒng)計(jì)指標(biāo)

6、體系的框架；、確定統(tǒng)計(jì)指標(biāo)體系的框架； 2 2、確定每一個(gè)指標(biāo)的內(nèi)涵和外延；、確定每一個(gè)指標(biāo)的內(nèi)涵和外延； 3 3、確定每個(gè)統(tǒng)計(jì)指標(biāo)的計(jì)量單位；、確定每個(gè)統(tǒng)計(jì)指標(biāo)的計(jì)量單位； 4 4、確定每個(gè)統(tǒng)計(jì)指標(biāo)的計(jì)算方法。、確定每個(gè)統(tǒng)計(jì)指標(biāo)的計(jì)算方法。（五）指標(biāo)體系設(shè)計(jì)的原則 1、目的性原則 2、科學(xué)性原則 3、可行性原則 4、聯(lián)系性原則第二章數(shù)據(jù)采集與整理一、數(shù)據(jù)采集的方式與程序二、現(xiàn)場(chǎng)調(diào)查三、試驗(yàn)觀測(cè) 四、數(shù)據(jù)的整理顯示一、數(shù)據(jù)采集的方式與程序（一）數(shù)據(jù)采集根據(jù)統(tǒng)計(jì)指標(biāo)體系的要求，對(duì)所研究總體中個(gè)體的相應(yīng)指標(biāo)進(jìn)行觀測(cè)記錄取得數(shù)據(jù)的活動(dòng)過程。（二）數(shù)據(jù)采集活動(dòng)的基本要求采集到的數(shù)

7、據(jù)資料要具有代表性和真實(shí)性。所謂代表性，是要求所觀測(cè)到的樣本必須對(duì)所研究總體具有代表性；而所謂真實(shí)性，則是要求所采集到的數(shù)據(jù)必須是真實(shí)的實(shí)際數(shù)據(jù)。（三）數(shù)據(jù)采集方式的分類現(xiàn)場(chǎng)調(diào)查和試驗(yàn) 觀測(cè) 一、數(shù)據(jù)采集的方式與程序（四）數(shù)據(jù)采集的程序 1、制定數(shù)據(jù)采集方案包括（1）采集數(shù)據(jù)的目的，（2）采集總體和觀測(cè)單位，（3）觀測(cè)指標(biāo)數(shù)值登記表，（4）采集方式和組織，（5）采集時(shí)間和期限。 2、現(xiàn)場(chǎng)觀測(cè)登記 3、數(shù)據(jù)整理顯示二、現(xiàn)場(chǎng)調(diào)查（一）調(diào)查的取樣方式 1、隨機(jī)抽樣調(diào)查（1）簡(jiǎn)單隨機(jī)抽樣，（2）系統(tǒng)抽樣，（3）分層抽樣，（4）整群抽樣。 2、非隨機(jī)抽樣調(diào)查（1）任意抽樣，（

8、2）立意抽樣，（3）配額抽樣。 3、概率抽樣和非概率抽樣的特點(diǎn)比較二、現(xiàn)場(chǎng)調(diào)查（二）現(xiàn)場(chǎng)調(diào)查的觀測(cè)方式 1、訪問法（1）口頭訪問當(dāng)面訪問或電話訪問（2）書面訪問郵局或互聯(lián)網(wǎng)郵件傳遞，以及登門送收 2、觀察法二、現(xiàn)場(chǎng)調(diào)查（三）現(xiàn)場(chǎng)調(diào)查的問卷設(shè)計(jì) 1、提問方式（1）封閉型提問（2）開放型提問 2、提問次序三、試驗(yàn)觀測(cè) （一）試驗(yàn)觀測(cè)設(shè)計(jì)的原則 1、均衡分散性原則 2、整齊可比性原則（二）試驗(yàn)觀測(cè)的方法 1、完全隨機(jī)試驗(yàn)觀測(cè) 2、隨機(jī)區(qū)組試驗(yàn)觀測(cè) 3、拉丁方試驗(yàn)觀測(cè) 4、正交試驗(yàn)觀測(cè) 四、數(shù)據(jù)整理與顯示（一）構(gòu)建觀測(cè)資料數(shù)據(jù)庫的意義與方法（二）觀測(cè)數(shù)據(jù)的分類顯示 1、

9、觀測(cè)個(gè)體的分類（1）分類的功能與原則（2）分類的方法 2、統(tǒng)計(jì)表的編制（1）統(tǒng)計(jì)表的構(gòu)成（2）統(tǒng)計(jì)表的編制規(guī)則內(nèi)容安排科學(xué) 合理，形式設(shè)計(jì)簡(jiǎn)練美觀。第三章次數(shù)分布一、次數(shù)分布的概念二、次數(shù)分布表及其編制三、次數(shù)分布圖四、次數(shù)分布的理論模型及其表示方法五、離散變量概率分布模型六、連續(xù)變量概率分布模型一、次數(shù)分布的概念（一）次數(shù)分布：觀測(cè)變量的各個(gè)不同取值及其出現(xiàn)次數(shù)的順序排列，稱為變量的次數(shù)分布。（二）總體次數(shù)分布和樣本次數(shù)分布（三）次數(shù)分布的作用觀測(cè)變量的次數(shù)分布包含了觀測(cè)變量取值的全部信息。根據(jù)觀測(cè) 變量的次數(shù)分布，可以對(duì)觀測(cè)變量的各種分布特征進(jìn)行描述和

10、分析。二、次數(shù)分布表及其編制（一）次數(shù)分布表的種類 1、單值分組次數(shù)分布表 2、組距分組次數(shù)分布表（二）組距分組次數(shù)分布表的編制方法 1、確定組數(shù) 等距分組的斯特吉斯公式：m=1+3.322lgn 2、確定組距等距分組的參考組距： 3、確定組限 4、計(jì)數(shù)各組的次數(shù) 5、列出次數(shù)分布表 m xminxmax w ii 三、次數(shù)分布圖用線和面等形狀來顯示觀測(cè)變量次數(shù)分布狀況的幾何圖形，稱為次數(shù)分布圖。常用的次數(shù)分布圖主要有柱狀圖、直方圖和折線圖等幾種。四、次數(shù)分布的理論模型（一）理論分布模型的概念與意義隨機(jī)變量取某個(gè)數(shù)值或在某個(gè)區(qū)間取值是一個(gè)隨機(jī)事件，使用概率理論計(jì)算的隨

11、機(jī)變量在各個(gè)數(shù)值上或在各個(gè)區(qū)間內(nèi)取值的概率分布，就是隨機(jī)變量的理論分布，計(jì)算此理論分布的概率理論模型就是其理論分布模型。在現(xiàn)實(shí)生活中，各種觀測(cè)變量的概率分布都可以用某個(gè)理論概論分布模型去近似描述。因此就可據(jù)此理論分布模型進(jìn)行分析推斷。四、次數(shù)分布的理論模型（二）理論分布模型的表示方法 1、概率分布表 2、概率分布圖 3、概率分布函數(shù)式五、離散變量概率分布模型記所考察的離散變量為x，假設(shè)該隨機(jī)變量共可取m個(gè)不同的值，它取值為xi的概率為pi，并記隨機(jī)事件x=xi的概率為p(x=xi)，則離散隨機(jī)變量的概率分布可表示為： p(x=xi)=pi ； i=1,2,m. 在統(tǒng)計(jì)

12、分析推斷中，常用的離散變量概率分布模型主要有兩點(diǎn)分布、二項(xiàng)分布、超幾何分布和泊松分布等幾種。（一）兩點(diǎn)分布假設(shè)總體中有兩類共n個(gè)個(gè)體，其中取值為“是”的有n1個(gè)，取值為“非”的有n0 個(gè)，則有： q n n xp p n n xp 0 1 0 1 （二）二項(xiàng)分布假設(shè)在0-1分布總體中，取“是”值的個(gè)體比例為p，取“非”值的比例為q，現(xiàn) 從中有放回地隨機(jī)抽取n個(gè)個(gè)體，記x為取 “是”值的個(gè)體數(shù)目，則其中恰有n1個(gè)個(gè) 體取“是”值、且有n0=n-n1個(gè)個(gè)體取“非” 值的概率為： 011 1 nnn n qpcnxp （三）超幾何分布假設(shè)0-1總體中共有n個(gè)個(gè)體，其中取 “是”值的個(gè)

13、體有n1個(gè)，取“非”值的個(gè)體有n0個(gè)?，F(xiàn)從不放回地隨機(jī)抽取n個(gè) 個(gè)體，記x為取“是”值的個(gè)體數(shù)目，則其中恰有n 1 個(gè)個(gè)體取“是”值、且有 n0=n-n1個(gè)個(gè)體取“非”值的概率為： n n n n n n c cc nxp 0 0 1 1 1 （四）泊松分布泊松分布是稀有事件出現(xiàn)次數(shù)的理論分布模型，如自然災(zāi)害、意外事故、機(jī)器故障等事件出現(xiàn)的次數(shù)都近似地服從泊松分布。泊松分布概率模型為： e m mxp m ! 六、連續(xù)變量概率分布模型連續(xù)型隨機(jī)變量的取值范圍可以是數(shù)軸上的某個(gè)區(qū)間，也可以是整個(gè)數(shù)軸。由于它可以取無窮多個(gè)不同的數(shù)值，所以描述其概率分布的最完善方法是概率函數(shù)式。

14、在理論分析中，描述連續(xù)變量概率分布的最常用的概率函數(shù)式是概率分布密度函數(shù)。在統(tǒng)計(jì)分析推斷中，常用的連續(xù)隨機(jī)變量概率分布模型主要有均勻分布、正態(tài)分布、2分布、t分布和f分布等幾種。（一）均勻分布若隨機(jī)變量x在區(qū)間a,b 上服從均勻分布，則該隨機(jī)變量的概率密度函數(shù)為： .,0 ;, 1 bxax bxa ab xf f(x) a b x 圖3.4 均勻分布的概率密度曲線（二）正態(tài)分布若隨機(jī)變量x服從正態(tài)分布，則其概率密度函數(shù)就為： 2 2 2 2 1 x exf f(x) -3 -2 - + +2 +3 x 圖 3.5 正態(tài)分布的概率密度曲線（三）2分布分布若隨機(jī)變量z1、

15、z2、zn都服從標(biāo)準(zhǔn)正態(tài)分布 n(0,1)，且兩兩之間相互獨(dú)立，則這些標(biāo)準(zhǔn)正態(tài)變量的平方和x就服從2分布，其概率密度函數(shù)為： . 0,0 ; 0, 2 2 1 2 1 2 2 x xex n xf xn n f(x) n=1 n=4 n=10 n=20 0 x 圖 3.6 2分布的概率密度曲線（四）t分布若隨機(jī)變量z n(0,1)，x2(n)，且二者相互獨(dú)立，則: 服從學(xué)生氏t分布，概率密度函數(shù)為： nxzt 2 1 2 1 2 2 1 n n t n n n tf f(t) t分布正態(tài)分布 0 t 圖3.7 t分布的概率密度曲線（五）f分布若隨機(jī)變量xm2(m)，xn2(n)，旦

16、二者相互獨(dú)立，則：服從f分布，其概率密度函數(shù)為： nx mx x n m . 0,0 ; 0, 2 , 2 2 1 2 22 x xmxnx nm b nm xf nm m nm f(x) 0 x 圖3.8 f分布的概率密度曲線第四章分布特征測(cè)度一、分布中心二、離散程度三、偏度與峰度四、相關(guān)程度一、分布中心測(cè)度的意義（一）分布中心的概念所謂分布中心，就是指隨機(jī)變量的一切取值的散布中心。（二）測(cè)度分布中心的意義 1、隨機(jī)變量的分布中心是隨機(jī)變量一切取值的一個(gè)代表，可以用來反映其數(shù)值的一般水平。 2、隨機(jī)變量的分布中心可以揭示隨機(jī)變量一切取值的次數(shù)分布在直角坐標(biāo)系內(nèi)的集中

17、位置，可以用來反映隨機(jī)變量分布密度曲線的中心位置，即對(duì)稱中心或尖峰位置。二、分布中心測(cè)度指標(biāo) 用來測(cè)度隨機(jī)變量次數(shù)分布中心的指標(biāo)可以有多種，其中在統(tǒng)計(jì)分析推斷中常用的主要有算術(shù)平均數(shù)、中位數(shù)和眾數(shù)等幾種。（一一）算術(shù)平均數(shù)）算術(shù)平均數(shù) 1、定義算術(shù)平均數(shù)又稱算術(shù)均值，是隨機(jī)變量的所有觀測(cè)值總和與觀測(cè)值個(gè) 數(shù)的比值。 2、計(jì)算方法（1）簡(jiǎn)單算術(shù)平均數(shù)簡(jiǎn)單算術(shù)平均數(shù)適用于未分組整理的各個(gè)單個(gè)觀測(cè)數(shù)值，其計(jì)算公式為： n x x n i i 1 （一一）算術(shù)平均數(shù)）算術(shù)平均數(shù) （2）加權(quán)算術(shù)平均數(shù)加權(quán)算術(shù)平均數(shù)適用于已分組整理的次數(shù)分布數(shù)據(jù)，其計(jì)算公式為： n i i n i

18、ii f fx x 1 1 f f xx i n i i 1 （一一）算術(shù)平均數(shù)）算術(shù)平均數(shù) （3）算術(shù)平均數(shù)的變形算術(shù)平均數(shù)的變形調(diào)和平均數(shù)。調(diào)和平均數(shù)。對(duì)于由觀測(cè)變量的各個(gè)分組和各組變量總值順序排列所形成的分組數(shù)據(jù)。算術(shù) 平均數(shù)的公式需變換成調(diào)和平均數(shù)的形式：當(dāng)各組的變量總值mi相等時(shí)，就可簡(jiǎn)化為： n i i i n i i m x m x 1 1 1 n i i x n x 1 1 （一一）算術(shù)平均數(shù)）算術(shù)平均數(shù) 3 3、理論分布的算術(shù)平均數(shù)、理論分布的算術(shù)平均數(shù)數(shù)學(xué)期望數(shù)學(xué)期望（1）定義對(duì)于離散型隨機(jī)變量，假設(shè)有n個(gè)不同的取值，其中取某個(gè)數(shù)值xi的概率為pi，則該隨機(jī)變量的

19、數(shù)學(xué)期望可用算術(shù)平均數(shù)公式定義為：對(duì)于連續(xù)型隨機(jī)變量，仍可用算術(shù)平均數(shù)定義其數(shù)學(xué) 期望，不過因?yàn)檫B續(xù)變量求和要用定積分，所以定義中需要用定積分符號(hào)代替總和符號(hào)，即： n i ii pxxe 1 dxxxfxe （一一）算術(shù)平均數(shù)）算術(shù)平均數(shù) 3 3、理論分布的算術(shù)平均數(shù)、理論分布的算術(shù)平均數(shù)數(shù)學(xué)期望數(shù)學(xué)期望（2 2）例子）例子例如，對(duì)于服從兩點(diǎn)分布的隨機(jī)變量x，其不同的取值只有1和0，其中取1的概率為p，取0的概率為q=1-p，則其數(shù)學(xué)期望為：又如，對(duì)于服從位置參數(shù)為且尺度參數(shù)為2的正態(tài)分布的隨機(jī)變量x，由其概率密度函數(shù)可計(jì)算出其數(shù)學(xué)期望就是其位置參數(shù)。標(biāo)準(zhǔn)正態(tài)分布隨機(jī)變

20、量的數(shù)學(xué)期望為0。 pqppxxe n i ii 01 1 （一）算術(shù)平均數(shù) （3）數(shù)學(xué)期望的性質(zhì) 若c為常數(shù)，則必有：e(c)=c 若c為任意常數(shù)，x為隨機(jī)變量，則必有： e(cx)=ce(x) 若x1、x2、xm均為隨機(jī)變量，則必有： e(x1+x2+xm)=e(x1)+e(x2)+e(xm) 若x1、x2、xm均為隨機(jī)變量，且相互獨(dú)立，則： e(x1x2xm)=e(x1)e(x2)e(xm) 若x是隨機(jī)變量，則必有： e(x)e(x) （二）中位數(shù) 1 1、定義、定義中位數(shù)是在按觀測(cè)變量值的大小順序排列所形成的變量值數(shù)列中點(diǎn)位置上的變量值。對(duì) 于觀測(cè)變量x，假設(shè)共取得n個(gè)觀測(cè)值，各個(gè)

21、觀測(cè)值按大小順序排列為x(1)、x(2)、x(n)，則其中位數(shù)可定義為：為偶數(shù)。為奇數(shù)； nxx nx x nn n , 2 1 , 1 22 2 1 （二）中位數(shù) 2、組距分組次數(shù)分布數(shù)據(jù) 的中位數(shù)計(jì)算 w f f f ux w f f f lx m u m l 2 2 （三）眾數(shù) 1、定義：眾數(shù)是隨機(jī)變量的觀測(cè)值中出現(xiàn)次數(shù)或密度最大的變量觀測(cè)值。 2、組距分組次數(shù)分布數(shù)據(jù)計(jì)算眾數(shù) w ffff ff ux w ffff ff lx 1010 10 1010 10 f(x) x x x x f(x) x x x x 三三、均值、中位數(shù)和眾數(shù)三者、均值、中位數(shù)和眾數(shù)三者之間的關(guān)系

22、之間的關(guān)系對(duì)于對(duì)稱分布，有：對(duì)于右偏分布，有：對(duì)于左偏分布，有：經(jīng)驗(yàn)關(guān)系式： xxx xxx xxx xxxx 3 四、離散程度測(cè)度的意義離散程度測(cè)度的意義（一）離散程度的概念所謂離散程度，即觀測(cè)變量各個(gè)取值之間的差異程度。（二）離散程度測(cè)度的意義 1、通過對(duì)隨機(jī)變量取值之間離散程度的測(cè)定，可以反映各個(gè)觀測(cè)個(gè)體之間的差異大小，從而也就可以反映分布中心指標(biāo)對(duì)各個(gè)觀測(cè)變量值代表性的高低。 2、通過對(duì)隨機(jī)變量取值之間離散程度的測(cè)定，可以反映隨機(jī)變量次數(shù)分布密度曲線的瘦俏或矮胖程度。五、離散程度測(cè)度指標(biāo)離散程度測(cè)度指標(biāo) 可用來測(cè)度觀測(cè)變量值之間差異程度的指標(biāo)有很多，在統(tǒng)計(jì)分

23、析推斷中最常用的主要有極差、平均差和標(biāo)準(zhǔn)差等幾種。（一）極差極差又稱全距，是觀測(cè)變量的最大取值與最小取值之間的離差，也就是觀測(cè)變量的最大觀測(cè)值與最小觀測(cè)值之間的區(qū) 間跨度。極差的計(jì)算公式為： r=max(xi)-min(xi) （二）平均差平均差是隨機(jī)變量各個(gè)取值偏差絕對(duì) 值的算術(shù)平均數(shù)。由于所掌握數(shù)據(jù)形式的不同，平均差的計(jì)算有簡(jiǎn)單平均差和加權(quán)平均差兩種不同的方式。 n xx d n i i 1 n i i n i ii f fxx d 1 1 （三）標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差是隨機(jī)變量各個(gè)取值偏差平方的平均數(shù)的算術(shù)平方根，是最常用的反映隨機(jī)變量分布離散程度的指標(biāo)。標(biāo)準(zhǔn)差既

24、可以根據(jù)樣本數(shù)據(jù)計(jì)算，也可以根據(jù)觀測(cè)變量的理論分布計(jì)算，分別稱為樣本標(biāo)準(zhǔn)差和總體標(biāo)準(zhǔn)差。 1、樣本標(biāo)準(zhǔn)差的計(jì)算樣本標(biāo)準(zhǔn)差的計(jì)算（1)對(duì)于未分組整理的各個(gè)觀測(cè)變量值數(shù)據(jù)，計(jì)算標(biāo)準(zhǔn)差應(yīng)采用簡(jiǎn)單平均的方法。 (2)對(duì)于已分組整理的分組次數(shù)分布數(shù)據(jù)，計(jì)算標(biāo)準(zhǔn)差應(yīng)采用加權(quán)平均的方法。 n xx s n i i 1 2 n i i n i ii f fxx s 1 1 2 2、理論分布的標(biāo)準(zhǔn)差與方差理論分布的標(biāo)準(zhǔn)差與方差（1）定義標(biāo)準(zhǔn)差是最常用的理論分布模型正態(tài) 分布的參數(shù)之一，在理論分析中最常用來描述隨機(jī)變量分布的離散程度。標(biāo)準(zhǔn) 差的平方稱為方差，與標(biāo)準(zhǔn)差有著同樣的作用。隨機(jī)

25、變量x的理論分布的方差常記為var(x)或2，其定義為： 2=var(x)=ex-e(x)2 2、理論分布的標(biāo)準(zhǔn)差與方差理論分布的標(biāo)準(zhǔn)差與方差（2）離散隨機(jī)變量的方差對(duì)于離散隨機(jī)變量x，假設(shè)共有n個(gè)不同取值，取值xi的概率為pi，i =1、2、n，則方差為：例如，對(duì)于服從兩點(diǎn)分布的隨機(jī)變量x，其取值為1的概率為p，取值為0的概率為q=1-p, 數(shù)學(xué)期望為e(x)=p，則其方差為： var(x)=(1-p)2p+(0-p)2q=pq n i ii pxexxvar 1 2 2、理論分布的標(biāo)準(zhǔn)差與方差理論分布的標(biāo)準(zhǔn)差與方差（3）連續(xù)隨機(jī)變量的方差對(duì)于連續(xù)型隨機(jī)變量x，假設(shè)其分布密

26、度函數(shù)f(x)，則其方差的計(jì)算公式為：例如，對(duì)于服從位置參數(shù)為且尺度參數(shù)為 2的正態(tài)分布的隨機(jī)變量x，其數(shù)學(xué)期望等于其位置參數(shù)，其方差就是其尺度參數(shù)2，標(biāo) 準(zhǔn)正態(tài)分布的方差為1。 dxxfxexxvar 2 2、理論分布的標(biāo)準(zhǔn)差與方差理論分布的標(biāo)準(zhǔn)差與方差（4）方差的性質(zhì) 任何隨機(jī)變量的方差均非負(fù)。var(x)0 若c為常數(shù)，x為隨機(jī)變量，則有： var(cx)=c2var(x) 若隨機(jī)變量x1、x2、xm均相互獨(dú)立，則有： var(x1+x2+xm)=var(x1)+var(x2)+var(xm) 若x為隨機(jī)變量，c為任一常數(shù)，則有： e(x-c)2=ex-e(x)2+c-e(x)2

27、對(duì)于任意隨機(jī)變量x，均有： var(x)=e(x2)-e(x)2 （四）離散系數(shù) 1、離散系數(shù)的概念各個(gè)衡量隨機(jī)變量取值之間絕對(duì)差異的指標(biāo)與算術(shù)平均數(shù)的比率，通稱為離散系數(shù)。 2、計(jì)算離散系數(shù)的意義消除量綱和數(shù) 量級(jí)的差異，便于不同觀測(cè)變量之間的比較。 3、計(jì)算公式 %100 %100 %100 x s v x d v x r v s d r 六、測(cè)度偏度和峰度的意義（一）概念所謂偏度，就是觀測(cè)變量取值分布的非對(duì)稱程度；所謂峰度，就是觀測(cè)變量取值分布密度曲線頂部的平坦程度或尖峭程度。（二）意義 1、加深人們對(duì)觀測(cè)變量取值的散布狀況的認(rèn) 識(shí)； 2、將觀測(cè)變量的偏度和峰度

28、指標(biāo)值與某種理論分布的偏度和峰度指標(biāo)值進(jìn)行比較，以判斷觀測(cè)變量的分布與某種理論分布的近似程度。七、偏度的測(cè)度（一）直觀偏度系數(shù)一）直觀偏度系數(shù) 1、皮爾遜偏度系數(shù)皮爾遜偏度系數(shù) 2、鮑萊偏度系數(shù)鮑萊偏度系數(shù) s xx sk p lu lu b qq qxxq sk 七、偏度的測(cè)度（二）矩偏度系數(shù) 1、矩的定義原點(diǎn)矩和中心矩 2、矩偏度系數(shù) f fxx s f fx x m m m m 3 3 s s skm 八、峰度的測(cè)度矩峰度系數(shù)隨機(jī)變量的四階中心矩與其標(biāo)準(zhǔn)差的四次方相除，所得比率就稱為峰度系數(shù)，其計(jì)算公式為： 4 4 s s ku 九、相關(guān)程度測(cè)度的意義相關(guān)程度測(cè)度的意義

29、（一）相關(guān)關(guān)系的概念對(duì)于兩個(gè)觀測(cè)變量，若一個(gè)變量的取值除了受另一個(gè)變量取值的影響外，還受各種隨機(jī) 因素的影響，則變量間的這種非確定性關(guān)系就稱為相關(guān)關(guān)系。（二）相關(guān)關(guān)系測(cè)度的意義 1、了解兩個(gè)觀測(cè)變量之間相關(guān)關(guān)系的方向； 2、了解兩個(gè)觀測(cè)變量之間相互依賴關(guān)系的程度，為構(gòu)建觀測(cè)變量之間相互關(guān)系模型奠定基礎(chǔ)。十、相關(guān)程度測(cè)度的指標(biāo)相關(guān)程度測(cè)度的指標(biāo) 對(duì)兩隨機(jī)變量之間的相關(guān)關(guān)系及其密切程度進(jìn)行測(cè)度，需要根據(jù)兩變量觀測(cè)值的復(fù)合分組次數(shù)分布進(jìn)行，或在理論上根據(jù)兩變量的聯(lián)合概率分布模型進(jìn)行。測(cè)度觀測(cè)變量之間相關(guān)關(guān)系的指標(biāo)主要有協(xié)方差和相關(guān)系數(shù)兩個(gè)。（一）協(xié)方差 1、定義協(xié)方差是兩個(gè)隨

30、機(jī)變量成對(duì) 觀測(cè)值偏差乘積的算術(shù)平均數(shù) 。 2、樣本協(xié)方差 n i iixy yyxx n s 1 1 n i i n i iii xy f fyyxx s 1 1 （一）協(xié)方差 3、總體協(xié)方差對(duì)于兩隨機(jī)變量的理論分布，也可類似地定義其協(xié)方差。兩隨機(jī)變量x 和y的理論分布的協(xié)方差常記作cov(x,y)或xy，其定義公式為： xy=cov(x,y)=ex-e(x)y-e(y) 例如，對(duì)于聯(lián)合分布為二元正態(tài)分布的隨機(jī)變量x和y，可得二變量的協(xié)方差為： 2121 , dxdyyxfyxyxcov （一）協(xié)方差 4、協(xié)方差的性質(zhì) 隨機(jī)變量x與y的協(xié)方差和y與x的協(xié)方差相等。 cov(x, y)=

31、cov(y, x) 若隨機(jī)變量x和y相互獨(dú)立，則有：cov(x, y)=0 若1和2為任意常數(shù)，則有： cov(1x, 2y)=12cov(x, y) 對(duì)于任意三個(gè)隨機(jī)變量，均有： cov(x1+x2, y)=cov(x1, y )+cov(x2, y) cov(x, y1+y2)=cov(x, y1)+cov(x, y2) 對(duì)于任意兩隨機(jī)變量，均有： cov(x, y)=e(xy)-e(x)e(y) （二）相關(guān)系數(shù) 1、定義相關(guān)系數(shù)是兩個(gè)隨機(jī)變量的協(xié)方差對(duì)其兩標(biāo)準(zhǔn)差之積的比率。 2、總體相關(guān)系數(shù) 3、樣本相關(guān)系數(shù) yx xy yx xy ss s r （二）相關(guān)系數(shù) 4、相關(guān)系數(shù)的取值范

32、圍相關(guān)系數(shù)r的數(shù)值介于-1和+1之間，其絕對(duì)值介于0和1之間。即有： -1r+1 5、相關(guān)系數(shù)的作用（1）相關(guān)系數(shù)的符號(hào)可反映兩隨機(jī)變量相互依存關(guān)系的方向。相關(guān)系數(shù)為正，稱為正相關(guān)；相關(guān)系數(shù)為負(fù)，稱為負(fù)相關(guān)。（2）相關(guān)系數(shù)的絕對(duì)值的大小則可反映兩隨機(jī) 變量線性相關(guān)關(guān)系的密切程度。第五章參數(shù)估計(jì) 一、總體參數(shù)及其估計(jì)量二、構(gòu)造估計(jì)量的方法矩法估計(jì) 三、判斷估計(jì)量?jī)?yōu)劣的標(biāo)準(zhǔn) 四、估計(jì)量的標(biāo)準(zhǔn)誤五、抽樣分布的概念六、基本的抽樣分布七、區(qū)間估計(jì)的概念八、區(qū)間估計(jì)的方法九、樣本容量的確定一、總體參數(shù)及其估計(jì)量總體參數(shù)及其估計(jì)量總體指標(biāo)又稱為總體參數(shù)，根據(jù)樣本數(shù)據(jù)來推斷總

33、體指標(biāo)數(shù)值就稱為參數(shù)估計(jì)。集中了樣本中有關(guān)總體參數(shù)信息的樣本指標(biāo)稱為統(tǒng)計(jì)量，該統(tǒng)計(jì)量就可用來估計(jì)所求的總體指標(biāo)的數(shù)值。用來估計(jì)總體指標(biāo)數(shù)值的統(tǒng)計(jì)量又稱為該總體指標(biāo)的估計(jì)量，該估計(jì)量的數(shù)值就稱為該總體指標(biāo)的估計(jì)值。總體參數(shù)值是確定的，但是未知的；樣本估計(jì) 量是隨機(jī)變量，其估計(jì)值是某個(gè)給定樣本的計(jì) 算值。二、構(gòu)造估計(jì)量的方法構(gòu)造估計(jì)量的方法矩法估計(jì)矩法估計(jì) （一）矩法估計(jì)的概念所謂矩法估計(jì)，概括來說就是用樣本矩作為總體同一矩的估計(jì)量，用樣本矩的函數(shù)作為總體相應(yīng)矩同一函數(shù)的估計(jì)量。（二）常用的總體參數(shù)及其矩法估計(jì)量 n i i n i i x n n xnn n n pp x n

34、 x 1 1 1 1 yx xy n i i n i i ss s r xx n s xx n s 1 1 1 2 1 2 22 三、判斷估計(jì)量?jī)?yōu)劣的標(biāo)準(zhǔn)判斷估計(jì)量?jī)?yōu)劣的標(biāo)準(zhǔn) 為了保證用于估計(jì)總體指標(biāo)的估計(jì)量準(zhǔn) 確可靠，就必須要求所使用的估計(jì)量具備一些優(yōu)良的性質(zhì)，這些性質(zhì)就構(gòu)成了判斷一個(gè)估計(jì)量?jī)?yōu)劣的標(biāo)準(zhǔn)。常用的標(biāo)準(zhǔn)主要有一致性、無偏性、有效性、充分性和穩(wěn)健性等。（一）一致性對(duì)于總體指標(biāo)的一個(gè)估計(jì)量，若其取值隨著樣本容量的增大越來越接近于總體指標(biāo)的真值，即估計(jì)誤差越來越小的可能性越來越大直至 100%，則該估計(jì)量就稱為總體指標(biāo)的一致估計(jì) 量，或稱為相合估計(jì)量。可以證明，由矩估計(jì)

35、法所構(gòu)造出的估計(jì)量都是所估計(jì)總體指標(biāo)的一致估計(jì)量。如樣本均值是總體均值的一致估計(jì)量，樣本比例p是總體比例p的一致估計(jì)量，樣本方差s2也是總體方差 2的一致估計(jì)量。（二）無偏性對(duì)于總體指標(biāo)的一個(gè)估計(jì)量，若其估計(jì)值的數(shù)學(xué)期望等于該總體指標(biāo)的真值，即其估計(jì)誤差的數(shù)學(xué)期望為0，則該估計(jì)量就稱為是總體指標(biāo)的無偏估計(jì)量。可以證明，樣本均值是總體均值的無偏估計(jì)量，而常規(guī)樣本方差卻并不是總體方差2的無偏估計(jì)量，修正樣本方差s2是總體方差2的無偏估計(jì)量。修正樣本方差即無偏樣本方差為： n i i xx n s 1 2 2 1 1 （三）有效性對(duì)于任一總體指標(biāo)，若存在兩個(gè)無偏估計(jì)量，其中一

36、個(gè)估計(jì)量的估計(jì)誤差平均來說小于另一個(gè)估計(jì)量的估計(jì)誤差，則稱前一個(gè)估計(jì)量比后一個(gè)估計(jì)量有效。無偏估計(jì)量的估計(jì)誤差大小可用其方差衡量，所以兩個(gè)無偏估計(jì)量比較，方差較小者較為有效。對(duì)于一個(gè)總體指標(biāo)來說，若在其所有無偏估計(jì)量中能夠找到一個(gè)估計(jì)量，其方差最小，則該估計(jì)量就稱為是該總體指標(biāo)的最佳無偏估計(jì)量。可以證明，樣本均值是總體均值的最佳無偏估計(jì)量。對(duì)于有偏估計(jì)量，衡量其有效性可用均方誤差代替方差。估計(jì)量的均方誤差為： 2 emse （四）充分性對(duì)于一個(gè)總體指標(biāo)，若其估計(jì)量提取了樣本中包含的有關(guān)該總體指標(biāo)的全部信息，則此估計(jì)量就稱為該總體指標(biāo)的充分估計(jì)量。在多數(shù)情形下，矩法

37、估計(jì)給出的總體指標(biāo)的估計(jì)量均是充分的。如在正態(tài)分布總體之下，樣本均值是總體均值的充分估計(jì)量，樣本方差s2也是總體方差2的充分估計(jì)量。（五）穩(wěn)健性如果用來估計(jì)總體指標(biāo)的樣本估計(jì)量對(duì)樣本數(shù)據(jù)的污染不敏感，也就是說估計(jì)量的數(shù)值不受被污染數(shù)據(jù)的干擾或受其干擾不大，那么該估計(jì)量就是總體指標(biāo)的一個(gè)穩(wěn) 健估計(jì)量。實(shí)踐中常用的一種估計(jì)總體均值的穩(wěn)健估計(jì)量是切尾均值，切尾均值的計(jì)算公式為： 1 1 1 n nj j x n x 四、估計(jì)量的標(biāo)準(zhǔn)誤估計(jì)量的標(biāo)準(zhǔn)誤（一）標(biāo)準(zhǔn)誤的概念標(biāo)準(zhǔn)誤的概念樣本估計(jì)量的標(biāo)準(zhǔn)差通常稱為該估計(jì)量的標(biāo)準(zhǔn)誤差，簡(jiǎn)稱標(biāo)準(zhǔn)誤。即：標(biāo)準(zhǔn)誤是衡量一個(gè)估計(jì)量抽樣估計(jì)

38、誤差大小的一個(gè)尺度。 2 eevar （二）標(biāo)準(zhǔn)誤的計(jì)算標(biāo)準(zhǔn)誤的計(jì)算 1 1、樣本均值的標(biāo)準(zhǔn)誤、樣本均值的標(biāo)準(zhǔn)誤（1 1）放回抽樣）放回抽樣（2 2）不放回抽樣）不放回抽樣 n x n n n x 1 2 n s x n n n s x 1 2 （二）標(biāo)準(zhǔn)誤的計(jì)算標(biāo)準(zhǔn)誤的計(jì)算 2 2、樣本比例的標(biāo)準(zhǔn)誤、樣本比例的標(biāo)準(zhǔn)誤（1 1）放回抽樣）放回抽樣（2 2）不放回抽樣）不放回抽樣 n pp p 1 n n n pp p 1 1 n pp p 1 n n n pp p 1 1 （三）影響標(biāo)準(zhǔn)誤的因素（三）影響標(biāo)準(zhǔn)誤的因素 1、總體中各個(gè)體之間的差異程度?？傮w中各個(gè)體取值之間的差異程度大即

39、2也大，各總體指標(biāo)估計(jì)量的標(biāo)準(zhǔn)誤的數(shù)值也就大，抽樣估計(jì) 誤差也就大。 2、樣本容量的大小。樣本容量大，總體指標(biāo) 估計(jì)量的標(biāo)準(zhǔn)誤則小，抽樣估計(jì)誤差也就越??；反之，樣本容量越小，抽樣估計(jì)誤差及其標(biāo)準(zhǔn) 誤也就越大。 3、抽取樣本的方式方法。抽樣方式方法不同，總體指標(biāo)估計(jì)量的標(biāo)準(zhǔn)誤就會(huì)不同，抽樣估計(jì) 誤差的大小也就不同。五、抽樣分布的概念五、抽樣分布的概念對(duì)于給定的總體和抽樣方式以及樣本容量，樣本指標(biāo)取值的概率分布就稱為抽樣分布。確定樣本容量下的抽樣分布稱為樣本統(tǒng) 計(jì)量的精確分布，而樣本容量趨于無窮大時(shí)的抽樣分布則稱為樣本統(tǒng)計(jì)量的極限分布。六、基本的抽樣分布六、基本的抽樣分布 (

40、 (一一) )樣本均值的抽樣分布樣本均值的抽樣分布 1、任意總體大樣本 2、正態(tài)總體小樣本 n nx 2 , 1 ,0 n n x z 1 nt ns x t 六、基本的抽樣分布六、基本的抽樣分布 ( (二二) )樣本比例的抽樣分布樣本比例的抽樣分布大樣本 n pp pnp 1 , 1 , 0 1 n n pp pp z 六、基本的抽樣分布六、基本的抽樣分布（三）樣本方差的抽樣分布（三）樣本方差的抽樣分布正態(tài)總體正態(tài)總體 1 1 2 2 2 n sn 七、區(qū)間估計(jì)的概念七、區(qū)間估計(jì)的概念記總體指標(biāo)為，樣本估計(jì)量為，事先給定概率為1-，若根據(jù)樣本估計(jì)量的概率分布可計(jì) 算出一個(gè)區(qū)間，使得

41、該區(qū)間包含總體參數(shù) 的概率等于事先給定的概率1-，即有：成立，則該區(qū)間就稱為總體參數(shù)的置信區(qū)間，而概率1-就稱為是置信概率或置信度。 ul , 1 ul p ul , 八、區(qū)間估計(jì)的方法八、區(qū)間估計(jì)的方法（一）均值的區(qū)間估計(jì)（一）均值的區(qū)間估計(jì) 1 1、大樣本下均值的區(qū)間估計(jì)、大樣本下均值的區(qū)間估計(jì) 由中心極限定理可知，對(duì)于大樣本而言，樣本均值的概率分布總可近似地看作是正態(tài)分布。若事先給定置信概率為1-，則查標(biāo)準(zhǔn)正態(tài)分布概率數(shù)值表，可得標(biāo) 準(zhǔn)正態(tài)分布的上側(cè)分位數(shù)z/2，就可得出總體均值的置信區(qū)間為： n zx n zx 22 , （一）均值的區(qū)間估計(jì) 2、小樣本下正態(tài)總體均值的

42、區(qū)間估計(jì) 對(duì)于來自正態(tài)總體的一個(gè)小樣本，在給定的置信概率1-之下，查自由度為（n-1）的t分布表，可得t分布的上側(cè)分位數(shù)t/2，可得總體均值的置信區(qū)間為： n tx n tx 22 , （二）比例的區(qū)間估計(jì)（二）比例的區(qū)間估計(jì) 總體比例是兩點(diǎn)分布總體的均值，其估計(jì)量樣本比例則是來自該總體的隨機(jī)樣本的均值。因此，在大樣本條件下，可根據(jù)中心極限定理用類似于大樣本情形下總體均值區(qū)間估計(jì)的方法來對(duì)總體比例進(jìn)行區(qū)間估計(jì)。有： n pp zp n pp zp 1 , 1 22 （三）（三）方差的區(qū)間估計(jì)方差的區(qū)間估計(jì) 由抽樣分布理論可知，對(duì)于來自正態(tài)總體的一個(gè)簡(jiǎn)單隨機(jī)樣本，其修正樣本方差

43、s2 與總體方差2比值的（n-1）倍服從自由度為（n-1）的2分布。若給定置信概率 1-，查自由度為（n-1）的2分布表可得兩個(gè)分位數(shù)1-/2和/2，則可得正態(tài) 總體方差2的置信區(qū)間為： 2 21 2 2 2 2 1 , 1 snsn （四）（四）單側(cè)置信區(qū)間單側(cè)置信區(qū)間所謂單側(cè)置信區(qū)間，是將待估總體指標(biāo)的上置信限或下置信限指定在其上界或下界值上，并根據(jù)給定的置信概率求出另一置信限而得到的置信區(qū)間。記待估計(jì)總體指標(biāo)為，其取值上界為，取值下界為，樣本估計(jì)量為，對(duì)于給定的置信概率1-，若有：或者，有：則稱區(qū)間和為總體指標(biāo)的單側(cè)置信區(qū)間。 u l 1 ul p 1 u

44、l p ul , ul , 九、樣本容量的確定九、樣本容量的確定若在給定1-的置信概率之下，要求用樣本均值估計(jì)總體均值的抽樣估計(jì)誤差不超過，則由總體均值的抽樣估計(jì)誤差限的計(jì)算公式，可計(jì)算出必需最小樣本容量。（一）放回抽樣（二）不放回抽樣 2 22 2 0 z n n n n n z z zn nz n 0 0 222 2 222 2 22 2 2 22 2 1 1 1 第六章第六章假設(shè)檢驗(yàn)假設(shè)檢驗(yàn) 一、假設(shè)檢驗(yàn)的原理二、總體指標(biāo)假設(shè)檢驗(yàn) 三、分布假設(shè)檢驗(yàn) 四、假設(shè)檢驗(yàn)的兩類錯(cuò)誤及功效一、假設(shè)檢驗(yàn)的原理（一）統(tǒng)計(jì)假設(shè)和檢驗(yàn)統(tǒng)計(jì)量所謂統(tǒng)計(jì)假設(shè)，就是關(guān)于總體分布特征的某種論斷。

45、關(guān)于總體參數(shù)假設(shè)的檢驗(yàn)，是假設(shè)檢驗(yàn)的核心內(nèi)容。記總體參數(shù)為，若要判斷是否等于某已知數(shù)值0，則該參數(shù)假設(shè)可表示為： h0:=0， h1:0 其中，假設(shè)h0:=0就是所要檢驗(yàn)的假設(shè)，稱為原假設(shè)或零假設(shè)；而假設(shè)h1:0則稱為對(duì)立假設(shè)或備擇假設(shè)。要檢驗(yàn)?zāi)硞€(gè)假設(shè)是否正確，需根據(jù)樣本所提供的信息來進(jìn)行。包含總體分布特征的全部樣本信息的樣本指標(biāo)，是進(jìn)行假設(shè)檢驗(yàn)的依據(jù)，稱為檢驗(yàn)統(tǒng)計(jì)量。（二）顯著性水平和拒絕（二）顯著性水平和拒絕域域進(jìn)行假設(shè)檢驗(yàn)，概率論中關(guān)于小概率事件在一次試驗(yàn)中是不可能事件的原則是其所遵循的基本原則。通常取小概率事件的概率臨界值為0.05或 0.01，用表示，稱為假設(shè)

46、檢驗(yàn)的顯著性水平。在原假設(shè)成立的條件下，由檢驗(yàn)統(tǒng)計(jì)量的概率分布，對(duì)于給定的顯著性水平，就可確定出由抽樣誤差引起的樣本估計(jì)值對(duì)總體參數(shù)原假設(shè)值的可能的最大偏離值，作為判斷原假設(shè)正確與否的臨界值。樣本估計(jì)量偏離總體參數(shù)原假設(shè)值過大的區(qū)域，就是否定原假設(shè)的區(qū)域，稱為否定域或拒絕域，而否定域以外的區(qū)域則稱為接受域。（二）顯著性水平和拒絕（二）顯著性水平和拒絕域域 1、雙側(cè)檢驗(yàn) 若要檢驗(yàn)的假設(shè)為： h0:=0， h1:0 則否定域應(yīng)建立在與原假設(shè)值的正負(fù)偏離超出給定臨界值的兩邊，這種檢驗(yàn)方法稱為雙側(cè)檢驗(yàn)。 f /2 /2 0 拒絕域 l 2 接受域 u 2 拒絕域（二）顯著性

47、水平和拒絕域（二）顯著性水平和拒絕域 2、左側(cè)檢驗(yàn) 若要檢驗(yàn)的假設(shè)為： h0:0， h1:0 則否定域應(yīng)建立在與原假設(shè)值的負(fù) 偏離超出給定臨界值的一邊，這種檢驗(yàn)方法稱為左側(cè)檢驗(yàn)。 f 0 拒絕域 l 接受域（二）顯著性水平和拒絕域（二）顯著性水平和拒絕域 3、右側(cè)檢驗(yàn) 若要檢驗(yàn)的假設(shè)為： h0:0， h1:0 則否定域應(yīng)建立在與原假設(shè)值的正偏離超出給定臨界值的一邊，這種檢驗(yàn)方法稱為右側(cè)檢驗(yàn)。 f 0 接受域 u 拒絕域（三）假設(shè)檢驗(yàn)的（三）假設(shè)檢驗(yàn)的p值值檢驗(yàn)統(tǒng)計(jì) 量的取值落在其實(shí) 際樣本值之外的概率，就稱為假設(shè)檢驗(yàn)的p值。 f p 0 u s （四）假設(shè)檢驗(yàn)

48、的程序（四）假設(shè)檢驗(yàn)的程序 (1)提出原假設(shè)h0和備擇假設(shè)h1； (2)規(guī)定檢驗(yàn)的顯著性水平； (3)構(gòu)造用于檢驗(yàn)的樣本指標(biāo)，即檢驗(yàn)統(tǒng)計(jì)量； (4)在原假設(shè)為真的假定下，根據(jù)檢驗(yàn)統(tǒng)計(jì)量的概率分布，確定出檢驗(yàn)統(tǒng)計(jì)量的臨界值，并由此臨界值構(gòu)造出檢驗(yàn)的拒絕域和接受域；或者計(jì)算出假設(shè)檢驗(yàn)的p值； (5)比較檢驗(yàn)統(tǒng)計(jì)量的實(shí)際樣本值與其臨界值，或者比較檢驗(yàn)的p值與顯著性水平，并根據(jù)比較的結(jié)果做出拒絕或不能拒絕原假設(shè)的決策。二、總體指標(biāo)假設(shè)檢驗(yàn)二、總體指標(biāo)假設(shè)檢驗(yàn) （一）均值的檢驗(yàn)（一）均值的檢驗(yàn) 1 1、單一總體均值的檢驗(yàn)、單一總體均值的檢驗(yàn) h0:=0，h1:0或0或0 （1）大樣本情形正態(tài)

49、分布z檢驗(yàn) （2）小樣本情形（正態(tài)總體）t檢驗(yàn) 1 , 0 0 n n x z 1 0 nt ns x t （一）均值的檢驗(yàn)（一）均值的檢驗(yàn) 2 2、兩總體均值的比較、兩總體均值的比較 h0:1=2，h1:12或12或12 （1）大樣本情形正態(tài)分布z檢驗(yàn) （2）小樣本情形（正態(tài)總體）t檢驗(yàn) 其中s2為用自由度加權(quán)的兩樣本方差的平均數(shù)。 1 ,0 2 2 2 1 2 1 2121 n nn xx z 2 11 21 21 2121 nnt nn s xx t （二）比例的檢驗(yàn)（二）比例的檢驗(yàn) 1 1、單一總體比例的檢驗(yàn)、單一總體比例的檢驗(yàn) 大樣本（1）假設(shè) h0: p=p0 , h1: pp0

50、或pp0 或pp2 或p10，使用z檢驗(yàn)法，可得： 2 01 2 2 zz n 第七章方差分析一、方差分析的概念二、方差分析的意義三、單因子數(shù)據(jù)結(jié)構(gòu)模型三、單因子數(shù)據(jù)結(jié)構(gòu)模型四、模型參數(shù)的估計(jì)四、模型參數(shù)的估計(jì) 五、單因子方差分析表五、單因子方差分析表六、各水平效應(yīng)的多重比較六、各水平效應(yīng)的多重比較七、隨機(jī)區(qū)組試驗(yàn)與多因素方差分析的特點(diǎn) 一、方差分析的概念在科學(xué)實(shí)驗(yàn)和生產(chǎn)經(jīng)營(yíng)活動(dòng)中，人們常常需要對(duì)影響所觀測(cè)變量的各種主要因素進(jìn) 行分析，以便找出各個(gè)因素在什么狀態(tài)下可使所觀測(cè)的變量取得最佳數(shù)值。為此，首先需要在各種主要影響因素的不同狀態(tài) 下對(duì)所研究變量的取值進(jìn)行觀測(cè)，然

51、后再對(duì)觀測(cè)所得數(shù)據(jù)進(jìn)行比較分析。方差分析就是分析推斷各種因素狀態(tài)對(duì)所觀測(cè)變量的影響效應(yīng)的一種統(tǒng)計(jì)分析方法。二、方差分析的意義首先，需要確定的是一個(gè)因子的各個(gè)水平的作用是否相同。如果相同，說明這個(gè)因子不管取哪種水平對(duì)觀測(cè)變量無不同影響，那么這個(gè)因子實(shí)際上無關(guān)緊要，可納入平均效應(yīng)中去，這時(shí)稱這個(gè) 因子是不顯著的。自然，如果一個(gè)因子的各個(gè)水平的作用不同，那么這時(shí)就稱此因子是顯著的。其次，如果所考察的因子是顯著的，那么就要找出該因子的最佳水平或者各個(gè)顯著因子的各種水平的最佳配合，以指導(dǎo)生產(chǎn)經(jīng)營(yíng)的實(shí)踐活動(dòng)。三、單因子數(shù)據(jù)結(jié)構(gòu)模型三、單因子數(shù)據(jù)結(jié)構(gòu)模型假設(shè)所考察的因子為a，有m

52、個(gè)不同的水平a1， a2，am。在各個(gè)水平下分別進(jìn)行了n1,n2,nm次獨(dú)立實(shí)驗(yàn)觀測(cè)，得到變量觀測(cè)值為yij，i1,2,m， j1,2,ni，則有數(shù)據(jù)結(jié)構(gòu)模型為： yij=+i+ij；i1,2,m；j1,2,ni. 或者寫為： yij=i+ij ；i1,2,m；j1,2,ni. 其中為平均效應(yīng)，i為因子a的第i個(gè)水平ai對(duì)觀測(cè) 變量的作用，稱為水平ai的效應(yīng)，i=+i為在水平 ai下觀測(cè)變量的總體平均值，ij仍表示實(shí)驗(yàn)觀測(cè)的隨機(jī)誤差。四、模型參數(shù)的估計(jì)四、模型參數(shù)的估計(jì) （一）總均值和組均值（二）模型參數(shù)的矩估計(jì) i n j ij i i y n y 1 1 m i ii m i n

53、j ij yn n y n y i 111 11 yy y y ii ii m i n j iije i yy mn s 11 2 22 1 五、單因子方差分析表五、單因子方差分析表（一）檢驗(yàn)的假設(shè) h0: 12m=0 h1: 至少i0 或 h0: 12m h1: 至少ik （二）總變動(dòng)平方和的分解 sstssasse 即： m i n j iij m i ii m i n j ij ii yyyynyy 11 2 1 2 11 2 五、單因子方差分析表五、單因子方差分析表（三）方差分析表的構(gòu)造（四）檢驗(yàn)方法f檢驗(yàn)（單側(cè)）單因子方差分析表方差來源平方和自由度均方 f 值 p 值

54、組間組內(nèi) ssa sse m-1 n-m ssa/(m-1) sse/(n-m) f p 總和 sst n-1 mnmf mnsse mssa s s f e a , 1 1 2 2 六、各水平效應(yīng)的多重比較六、各水平效應(yīng)的多重比較（一）檢驗(yàn)假設(shè) h0:ik h1: ik 或 h0: ik h1: ik （二）檢驗(yàn)方法t檢驗(yàn)（雙側(cè)） mnt nn s yy t ki e kiki 11 七、多因子方差分析的特點(diǎn) 一、隨機(jī)區(qū)組試驗(yàn)的特點(diǎn)及其數(shù)據(jù)分析試驗(yàn)單位之間存在較大的差異二、多因子方差分析的特點(diǎn) 不同因子的水平組合可能存在交互作用第八章回歸分析一、回歸的概念與回歸模型的確定回

55、歸的概念與回歸模型的確定二二、樣本觀測(cè)模型和樣本回歸函數(shù)、樣本觀測(cè)模型和樣本回歸函數(shù) 三、一元線性回歸分析三、一元線性回歸分析四、多元線性回歸分析四、多元線性回歸分析五、回歸診斷五、回歸診斷一、回歸的概念與模型確定設(shè)隨機(jī)變量y與變量x1、x2、xk之間存在相關(guān) 關(guān)系，則y與x1、x2、xk的數(shù)學(xué)模型可表示為： yf(x1，x2，xk)u 其中u為隨機(jī)因素影響，若自變量x1、x2、xk的值給定時(shí)，隨機(jī)影響u的期望為0，則因變量y的條件數(shù) 學(xué)期望就是唯一確定的，即有： e(y/x)f(x1、x2、xk) 此條件期望就稱為y的回歸值，表示y的回歸值與自變量關(guān)系的函數(shù)式就稱為y的回歸函數(shù)

56、。若自變量只有一個(gè)，則稱為一元回歸函數(shù)；若自變量有兩個(gè)或多個(gè)，則稱為多元回歸函數(shù)。一、回歸的概念與模型確定回歸的概念與模型確定回歸模型的確定方法有二：（一）定性分析（二）線性近似實(shí)踐中，常用的回歸函數(shù)為線性函數(shù)，相應(yīng)的數(shù)學(xué)模型的形式為： y01x12x2kxku 其中0、1、2、k統(tǒng)稱為回歸系數(shù)，因變量y對(duì)自變量x1、x2、xk的回歸函數(shù)為： e(y/x)01x12x2kxk 二、樣本觀測(cè)模型和樣本回歸函數(shù)二、樣本觀測(cè)模型和樣本回歸函數(shù) 設(shè)樣本觀測(cè)值為(yj，x1j，x2j，xkj)， j1,2,n，則對(duì)于線性模型來說，有： yj01x1j2x2jkxkjuj ， j1，n.

57、這n個(gè)關(guān)系式稱為因變量y的觀測(cè)模型。由此觀測(cè)模型可估計(jì)得出模型中各個(gè)參數(shù)的估計(jì)值，從而得出樣本回歸函數(shù)為： kk xxxy 22110 三、一元線性回歸分析（一）散點(diǎn)圖設(shè)樣本觀測(cè)值分別為(x 1 y1)、(x2， y2)、(xn，yn)，在平面直角坐標(biāo)系內(nèi) 將這n對(duì)觀測(cè)值用n個(gè)點(diǎn)表示出來，所形成的圖形稱為散點(diǎn)圖。通過觀察散點(diǎn)圖的形狀,可輔助判斷回歸函數(shù)的具體形式。一元線性回歸模型的形式為： y01xu （二）模型參數(shù)的最小二乘估模型參數(shù)的最小二乘估計(jì)計(jì) 1、最小二乘估計(jì)的原理所謂最小二乘估計(jì)，就是尋找使樣本觀測(cè) 模型的隨機(jī)誤差平方和最小的參數(shù)值作為回歸模型參數(shù)的估計(jì)值。 2

58、、求一元線性回歸模型系數(shù)的正規(guī)方程組 xyxx yxn 2 10 10 （二）模型參數(shù)的最小二乘估模型參數(shù)的最小二乘估計(jì)計(jì) 3、回歸系數(shù)的最小二乘估計(jì)公式 4、樣本回歸方程 xy xxn yxxyn 10 2 2 1 xy 10 （二）模型參數(shù)的最小二乘估模型參數(shù)的最小二乘估計(jì)計(jì) 5、殘差與殘差平方和的計(jì)算 6、回歸模型隨機(jī)誤差的方差的估計(jì) jjjjj xyyye 10 xyyyeq n j j10 2 1 2 2 22 n q s e （三）（三）回歸的方差分析回歸的方差分析 1、因變量總變動(dòng)平方和的分解即： sst=ssr+sse 2、判定系數(shù) n j jj n j j n j j

59、yyyyyy 1 2 1 2 1 2 2 2 2 yy yy sst ssr r （三）（三）回歸的方差分析回歸的方差分析 3、一元線性一元線性回歸的方差分析表回歸的方差分析表 4、檢驗(yàn)假設(shè) h0:=0，h1:0 5、檢驗(yàn)方法f檢驗(yàn) 方差來源平方和自由度均方f值 p值回歸殘差 ssr sse 1 n-2 ssr sse/(n-2) fp 總和sstn-1 2, 1 2 nf nsse ssr f （四）（四）回歸系數(shù)的回歸系數(shù)的t檢驗(yàn)檢驗(yàn) 1、檢驗(yàn)的假設(shè) h0: 1=0 ， h1: 10 h0: 0=0 ， h1: 00 2、檢驗(yàn)的方法t檢驗(yàn) 2 11 1 1 xx s t e 2 2

60、 00 0 1 xx x n s t e （五）利用回歸直線進(jìn)行預(yù)測(cè)（五）利用回歸直線進(jìn)行預(yù)測(cè) 所謂預(yù)測(cè)就是在給定自變量x的數(shù)值的條件下，估計(jì)因變量y的數(shù)值，有點(diǎn)預(yù)測(cè)和區(qū)間預(yù)測(cè)兩種。 1、點(diǎn)預(yù)測(cè)點(diǎn)預(yù)測(cè) 2、區(qū)間預(yù)測(cè)區(qū)間預(yù)測(cè) pp xy 10 2 2 2 2 2 2 1 1 1 1 xx xx n sty xx xx n sty y p ep p ep p （六）一元線性回歸模型的推（六）一元線性回歸模型的推廣廣實(shí)踐中，有時(shí)用線性模型來描述變量x和y之間的關(guān)系并不恰當(dāng)，這時(shí)就需要考慮各種曲線模型。對(duì)于有些曲線模型來說，容易將它們化成下面的形式： g(y)=0+1h(x)+u 若仍假

人人文庫> 全部分類> 生活休閑 > 科普知識(shí)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

商務(wù)統(tǒng)計(jì)學(xué)習(xí)講座

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

商務(wù)統(tǒng)計(jì)學(xué)習(xí)講座

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔