商務(wù)統(tǒng)計(jì)學(xué)PPT課件_第1頁
商務(wù)統(tǒng)計(jì)學(xué)PPT課件_第2頁
商務(wù)統(tǒng)計(jì)學(xué)PPT課件_第3頁
商務(wù)統(tǒng)計(jì)學(xué)PPT課件_第4頁
商務(wù)統(tǒng)計(jì)學(xué)PPT課件_第5頁
已閱讀5頁,還剩241頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、前言 一、商務(wù)統(tǒng)計(jì)課程的性質(zhì) 二、商務(wù)統(tǒng)計(jì)學(xué)習(xí)的方法第1頁/共246頁一、商務(wù)統(tǒng)計(jì)課程的性質(zhì) 1、商務(wù)統(tǒng)計(jì)是全面系統(tǒng)論述商務(wù)與經(jīng)濟(jì)統(tǒng)計(jì)活動(dòng)全過程中所用統(tǒng)計(jì)理論與方法的綜合性課程,在調(diào)查分析師證書系列課程中是具有提綱挈領(lǐng)作用的一門課程。 2、商務(wù)統(tǒng)計(jì)課程的內(nèi)容都是碩士研究生入學(xué)考試必考的內(nèi)容,是任何一個(gè)統(tǒng)計(jì)人員和調(diào)查分析人員都必須掌握的統(tǒng)計(jì)學(xué)的核心知識(shí)。第2頁/共246頁二、商務(wù)統(tǒng)計(jì)學(xué)習(xí)的方法 1、商務(wù)統(tǒng)計(jì)是一門應(yīng)用性統(tǒng)計(jì)學(xué)課程,在學(xué)習(xí)過程中應(yīng)注重各種基本概念的含義和各種方法的基本原理與應(yīng)用,要掌握每種方法的使用條件、計(jì)算步驟、以及結(jié)果的意義與解釋。 2、要在理解和領(lǐng)會(huì)中記憶和掌握課程的內(nèi)容。如

2、對(duì)于各種統(tǒng)計(jì)分布的復(fù)雜的密度函數(shù)公式就不需記憶,但卻需要熟練掌握其概念定義以及分布函數(shù)表的使用方法。第3頁/共246頁第一章 緒論 一、統(tǒng)計(jì)學(xué)的性質(zhì) 二、統(tǒng)計(jì)學(xué)的作用 三、統(tǒng)計(jì)學(xué)的基本概念 四、統(tǒng)計(jì)指標(biāo)體系的設(shè)計(jì)第4頁/共246頁一、統(tǒng)計(jì)學(xué)的性質(zhì) (一)統(tǒng)計(jì)活動(dòng)的內(nèi)容與階段 對(duì)各種數(shù)據(jù)資料的搜集、整理、分析和推斷的活動(dòng)過程稱為統(tǒng)計(jì)活動(dòng),一項(xiàng)完整的統(tǒng)計(jì)活動(dòng)過程可分為統(tǒng)計(jì)資料的搜集整理和統(tǒng)計(jì)資料的分析推斷兩大階段。 (二)統(tǒng)計(jì)學(xué)的定義與分科 統(tǒng)計(jì)學(xué)就是關(guān)于數(shù)據(jù)資料的搜集、整理、分析和推斷的科學(xué)。關(guān)于統(tǒng)計(jì)資料的搜集整理和分析推斷的理論與方法構(gòu)成了統(tǒng)計(jì)學(xué)的全部?jī)?nèi)容。 (1)理論統(tǒng)計(jì)學(xué)與應(yīng)用統(tǒng)計(jì)學(xué) (2

3、)描述統(tǒng)計(jì)學(xué)與推斷統(tǒng)計(jì)學(xué)第5頁/共246頁二、統(tǒng)計(jì)學(xué)的作用 (一)統(tǒng)計(jì)學(xué)在科學(xué)研究中的作用提出假說并判定假說的正確與否 (二)統(tǒng)計(jì)學(xué)在生產(chǎn)中的作用通過試驗(yàn)分析找出最佳工藝,并對(duì)生產(chǎn)過程進(jìn)行統(tǒng)計(jì)質(zhì)量控制。 (三)統(tǒng)計(jì)學(xué)在管理中的作用抽樣調(diào)查了解社會(huì)與市場(chǎng),為決策提供依據(jù);并可建立各種社會(huì)與經(jīng)濟(jì)發(fā)展模型,定量地模擬社會(huì)與經(jīng)濟(jì)的運(yùn)行,既可分析社會(huì)與經(jīng)濟(jì)的發(fā)展及其結(jié)構(gòu)變化,又可進(jìn)行政策效果的評(píng)價(jià)。第6頁/共246頁三、統(tǒng)計(jì)學(xué)的基本概念 (一)總體和個(gè)體 組成統(tǒng)計(jì)活動(dòng)研究對(duì)象的全部事物的全體集合,就稱為統(tǒng)計(jì)總體,簡(jiǎn)稱總體或母體;而總體中的各個(gè)事物則稱為個(gè)體,總體中個(gè)體的數(shù)量稱為總體容量。 1、自然物體總

4、體與人為劃定個(gè)體的總體; 2、有限總體與無限總體; 3、具體總體與設(shè)想總體(抽象總體)。第7頁/共246頁三、統(tǒng)計(jì)學(xué)的基本概念(二)統(tǒng)計(jì)指標(biāo)及其測(cè)度 用來測(cè)度統(tǒng)計(jì)活動(dòng)研究對(duì)象某種特征數(shù)量的概念稱為統(tǒng)計(jì)指標(biāo),簡(jiǎn)稱指標(biāo)。其中,測(cè)度總體特征數(shù)量的概念稱為總體指標(biāo),而測(cè)度個(gè)體特征數(shù)量的概念則稱為個(gè)體指標(biāo)。 指標(biāo)的測(cè)度計(jì)量尺度有(1 1)定類尺度,(2)定序尺度,(3)定距尺度,(4)定比尺度 。第8頁/共246頁三、統(tǒng)計(jì)學(xué)的基本概念(三)樣本和統(tǒng)計(jì)推斷 1、樣本從總體中隨機(jī)抽出的部分個(gè)體所組成的集合稱為樣本或子樣,樣本中所含個(gè)體的數(shù)目稱為樣本容量。 2、統(tǒng)計(jì)推斷根據(jù)樣本觀測(cè)資料來對(duì)總體的分布狀況和分布

5、特征進(jìn)行推斷。 3、樣本數(shù)據(jù)的分類(1)橫截面數(shù)據(jù),(2)時(shí)間序列數(shù)據(jù)。 第9頁/共246頁四、 統(tǒng)計(jì)指標(biāo)體系及其設(shè)計(jì)(一)統(tǒng)計(jì)指標(biāo)體系的定義 反映總體及其所含個(gè)體的各個(gè)方面特征數(shù)量的一系列相互聯(lián)系、相互補(bǔ)充的統(tǒng)計(jì)指標(biāo)所形成的體系,稱為統(tǒng)計(jì)指標(biāo)體系。 (二)構(gòu)建統(tǒng)計(jì)指標(biāo)體系的意義第10頁/共246頁(三)指標(biāo)體系中指標(biāo)的分類 1、水平指標(biāo)(1)存量指標(biāo)與流量指標(biāo),(2)實(shí)物指標(biāo)與價(jià)值指標(biāo)。 2、比率指標(biāo)(1)比例相對(duì)指標(biāo),(2)比值相對(duì)指標(biāo),(3)動(dòng)態(tài)相對(duì)指標(biāo),(4)彈性相對(duì)指標(biāo),(5)強(qiáng)度相對(duì)指標(biāo)。第11頁/共246頁(四)指標(biāo)體系設(shè)計(jì)的內(nèi)容1 1、確定統(tǒng)計(jì)指標(biāo)體系的框架;2 2、確定每一個(gè)

6、指標(biāo)的內(nèi)涵和外延;3 3、確定每個(gè)統(tǒng)計(jì)指標(biāo)的計(jì)量單位; 4 4、確定每個(gè)統(tǒng)計(jì)指標(biāo)的計(jì)算方法。 第12頁/共246頁(五)指標(biāo)體系設(shè)計(jì)的原則1、目的性原則2、科學(xué)性原則3、可行性原則4、聯(lián)系性原則第13頁/共246頁第二章 數(shù)據(jù)采集與整理 一、數(shù)據(jù)采集的方式與程序 二、現(xiàn)場(chǎng)調(diào)查 三、試驗(yàn)觀測(cè) 四、數(shù)據(jù)的整理顯示第14頁/共246頁一、數(shù)據(jù)采集的方式與程序(一)數(shù)據(jù)采集根據(jù)統(tǒng)計(jì)指標(biāo)體系的要求,對(duì)所研究總體中個(gè)體的相應(yīng)指標(biāo)進(jìn)行觀測(cè)記錄取得數(shù)據(jù)的活動(dòng)過程。(二)數(shù)據(jù)采集活動(dòng)的基本要求采集到的數(shù)據(jù)資料要具有代表性和真實(shí)性。所謂代表性,是要求所觀測(cè)到的樣本必須對(duì)所研究總體具有代表性;而所謂真實(shí)性,則是要求

7、所采集到的數(shù)據(jù)必須是真實(shí)的實(shí)際數(shù)據(jù)。(三)數(shù)據(jù)采集方式的分類現(xiàn)場(chǎng)調(diào)查和試驗(yàn)觀測(cè) 第15頁/共246頁一、數(shù)據(jù)采集的方式與程序 (四)數(shù)據(jù)采集的程序 1、制定數(shù)據(jù)采集方案包括(1)采集數(shù)據(jù)的目的,(2)采集總體和觀測(cè)單位,(3)觀測(cè)指標(biāo)數(shù)值登記表,(4)采集方式和組織,(5)采集時(shí)間和期限。 2、現(xiàn)場(chǎng)觀測(cè)登記 3、數(shù)據(jù)整理顯示第16頁/共246頁二、現(xiàn)場(chǎng)調(diào)查 (一)調(diào)查的取樣方式 1、隨機(jī)抽樣調(diào)查 (1)簡(jiǎn)單隨機(jī)抽樣,(2)系統(tǒng)抽樣, (3)分層抽樣,(4)整群抽樣。 2、非隨機(jī)抽樣調(diào)查 (1)任意抽樣,(2)立意抽樣, (3)配額抽樣。 3、概率抽樣和非概率抽樣的特點(diǎn)比較第17頁/共246頁二

8、、現(xiàn)場(chǎng)調(diào)查(二)現(xiàn)場(chǎng)調(diào)查的觀測(cè)方式 1、訪問法 (1)口頭訪問當(dāng)面訪問或電話訪問 (2)書面訪問郵局或互聯(lián)網(wǎng)郵件傳遞,以及登門送收 2、觀察法第18頁/共246頁二、現(xiàn)場(chǎng)調(diào)查 (三)現(xiàn)場(chǎng)調(diào)查的問卷設(shè)計(jì) 1、提問方式 (1)封閉型提問 (2)開放型提問 2、提問次序第19頁/共246頁三、 試驗(yàn)觀測(cè) (一)試驗(yàn)觀測(cè)設(shè)計(jì)的原則 1、均衡分散性原則 2、整齊可比性原則 (二)試驗(yàn)觀測(cè)的方法 1、完全隨機(jī)試驗(yàn)觀測(cè) 2、隨機(jī)區(qū)組試驗(yàn)觀測(cè) 3、拉丁方試驗(yàn)觀測(cè) 4、正交試驗(yàn)觀測(cè)第20頁/共246頁四、數(shù)據(jù)整理與顯示 (一)構(gòu)建觀測(cè)資料數(shù)據(jù)庫的意義與方法 (二)觀測(cè)數(shù)據(jù)的分類顯示 1、觀測(cè)個(gè)體的分類 (1)分

9、類的功能與原則 (2)分類的方法 2、統(tǒng)計(jì)表的編制 (1)統(tǒng)計(jì)表的構(gòu)成 (2)統(tǒng)計(jì)表的編制規(guī)則內(nèi)容安排科學(xué)合理,形式設(shè)計(jì)簡(jiǎn)練美觀。第21頁/共246頁第三章 次數(shù)分布 一、次數(shù)分布的概念 二、次數(shù)分布表及其編制 三、次數(shù)分布圖 四、次數(shù)分布的理論模型及其表示方法 五、離散變量概率分布模型 六、連續(xù)變量概率分布模型第22頁/共246頁一、次數(shù)分布的概念 (一)次數(shù)分布:觀測(cè)變量的各個(gè)不同取值及其出現(xiàn)次數(shù)的順序排列,稱為變量的次數(shù)分布。 (二)總體次數(shù)分布和樣本次數(shù)分布 (三)次數(shù)分布的作用觀測(cè)變量的次數(shù)分布包含了觀測(cè)變量取值的全部信息。根據(jù)觀測(cè)變量的次數(shù)分布,可以對(duì)觀測(cè)變量的各種分布特征進(jìn)行描述

10、和分析。 第23頁/共246頁二、次數(shù)分布表及其編制 (一)次數(shù)分布表的種類 1、單值分組次數(shù)分布表 2、組距分組次數(shù)分布表 (二)組距分組次數(shù)分布表的編制方法 1、確定組數(shù) 等距分組的斯特吉斯公式:m=1+3.322lgN 2、確定組距 等距分組的參考組距: 3、確定組限 4、計(jì)數(shù)各組的次數(shù) 5、列出次數(shù)分布表 mxMinxMaxwii第24頁/共246頁三、次數(shù)分布圖 用線和面等形狀來顯示觀測(cè)變量次數(shù)分布狀況的幾何圖形,稱為次數(shù)分布圖。 常用的次數(shù)分布圖主要有柱狀圖、直方圖和折線圖等幾種。第25頁/共246頁四、 次數(shù)分布的理論模型 (一)理論分布模型的概念與意義 隨機(jī)變量取某個(gè)數(shù)值或在某

11、個(gè)區(qū)間取值是一個(gè)隨機(jī)事件,使用概率理論計(jì)算的隨機(jī)變量在各個(gè)數(shù)值上或在各個(gè)區(qū)間內(nèi)取值的概率分布,就是隨機(jī)變量的理論分布,計(jì)算此理論分布的概率理論模型就是其理論分布模型。 在現(xiàn)實(shí)生活中,各種觀測(cè)變量的概率分布都可以用某個(gè)理論概論分布模型去近似描述。因此就可據(jù)此理論分布模型進(jìn)行分析推斷。第26頁/共246頁四、次數(shù)分布的理論模型(二)理論分布模型的表示方法 1、概率分布表 2、概率分布圖 3、概率分布函數(shù)式第27頁/共246頁五、離散變量概率分布模型 記所考察的離散變量為x,假設(shè)該隨機(jī)變量共可取m個(gè)不同的值,它取值為xi的概率為pi,并記隨機(jī)事件x=xi的概率為P(x=xi),則離散隨機(jī)變量的概率分

12、布可表示為: P(x=xi)=pi ; i=1,2,m. 在統(tǒng)計(jì)分析推斷中,常用的離散變量概率分布模型主要有兩點(diǎn)分布、二項(xiàng)分布、超幾何分布和泊松分布等幾種。第28頁/共246頁(一)兩點(diǎn)分布 假設(shè)總體中有兩類共N個(gè)個(gè)體,其中取值為“是”的有N1個(gè),取值為“非”的有N0個(gè),則有:qNNxPpNNxP0101第29頁/共246頁(二)二項(xiàng)分布 假設(shè)在0-1分布總體中,取“是”值的個(gè)體比例為p,取“非”值的比例為q,現(xiàn)從中有放回地隨機(jī)抽取n個(gè)個(gè)體,記X為取“是”值的個(gè)體數(shù)目,則其中恰有n1個(gè)個(gè)體取“是”值、且有n0=n-n1個(gè)個(gè)體取“非”值的概率為:0111nnnnqpCnxP第30頁/共246頁(

13、三)超幾何分布 假設(shè)0-1總體中共有N個(gè)個(gè)體,其中取“是”值的個(gè)體有N1個(gè),取“非”值的個(gè)體有N0個(gè)?,F(xiàn)從不放回地隨機(jī)抽取n個(gè)個(gè)體,記x為取“是”值的個(gè)體數(shù)目,則其中恰有n1個(gè)個(gè)體取“是”值、且有n0=n-n1個(gè)個(gè)體取“非”值的概率為:nNnNnNCCCnxP00111第31頁/共246頁(四)泊松分布 泊松分布是稀有事件出現(xiàn)次數(shù)的理論分布模型,如自然災(zāi)害、意外事故、機(jī)器故障等事件出現(xiàn)的次數(shù)都近似地服從泊松分布。泊松分布概率模型為: emmxPm!第32頁/共246頁六、連續(xù)變量概率分布模型 連續(xù)型隨機(jī)變量的取值范圍可以是數(shù)軸上的某個(gè)區(qū)間,也可以是整個(gè)數(shù)軸。由于它可以取無窮多個(gè)不同的數(shù)值,所以

14、描述其概率分布的最完善方法是概率函數(shù)式。在理論分析中,描述連續(xù)變量概率分布的最常用的概率函數(shù)式是概率分布密度函數(shù)。 在統(tǒng)計(jì)分析推斷中,常用的連續(xù)隨機(jī)變量概率分布模型主要有均勻分布、正態(tài)分布、2分布、t分布和F分布等幾種。 第33頁/共246頁(一)均勻分布 若隨機(jī)變量x在區(qū)間a,b 上服從均勻分布,則該隨機(jī)變量的概率密度函數(shù)為:.,0;,1bxaxbxaabxf f(x) a b x 圖3.4 均勻分布的概率密度曲線 第34頁/共246頁(二)正態(tài)分布 若隨機(jī)變量x服從正態(tài)分布,則其概率密度函數(shù)就為: 22221xexf f(x) -3 -2 - + +2 +3 x 圖 3.5 正態(tài)分布的概率

15、密度曲線 第35頁/共246頁(三)2分布 若隨機(jī)變量z1、z2、zn都服從標(biāo)準(zhǔn)正態(tài)分布N(0,1),且兩兩之間相互獨(dú)立,則這些標(biāo)準(zhǔn)正態(tài)變量的平方和x就服從2分布,其概率密度函數(shù)為: . 0,0; 0,2212122xxexnxfxnn f(x) n=1 n=4 n=10 n=20 0 x 圖 3.6 2分布的概率密度曲線 第36頁/共246頁(四)t分布 若隨機(jī)變量z N(0,1),x2(n),且二者相互獨(dú)立,則: 服從學(xué)生氏t分布,概率密度函數(shù)為: nxzt 2121221 nntnnntf f(t) t分布 正態(tài)分布 0 t 圖3.7 t分布的概率密度曲線 第37頁/共246頁(五)F分

16、布若隨機(jī)變量xm2(m),xn2(n),旦二者相互獨(dú)立,則: 服從F分布,其概率密度函數(shù)為: nxmxxnm . 0,0; 0,2,221222xxmxnxnmBnmxfnmmnm f(x) 0 x 圖3.8 F分布的概率密度曲線 第38頁/共246頁第四章 分布特征測(cè)度 一、分布中心 二、離散程度 三、偏度與峰度 四、相關(guān)程度第39頁/共246頁一、分布中心測(cè)度的意義(一)分布中心的概念所謂分布中心,就是指隨機(jī)變量的一切取值的散布中心。(二)測(cè)度分布中心的意義 1、隨機(jī)變量的分布中心是隨機(jī)變量一切取值的一個(gè)代表,可以用來反映其數(shù)值的一般水平。 2、隨機(jī)變量的分布中心可以揭示隨機(jī)變量一切取值的

17、次數(shù)分布在直角坐標(biāo)系內(nèi)的集中位置,可以用來反映隨機(jī)變量分布密度曲線的中心位置,即對(duì)稱中心或尖峰位置。 第40頁/共246頁二、分布中心測(cè)度指標(biāo) 用來測(cè)度隨機(jī)變量次數(shù)分布中心的指標(biāo)可以有多種,其中在統(tǒng)計(jì)分析推斷中常用的主要有算術(shù)平均數(shù)、中位數(shù)和眾數(shù)等幾種。 第41頁/共246頁(一)算術(shù)平均數(shù) 1、定義算術(shù)平均數(shù)又稱算術(shù)均值,是隨機(jī)變量的所有觀測(cè)值總和與觀測(cè)值個(gè)數(shù)的比值。2、計(jì)算方法(1)簡(jiǎn)單算術(shù)平均數(shù)適用于未分組整理的各個(gè)單個(gè)觀測(cè)數(shù)值,其計(jì)算公式為:nxxnii1第42頁/共246頁(一)算術(shù)平均數(shù) (2)加權(quán)算術(shù)平均數(shù)適用于已分組整理的次數(shù)分布數(shù)據(jù),其計(jì)算公式為:niiniiiffxx11f

18、fxxinii1第43頁/共246頁(一)算術(shù)平均數(shù) (3)算術(shù)平均數(shù)的變形調(diào)和平均數(shù)。對(duì)于由觀測(cè)變量的各個(gè)分組和各組變量總值順序排列所形成的分組數(shù)據(jù)。算術(shù)平均數(shù)的公式需變換成調(diào)和平均數(shù)的形式:當(dāng)各組的變量總值mi相等時(shí),就可簡(jiǎn)化為:niiiniimxmx111niixnx11第44頁/共246頁(一)算術(shù)平均數(shù)3 3、理論分布的算術(shù)平均數(shù)數(shù)學(xué)期望 (1)定義 對(duì)于離散型隨機(jī)變量,假設(shè)有n個(gè)不同的取值,其中取某個(gè)數(shù)值xi的概率為pi,則該隨機(jī)變量的數(shù)學(xué)期望可用算術(shù)平均數(shù)公式定義為: 對(duì)于連續(xù)型隨機(jī)變量,仍可用算術(shù)平均數(shù)定義其數(shù)學(xué)期望,不過因?yàn)檫B續(xù)變量求和要用定積分,所以定義中需要用定積分符號(hào)代

19、替總和符號(hào),即: niiipxxE1 dxxxfxE第45頁/共246頁(一)算術(shù)平均數(shù)3 3、理論分布的算術(shù)平均數(shù)數(shù)學(xué)期望 (2 2)例子 例如,對(duì)于服從兩點(diǎn)分布的隨機(jī)變量x,其不同的取值只有1和0,其中取1的概率為p,取0的概率為q=1-p,則其數(shù)學(xué)期望為: 又如,對(duì)于服從位置參數(shù)為且尺度參數(shù)為2的正態(tài)分布的隨機(jī)變量x,由其概率密度函數(shù)可計(jì)算出其數(shù)學(xué)期望就是其位置參數(shù)。標(biāo)準(zhǔn)正態(tài)分布隨機(jī)變量的數(shù)學(xué)期望為0。 pqppxxEniii011第46頁/共246頁(一)算術(shù)平均數(shù) (3)數(shù)學(xué)期望的性質(zhì) 若c為常數(shù),則必有:E(c)=c 若c為任意常數(shù),x為隨機(jī)變量,則必有: E(cx)=cE(x)

20、若x1、x2、xm均為隨機(jī)變量,則必有: E(x1+x2+xm)=E(x1)+E(x2)+E(xm) 若x1、x2、xm均為隨機(jī)變量,且相互獨(dú)立,則: E(x1x2xm)=E(x1)E(x2)E(xm) 若x是隨機(jī)變量,則必有: E(x)E(x) 第47頁/共246頁(二)中位數(shù)1 1、定義 中位數(shù)是在按觀測(cè)變量值的大小順序排列所形成的變量值數(shù)列中點(diǎn)位置上的變量值。對(duì)于觀測(cè)變量x,假設(shè)共取得n個(gè)觀測(cè)值,各個(gè)觀測(cè)值按大小順序排列為x(1)、x(2)、x(n),則其中位數(shù)可定義為: 為偶數(shù)。為奇數(shù);nxxnxxnnn,21,12221第48頁/共246頁(二)中位數(shù)2、組距分組次數(shù)分布數(shù)據(jù) 的中位

21、數(shù)計(jì)算wfffUxwfffLxmUmL22第49頁/共246頁(三)眾數(shù)1、定義:眾數(shù)是隨機(jī)變量的觀測(cè)值中出現(xiàn)次數(shù)或密度最大的變量觀測(cè)值 。2、組距分組次數(shù)分布數(shù)據(jù)計(jì)算眾數(shù) wffffffUxwffffffLx101010101010第50頁/共246頁 f(x) xxx x f(x) x xx x 三、均值、中位數(shù)和眾數(shù)三者之間的關(guān)系 對(duì)于對(duì)稱分布,有: 對(duì)于右偏分布,有: 對(duì)于左偏分布,有: 經(jīng)驗(yàn)關(guān)系式: xxxxxxxxxxxxx3第51頁/共246頁四、離散程度測(cè)度的意義(一)離散程度的概念所謂離散程度,即觀測(cè)變量各個(gè)取值之間的差異程度。(二)離散程度測(cè)度的意義 1、通過對(duì)隨機(jī)變量取值

22、之間離散程度的測(cè)定,可以反映各個(gè)觀測(cè)個(gè)體之間的差異大小,從而也就可以反映分布中心指標(biāo)對(duì)各個(gè)觀測(cè)變量值代表性的高低。 2、通過對(duì)隨機(jī)變量取值之間離散程度的測(cè)定,可以反映隨機(jī)變量次數(shù)分布密度曲線的瘦俏或矮胖程度。第52頁/共246頁五、離散程度測(cè)度指標(biāo) 可用來測(cè)度觀測(cè)變量值之間差異程度的指標(biāo)有很多,在統(tǒng)計(jì)分析推斷中最常用的主要有極差、平均差和標(biāo)準(zhǔn)差等幾種。 第53頁/共246頁(一)極差 極差又稱全距,是觀測(cè)變量的最大取值與最小取值之間的離差,也就是觀測(cè)變量的最大觀測(cè)值與最小觀測(cè)值之間的區(qū)間跨度。 極差的計(jì)算公式為: R=Max(xi)-Min(xi)第54頁/共246頁(二)平均差 平均差是隨機(jī)

23、變量各個(gè)取值偏差絕對(duì)值的算術(shù)平均數(shù)。 由于所掌握數(shù)據(jù)形式的不同,平均差的計(jì)算有簡(jiǎn)單平均差和加權(quán)平均差兩種不同的方式。nxxdnii1niiniiiffxxd11第55頁/共246頁(三)標(biāo)準(zhǔn)差 標(biāo)準(zhǔn)差是隨機(jī)變量各個(gè)取值偏差平方的平均數(shù)的算術(shù)平方根,是最常用的反映隨機(jī)變量分布離散程度的指標(biāo)。 標(biāo)準(zhǔn)差既可以根據(jù)樣本數(shù)據(jù)計(jì)算,也可以根據(jù)觀測(cè)變量的理論分布計(jì)算,分別稱為樣本標(biāo)準(zhǔn)差和總體標(biāo)準(zhǔn)差。 第56頁/共246頁1、樣本標(biāo)準(zhǔn)差的計(jì)算 (1)對(duì)于未分組整理的各個(gè)觀測(cè)變量值數(shù)據(jù),計(jì)算標(biāo)準(zhǔn)差應(yīng)采用簡(jiǎn)單平均的方法。 (2)對(duì)于已分組整理的分組次數(shù)分布數(shù)據(jù),計(jì)算標(biāo)準(zhǔn)差應(yīng)采用加權(quán)平均的方法 。nxxsnii12

24、niiniiiffxxs112第57頁/共246頁2、理論分布的標(biāo)準(zhǔn)差與方差 (1)定義 標(biāo)準(zhǔn)差是最常用的理論分布模型正態(tài)分布的參數(shù)之一,在理論分析中最常用來描述隨機(jī)變量分布的離散程度。標(biāo)準(zhǔn)差的平方稱為方差,與標(biāo)準(zhǔn)差有著同樣的作用。隨機(jī)變量x的理論分布的方差常記為Var(x)或2,其定義為: 2=Var(x)=Ex-E(x)2第58頁/共246頁2、理論分布的標(biāo)準(zhǔn)差與方差 (2)離散隨機(jī)變量的方差 對(duì)于離散隨機(jī)變量x,假設(shè)共有n個(gè)不同取值,取值xi的概率為pi,i =1、2、n,則方差為: 例如,對(duì)于服從兩點(diǎn)分布的隨機(jī)變量x,其取值為1的概率為p,取值為0的概率為q=1-p,數(shù)學(xué)期望為E(x)

25、=p,則其方差為: Var(x)=(1-p)2p+(0-p)2q=pq niiipxExxVar12第59頁/共246頁2、理論分布的標(biāo)準(zhǔn)差與方差 (3)連續(xù)隨機(jī)變量的方差 對(duì)于連續(xù)型隨機(jī)變量x,假設(shè)其分布密度函數(shù)f(x),則其方差的計(jì)算公式為: 例如,對(duì)于服從位置參數(shù)為且尺度參數(shù)為2的正態(tài)分布的隨機(jī)變量x,其數(shù)學(xué)期望等于其位置參數(shù),其方差就是其尺度參數(shù)2,標(biāo)準(zhǔn)正態(tài)分布的方差為1。 dxxfxExxVar2第60頁/共246頁2、理論分布的標(biāo)準(zhǔn)差與方差(4)方差的性質(zhì) 任何隨機(jī)變量的方差均非負(fù)。Var(x)0 若c為常數(shù),x為隨機(jī)變量,則有: Var(cx)=c2Var(x) 若隨機(jī)變量x1、

26、x2、xm均相互獨(dú)立,則有: Var(x1+x2+xm)=Var(x1)+Var(x2)+Var(xm) 若x為隨機(jī)變量,c為任一常數(shù),則有: E(x-c)2=Ex-E(x)2+c-E(x)2 對(duì)于任意隨機(jī)變量x,均有: Var(x)=E(x2)-E(x)2第61頁/共246頁(四)離散系數(shù)1、離散系數(shù)的概念各個(gè)衡量隨機(jī)變量取值之間絕對(duì)差異的指標(biāo)與算術(shù)平均數(shù)的比率,通稱為離散系數(shù)。2、計(jì)算離散系數(shù)的意義消除量綱和數(shù)量級(jí)的差異,便于不同觀測(cè)變量之間的比較。 3、計(jì)算公式%100%100%100 xsvxdvxRvsdR第62頁/共246頁六、測(cè)度偏度和峰度的意義 (一)概念所謂偏度,就是觀測(cè)變量

27、取值分布的非對(duì)稱程度;所謂峰度,就是觀測(cè)變量取值分布密度曲線頂部的平坦程度或尖峭程度。 (二)意義 1、加深人們對(duì)觀測(cè)變量取值的散布狀況的認(rèn)識(shí); 2、將觀測(cè)變量的偏度和峰度指標(biāo)值與某種理論分布的偏度和峰度指標(biāo)值進(jìn)行比較,以判斷觀測(cè)變量的分布與某種理論分布的近似程度。 第63頁/共246頁七、偏度的測(cè)度(一)直觀偏度系數(shù) 1、皮爾遜偏度系數(shù) 2、鮑萊偏度系數(shù) sxxskp lulubQQQxxQsk第64頁/共246頁七、偏度的測(cè)度(二)矩偏度系數(shù) 1、矩的定義原點(diǎn)矩和中心矩 2、矩偏度系數(shù)ffxxsffxxmmmm33ssskm第65頁/共246頁八、峰度的測(cè)度 矩峰度系數(shù)隨機(jī)變量的四階中心矩

28、與其標(biāo)準(zhǔn)差的四次方相除,所得比率就稱為峰度系數(shù),其計(jì)算公式為: 44ssku第66頁/共246頁九、相關(guān)程度測(cè)度的意義 (一)相關(guān)關(guān)系的概念 對(duì)于兩個(gè)觀測(cè)變量,若一個(gè)變量的取值除了受另一個(gè)變量取值的影響外,還受各種隨機(jī)因素的影響,則變量間的這種非確定性關(guān)系就稱為相關(guān)關(guān)系。(二)相關(guān)關(guān)系測(cè)度的意義 1、了解兩個(gè)觀測(cè)變量之間相關(guān)關(guān)系的方向;2、了解兩個(gè)觀測(cè)變量之間相互依賴關(guān)系的程度,為構(gòu)建觀測(cè)變量之間相互關(guān)系模型奠定基礎(chǔ)。第67頁/共246頁十、相關(guān)程度測(cè)度的指標(biāo) 對(duì)兩隨機(jī)變量之間的相關(guān)關(guān)系及其密切程度進(jìn)行測(cè)度,需要根據(jù)兩變量觀測(cè)值的復(fù)合分組次數(shù)分布進(jìn)行,或在理論上根據(jù)兩變量的聯(lián)合概率分布模型進(jìn)行

29、。 測(cè)度觀測(cè)變量之間相關(guān)關(guān)系的指標(biāo)主要有協(xié)方差和相關(guān)系數(shù)兩個(gè)。 第68頁/共246頁(一)協(xié)方差 1、定義協(xié)方差是兩個(gè)隨機(jī)變量成對(duì)觀測(cè)值偏差乘積的算術(shù)平均數(shù) 。 2、樣本協(xié)方差niiixyyyxxns11niiniiiixyffyyxxs11第69頁/共246頁(一)協(xié)方差 3、總體協(xié)方差對(duì)于兩隨機(jī)變量的理論分布,也可類似地定義其協(xié)方差。兩隨機(jī)變量x和y的理論分布的協(xié)方差常記作Cov(x,y)或xy,其定義公式為: xy=Cov(x,y)=Ex-E(x)y-E(y) 例如,對(duì)于聯(lián)合分布為二元正態(tài)分布的隨機(jī)變量x和y,可得二變量的協(xié)方差為: 2121, dxdyyxfyxyxCov第70頁/共2

30、46頁(一)協(xié)方差 4、協(xié)方差的性質(zhì) 隨機(jī)變量x與y的協(xié)方差和y與x的協(xié)方差相等。 Cov(x, y)=Cov(y, x) 若隨機(jī)變量x和y相互獨(dú)立,則有:Cov(x, y)=0 若1和2為任意常數(shù),則有: Cov(1x, 2y)=12Cov(x, y) 對(duì)于任意三個(gè)隨機(jī)變量,均有: Cov(x1+x2, y)=Cov(x1, y )+Cov(x2, y) Cov(x, y1+y2)=Cov(x, y1)+Cov(x, y2) 對(duì)于任意兩隨機(jī)變量,均有: Cov(x, y)=E(xy)-E(x)E(y)第71頁/共246頁(二)相關(guān)系數(shù) 1、定義相關(guān)系數(shù)是兩個(gè)隨機(jī)變量的協(xié)方差對(duì)其兩標(biāo)準(zhǔn)差之積的

31、比率 。 2、總體相關(guān)系數(shù) 3、樣本相關(guān)系數(shù)yxxyyxxysssr 第72頁/共246頁(二)相關(guān)系數(shù) 4、相關(guān)系數(shù)的取值范圍 相關(guān)系數(shù)r的數(shù)值介于-1和+1之間,其絕對(duì)值介于0和1之間。即有: -1r+1 5、相關(guān)系數(shù)的作用(1)相關(guān)系數(shù)的符號(hào)可反映兩隨機(jī)變量相互依存關(guān)系的方向。相關(guān)系數(shù)為正,稱為正相關(guān);相關(guān)系數(shù)為負(fù),稱為負(fù)相關(guān)。(2)相關(guān)系數(shù)的絕對(duì)值的大小則可反映兩隨機(jī)變量線性相關(guān)關(guān)系的密切程度。第73頁/共246頁第五章 參數(shù)估計(jì) 一、總體參數(shù)及其估計(jì)量 二、構(gòu)造估計(jì)量的方法矩法估計(jì) 三、判斷估計(jì)量?jī)?yōu)劣的標(biāo)準(zhǔn) 四、估計(jì)量的標(biāo)準(zhǔn)誤 五、抽樣分布的概念 六、基本的抽樣分布 七、區(qū)間估計(jì)的概

32、念 八、區(qū)間估計(jì)的方法 九、樣本容量的確定第74頁/共246頁一、總體參數(shù)及其估計(jì)量 總體指標(biāo)又稱為總體參數(shù),根據(jù)樣本數(shù)據(jù)來推斷總體指標(biāo)數(shù)值就稱為參數(shù)估計(jì)。 集中了樣本中有關(guān)總體參數(shù)信息的樣本指標(biāo)稱為統(tǒng)計(jì)量,該統(tǒng)計(jì)量就可用來估計(jì)所求的總體指標(biāo)的數(shù)值。用來估計(jì)總體指標(biāo)數(shù)值的統(tǒng)計(jì)量又稱為該總體指標(biāo)的估計(jì)量,該估計(jì)量的數(shù)值就稱為該總體指標(biāo)的估計(jì)值。 總體參數(shù)值是確定的,但是未知的;樣本估計(jì)量是隨機(jī)變量,其估計(jì)值是某個(gè)給定樣本的計(jì)算值。 第75頁/共246頁二、構(gòu)造估計(jì)量的方法矩法估計(jì) (一)矩法估計(jì)的概念所謂矩法估計(jì),概括來說就是用樣本矩作為總體同一矩的估計(jì)量,用樣本矩的函數(shù)作為總體相應(yīng)矩同一函數(shù)的

33、估計(jì)量。(二)常用的總體參數(shù)及其矩法估計(jì)量 niiniixnNxNNnnpPxnx1111yxxyniiniisssrxxnsxxns11121222第76頁/共246頁三、判斷估計(jì)量?jī)?yōu)劣的標(biāo)準(zhǔn) 為了保證用于估計(jì)總體指標(biāo)的估計(jì)量準(zhǔn)確可靠,就必須要求所使用的估計(jì)量具備一些優(yōu)良的性質(zhì),這些性質(zhì)就構(gòu)成了判斷一個(gè)估計(jì)量?jī)?yōu)劣的標(biāo)準(zhǔn)。 常用的標(biāo)準(zhǔn)主要有一致性、無偏性、有效性、充分性和穩(wěn)健性等。 第77頁/共246頁(一)一致性 對(duì)于總體指標(biāo)的一個(gè)估計(jì)量,若其取值隨著樣本容量的增大越來越接近于總體指標(biāo)的真值,即估計(jì)誤差越來越小的可能性越來越大直至100%,則該估計(jì)量就稱為總體指標(biāo)的一致估計(jì)量,或稱為相合估計(jì)

34、量。 可以證明,由矩估計(jì)法所構(gòu)造出的估計(jì)量都是所估計(jì)總體指標(biāo)的一致估計(jì)量。如樣本均值是總體均值的一致估計(jì)量,樣本比例p是總體比例P的一致估計(jì)量,樣本方差s2也是總體方差2的一致估計(jì)量。第78頁/共246頁(二)無偏性 對(duì)于總體指標(biāo)的一個(gè)估計(jì)量,若其估計(jì)值的數(shù)學(xué)期望等于該總體指標(biāo)的真值,即其估計(jì)誤差的數(shù)學(xué)期望為0,則該估計(jì)量就稱為是總體指標(biāo)的無偏估計(jì)量。 可以證明,樣本均值是總體均值的無偏估計(jì)量,而常規(guī)樣本方差卻并不是總體方差2的無偏估計(jì)量,修正樣本方差s2是總體方差2的無偏估計(jì)量。修正樣本方差即無偏樣本方差為: niixxns12211第79頁/共246頁(三)有效性 對(duì)于任一總體指標(biāo),若存在

35、兩個(gè)無偏估計(jì)量,其中一個(gè)估計(jì)量的估計(jì)誤差平均來說小于另一個(gè)估計(jì)量的估計(jì)誤差,則稱前一個(gè)估計(jì)量比后一個(gè)估計(jì)量有效。 無偏估計(jì)量的估計(jì)誤差大小可用其方差衡量,所以兩個(gè)無偏估計(jì)量比較,方差較小者較為有效。 對(duì)于一個(gè)總體指標(biāo)來說,若在其所有無偏估計(jì)量中能夠找到一個(gè)估計(jì)量,其方差最小,則該估計(jì)量就稱為是該總體指標(biāo)的最佳無偏估計(jì)量??梢宰C明,樣本均值是總體均值的最佳無偏估計(jì)量。 對(duì)于有偏估計(jì)量,衡量其有效性可用均方誤差代替方差。估計(jì)量的均方誤差為: 2 EMSE第80頁/共246頁(四)充分性 對(duì)于一個(gè)總體指標(biāo),若其估計(jì)量提取了樣本中包含的有關(guān)該總體指標(biāo)的全部信息,則此估計(jì)量就稱為該總體指標(biāo)的充分估計(jì)量。

36、 在多數(shù)情形下,矩法估計(jì)給出的總體指標(biāo)的估計(jì)量均是充分的。如在正態(tài)分布總體之下,樣本均值是總體均值的充分估計(jì)量,樣本方差s2也是總體方差2的充分估計(jì)量。 第81頁/共246頁(五)穩(wěn)健性 如果用來估計(jì)總體指標(biāo)的樣本估計(jì)量對(duì)樣本數(shù)據(jù)的污染不敏感,也就是說估計(jì)量的數(shù)值不受被污染數(shù)據(jù)的干擾或受其干擾不大,那么該估計(jì)量就是總體指標(biāo)的一個(gè)穩(wěn)健估計(jì)量。 實(shí)踐中常用的一種估計(jì)總體均值的穩(wěn)健估計(jì)量是切尾均值,切尾均值的計(jì)算公式為: 111nnjjxnx第82頁/共246頁四、估計(jì)量的標(biāo)準(zhǔn)誤 (一)標(biāo)準(zhǔn)誤的概念 樣本估計(jì)量的標(biāo)準(zhǔn)差通常稱為該估計(jì)量的標(biāo)準(zhǔn)誤差,簡(jiǎn)稱標(biāo)準(zhǔn)誤。即: 標(biāo)準(zhǔn)誤是衡量一個(gè)估計(jì)量抽樣估計(jì)誤差大

37、小的一個(gè)尺度。 2EEVar第83頁/共246頁(二)標(biāo)準(zhǔn)誤的計(jì)算1 1、樣本均值的標(biāo)準(zhǔn)誤 (1 1)放回抽樣 (2 2)不放回抽樣nxNnnx12nsxNnnsx12第84頁/共246頁(二)標(biāo)準(zhǔn)誤的計(jì)算 2 2、樣本比例的標(biāo)準(zhǔn)誤 (1 1)放回抽樣 (2 2)不放回抽樣 nPPp1NnnPPp11nppp1Nnnppp11第85頁/共246頁(三)影響標(biāo)準(zhǔn)誤的因素 1、總體中各個(gè)體之間的差異程度??傮w中各個(gè)體取值之間的差異程度大即2也大,各總體指標(biāo)估計(jì)量的標(biāo)準(zhǔn)誤的數(shù)值也就大,抽樣估計(jì)誤差也就大。 2、樣本容量的大小。樣本容量大,總體指標(biāo)估計(jì)量的標(biāo)準(zhǔn)誤則小,抽樣估計(jì)誤差也就越小;反之,樣本容

38、量越小,抽樣估計(jì)誤差及其標(biāo)準(zhǔn)誤也就越大。 3、抽取樣本的方式方法。抽樣方式方法不同,總體指標(biāo)估計(jì)量的標(biāo)準(zhǔn)誤就會(huì)不同,抽樣估計(jì)誤差的大小也就不同。第86頁/共246頁五、抽樣分布的概念 對(duì)于給定的總體和抽樣方式以及樣本容量,樣本指標(biāo)取值的概率分布就稱為抽樣分布。 確定樣本容量下的抽樣分布稱為樣本統(tǒng)計(jì)量的精確分布,而樣本容量趨于無窮大時(shí)的抽樣分布則稱為樣本統(tǒng)計(jì)量的極限分布。 第87頁/共246頁六、基本的抽樣分布 ( (一) )樣本均值的抽樣分布 1、任意總體大樣本 2、正態(tài)總體小樣本nNx2,1 ,0 Nnxz1ntnsxt第88頁/共246頁六、基本的抽樣分布 ( (二) )樣本比例的抽樣分布

39、大樣本nPPPNp1,1 , 01NnPPPpz第89頁/共246頁六、基本的抽樣分布(三)樣本方差的抽樣分布正態(tài)總體 11222nsn第90頁/共246頁七、區(qū)間估計(jì)的概念 記總體指標(biāo)為,樣本估計(jì)量為 ,事先給定概率為1-,若根據(jù)樣本估計(jì)量的概率分布可計(jì)算出一個(gè)區(qū)間 ,使得該區(qū)間包含總體參數(shù)的概率等于事先給定的概率1-,即有: 成立,則該區(qū)間 就稱為總體參數(shù)的置信區(qū)間,而概率1-就稱為是置信概率或置信度。 UL,1ULPUL,第91頁/共246頁八、區(qū)間估計(jì)的方法 (一)均值的區(qū)間估計(jì) 1 1、大樣本下均值的區(qū)間估計(jì) 由中心極限定理可知,對(duì)于大樣本而言,樣本均值的概率分布總可近似地看作是正態(tài)

40、分布。若事先給定置信概率為1-,則查標(biāo)準(zhǔn)正態(tài)分布概率數(shù)值表,可得標(biāo)準(zhǔn)正態(tài)分布的上側(cè)分位數(shù)z/2,就可得出總體均值的置信區(qū)間為:nzxnzx22,第92頁/共246頁(一)均值的區(qū)間估計(jì) 2、小樣本下正態(tài)總體均值的區(qū)間估計(jì) 對(duì)于來自正態(tài)總體的一個(gè)小樣本,在給定的置信概率1-之下,查自由度為(n-1)的t分布表,可得t分布的上側(cè)分位數(shù)t/2, 可得總體均值的置信區(qū)間為: ntxntx22,第93頁/共246頁(二)比例的區(qū)間估計(jì) 總體比例是兩點(diǎn)分布總體的均值,其估計(jì)量樣本比例則是來自該總體的隨機(jī)樣本的均值。因此,在大樣本條件下,可根據(jù)中心極限定理用類似于大樣本情形下總體均值區(qū)間估計(jì)的方法來對(duì)總體比

41、例進(jìn)行區(qū)間估計(jì)。有:nppzpnppzp1,122第94頁/共246頁(三)方差的區(qū)間估計(jì) 由抽樣分布理論可知,對(duì)于來自正態(tài)總體的一個(gè)簡(jiǎn)單隨機(jī)樣本,其修正樣本方差s2與總體方差2比值的(n-1)倍服從自由度為(n-1)的2分布。若給定置信概率1-,查自由度為(n-1)的2分布表可得兩個(gè)分位數(shù)1-/2和/2,則可得正態(tài)總體方差2的置信區(qū)間為:22122221,1snsn第95頁/共246頁(四)單側(cè)置信區(qū)間 所謂單側(cè)置信區(qū)間,是將待估總體指標(biāo)的上置信限或下置信限指定在其上界或下界值上,并根據(jù)給定的置信概率求出另一置信限而得到的置信區(qū)間。記待估計(jì)總體指標(biāo)為,其取值上界為 ,取值下界為 ,樣本估計(jì)量

42、為 ,對(duì)于給定的置信概率1-,若有: 或者,有: 則稱區(qū)間 和 為總體指標(biāo)的單側(cè)置信區(qū)間。 UL1ULP1ULPUL,UL,第96頁/共246頁九、樣本容量的確定 若在給定1-的置信概率之下,要求用樣本均值估計(jì)總體均值的抽樣估計(jì)誤差不超過,則由總體均值的抽樣估計(jì)誤差限的計(jì)算公式,可計(jì)算出必需最小樣本容量。 (一)放回抽樣 (二)不放回抽樣22220zn NnnNzzzNNzn00222222222222222111第97頁/共246頁第六章 假設(shè)檢驗(yàn) 一、假設(shè)檢驗(yàn)的原理 二、總體指標(biāo)假設(shè)檢驗(yàn) 三、分布假設(shè)檢驗(yàn) 四、假設(shè)檢驗(yàn)的兩類錯(cuò)誤及功效第98頁/共246頁一、假設(shè)檢驗(yàn)的原理 (一)統(tǒng)計(jì)假設(shè)和

43、檢驗(yàn)統(tǒng)計(jì)量 所謂統(tǒng)計(jì)假設(shè),就是關(guān)于總體分布特征的某種論斷。關(guān)于總體參數(shù)假設(shè)的檢驗(yàn),是假設(shè)檢驗(yàn)的核心內(nèi)容。記總體參數(shù)為,若要判斷是否等于某已知數(shù)值0,則該參數(shù)假設(shè)可表示為: H0:=0, H1:0 其中,假設(shè)H0:=0就是所要檢驗(yàn)的假設(shè),稱為原假設(shè)或零假設(shè);而假設(shè)H1:0則稱為對(duì)立假設(shè)或備擇假設(shè)。 要檢驗(yàn)?zāi)硞€(gè)假設(shè)是否正確,需根據(jù)樣本所提供的信息來進(jìn)行。包含總體分布特征的全部樣本信息的樣本指標(biāo),是進(jìn)行假設(shè)檢驗(yàn)的依據(jù),稱為檢驗(yàn)統(tǒng)計(jì)量。第99頁/共246頁(二)顯著性水平和拒絕域 進(jìn)行假設(shè)檢驗(yàn),概率論中關(guān)于小概率事件在一次試驗(yàn)中是不可能事件的原則是其所遵循的基本原則。通常取小概率事件的概率臨界值為0.

44、05或0.01,用表示,稱為假設(shè)檢驗(yàn)的顯著性水平。 在原假設(shè)成立的條件下,由檢驗(yàn)統(tǒng)計(jì)量的概率分布,對(duì)于給定的顯著性水平,就可確定出由抽樣誤差引起的樣本估計(jì)值對(duì)總體參數(shù)原假設(shè)值的可能的最大偏離值,作為判斷原假設(shè)正確與否的臨界值。樣本估計(jì)量偏離總體參數(shù)原假設(shè)值過大的區(qū)域,就是否定原假設(shè)的區(qū)域,稱為否定域或拒絕域,而否定域以外的區(qū)域則稱為接受域。第100頁/共246頁(二)顯著性水平和拒絕域 1、雙側(cè)檢驗(yàn)若要檢驗(yàn)的假設(shè)為: H0:=0, H1:0 則否定域應(yīng)建立在與原假設(shè)值的正負(fù)偏離超出給定臨界值的兩邊,這種檢驗(yàn)方法稱為雙側(cè)檢驗(yàn)。 f /2 /2 0 拒絕域 L2 接受域 U2 拒絕域 第101頁/

45、共246頁(二)顯著性水平和拒絕域 2、左側(cè)檢驗(yàn)若要檢驗(yàn)的假設(shè)為: H0:0, H1:0 則否定域應(yīng)建立在與原假設(shè)值的負(fù)偏離超出給定臨界值的一邊,這種檢驗(yàn)方法稱為左側(cè)檢驗(yàn)。 f 0 拒絕域 L 接受域 第102頁/共246頁(二)顯著性水平和拒絕域 3、右側(cè)檢驗(yàn)若要檢驗(yàn)的假設(shè)為: H0:0, H1:0 則否定域應(yīng)建立在與原假設(shè)值的正偏離超出給定臨界值的一邊,這種檢驗(yàn)方法稱為右側(cè)檢驗(yàn)。 f 0 接受域 U 拒絕域 第103頁/共246頁(三)假設(shè)檢驗(yàn)的p值 檢驗(yàn)統(tǒng)計(jì)量的取值落在其實(shí)際樣本值之外的概率,就稱為假設(shè)檢驗(yàn)的p值。 f P 0 U s 第104頁/共246頁(四)假設(shè)檢驗(yàn)的程序 (1)提

46、出原假設(shè)H0和備擇假設(shè)H1; (2)規(guī)定檢驗(yàn)的顯著性水平; (3)構(gòu)造用于檢驗(yàn)的樣本指標(biāo),即檢驗(yàn)統(tǒng)計(jì)量; (4)在原假設(shè)為真的假定下,根據(jù)檢驗(yàn)統(tǒng)計(jì)量的概率分布,確定出檢驗(yàn)統(tǒng)計(jì)量的臨界值,并由此臨界值構(gòu)造出檢驗(yàn)的拒絕域和接受域;或者計(jì)算出假設(shè)檢驗(yàn)的p值; (5)比較檢驗(yàn)統(tǒng)計(jì)量的實(shí)際樣本值與其臨界值,或者比較檢驗(yàn)的p值與顯著性水平,并根據(jù)比較的結(jié)果做出拒絕或不能拒絕原假設(shè)的決策。 第105頁/共246頁二、總體指標(biāo)假設(shè)檢驗(yàn) (一)均值的檢驗(yàn) 1 1、單一總體均值的檢驗(yàn) H0:=0,H1:0或0或0 (1)大樣本情形正態(tài)分布z檢驗(yàn) (2)小樣本情形(正態(tài)總體)t檢驗(yàn)1 , 00Nnxz10ntnsx

47、t第106頁/共246頁(一)均值的檢驗(yàn) 2 2、兩總體均值的比較 H0:1=2,H1:12或12或12 (1)大樣本情形正態(tài)分布z檢驗(yàn) (2)小樣本情形(正態(tài)總體)t檢驗(yàn) 其中s2為用自由度加權(quán)的兩樣本方差的平均數(shù)。1 ,02221212121Nnnxxz21121212121nntnnsxxt第107頁/共246頁(二)比例的檢驗(yàn) 1 1、單一總體比例的檢驗(yàn) 大樣本 (1)假設(shè) H0: P=P0 , H1: PP0 或PP0 或PP2 或P10,使用z檢驗(yàn)法,可得:20122zzn第118頁/共246頁第七章 方差分析 一、方差分析的概念 二、方差分析的意義 三、單因子數(shù)據(jù)結(jié)構(gòu)模型 四、模

48、型參數(shù)的估計(jì) 五、單因子方差分析表 六、各水平效應(yīng)的多重比較 七、隨機(jī)區(qū)組試驗(yàn)與多因素方差分析的特點(diǎn)第119頁/共246頁一、方差分析的概念 在科學(xué)實(shí)驗(yàn)和生產(chǎn)經(jīng)營(yíng)活動(dòng)中,人們常常需要對(duì)影響所觀測(cè)變量的各種主要因素進(jìn)行分析,以便找出各個(gè)因素在什么狀態(tài)下可使所觀測(cè)的變量取得最佳數(shù)值。為此,首先需要在各種主要影響因素的不同狀態(tài)下對(duì)所研究變量的取值進(jìn)行觀測(cè),然后再對(duì)觀測(cè)所得數(shù)據(jù)進(jìn)行比較分析。方差分析就是分析推斷各種因素狀態(tài)對(duì)所觀測(cè)變量的影響效應(yīng)的一種統(tǒng)計(jì)分析方法。 第120頁/共246頁二、方差分析的意義 首先,需要確定的是一個(gè)因子的各個(gè)水平的作用是否相同。如果相同,說明這個(gè)因子不管取哪種水平對(duì)觀測(cè)變

49、量無不同影響,那么這個(gè)因子實(shí)際上無關(guān)緊要,可納入平均效應(yīng)中去,這時(shí)稱這個(gè)因子是不顯著的。自然,如果一個(gè)因子的各個(gè)水平的作用不同,那么這時(shí)就稱此因子是顯著的。 其次,如果所考察的因子是顯著的,那么就要找出該因子的最佳水平或者各個(gè)顯著因子的各種水平的最佳配合,以指導(dǎo)生產(chǎn)經(jīng)營(yíng)的實(shí)踐活動(dòng)。 第121頁/共246頁三、單因子數(shù)據(jù)結(jié)構(gòu)模型 假設(shè)所考察的因子為A,有m個(gè)不同的水平A1,A2,Am。在各個(gè)水平下分別進(jìn)行了n1,n2,nm次獨(dú)立實(shí)驗(yàn)觀測(cè),得到變量觀測(cè)值為yij,i1,2,m,j1,2,ni,則有數(shù)據(jù)結(jié)構(gòu)模型為: yij=+i+ij;i1,2,m;j1,2,ni. 或者寫為: yij=i+ij ;

50、i1,2,m;j1,2,ni. 其中為平均效應(yīng),i為因子A的第i個(gè)水平Ai對(duì)觀測(cè)變量的作用,稱為水平Ai的效應(yīng),i=+i為在水平Ai下觀測(cè)變量的總體平均值,ij仍表示實(shí)驗(yàn)觀測(cè)的隨機(jī)誤差。 第122頁/共246頁四、模型參數(shù)的估計(jì) (一)總均值和組均值(二)模型參數(shù)的矩估計(jì)injijiiyny11miiiminjijynnynyi11111yyyyiiiiminjiijeiyymns112221第123頁/共246頁五、單因子方差分析表 (一)檢驗(yàn)的假設(shè) H0: 12m=0 H1: 至少i0 或 H0: 12m H1: 至少ik (二)總變動(dòng)平方和的分解 SSTSSASSE 即:minjiijm

51、iiiminjijiiyyyynyy11212112第124頁/共246頁五、單因子方差分析表 (三)方差分析表的構(gòu)造(四)檢驗(yàn)方法F檢驗(yàn)(單側(cè))單因子方差分析表 方差來源 平方和 自由度 均方 F 值 p 值 組間 組內(nèi) SSA SSE m-1 n-m SSA/(m-1) SSE/(n-m) F p 總和 SST n-1 mnmFmnSSEmSSAssFea, 1122第125頁/共246頁六、各水平效應(yīng)的多重比較 (一)檢驗(yàn)假設(shè) H0:ik H1: ik或 H0: ik H1: ik(二)檢驗(yàn)方法t檢驗(yàn)(雙側(cè)) mntnnsyytkiekiki11第126頁/共246頁七、多因子方差分析的

52、特點(diǎn) 一、隨機(jī)區(qū)組試驗(yàn)的特點(diǎn)及其數(shù)據(jù)分析 試驗(yàn)單位之間存在較大的差異 二、多因子方差分析的特點(diǎn) 不同因子的水平組合可能存在交互作用第127頁/共246頁第八章 回歸分析 一、回歸的概念與回歸模型的確定 二、樣本觀測(cè)模型和樣本回歸函數(shù) 三、一元線性回歸分析 四、多元線性回歸分析 五、回歸診斷第128頁/共246頁一、回歸的概念與模型確定 設(shè)隨機(jī)變量y與變量x1、x2、xk之間存在相關(guān)關(guān)系,則y與x1、x2、xk的數(shù)學(xué)模型可表示為: yf(x1,x2,xk)u 其中u為隨機(jī)因素影響,若自變量x1、x2、xk的值給定時(shí),隨機(jī)影響u的期望為0,則因變量y的條件數(shù)學(xué)期望就是唯一確定的,即有: E(y/x

53、)f(x1、x2、xk) 此條件期望就稱為y的回歸值,表示y的回歸值與自變量關(guān)系的函數(shù)式就稱為y的回歸函數(shù)。若自變量只有一個(gè),則稱為一元回歸函數(shù);若自變量有兩個(gè)或多個(gè),則稱為多元回歸函數(shù)。第129頁/共246頁一、回歸的概念與模型確定 回歸模型的確定方法有二:(一)定性分析(二)線性近似實(shí)踐中,常用的回歸函數(shù)為線性函數(shù),相應(yīng)的數(shù)學(xué)模型的形式為: y01x12x2kxku 其中0、1、2、k統(tǒng)稱為回歸系數(shù),因變量y對(duì)自變量x1、x2、xk的回歸函數(shù)為: E(y/x)01x12x2kxk 第130頁/共246頁二、樣本觀測(cè)模型和樣本回歸函數(shù) 設(shè)樣本觀測(cè)值為(yj,x1j,x2j,xkj),j1,2

54、,n,則對(duì)于線性模型來說,有: yj01x1j2x2jkxkjuj , j1,n. 這n個(gè)關(guān)系式稱為因變量y的觀測(cè)模型。由此觀測(cè)模型可估計(jì)得出模型中各個(gè)參數(shù)的估計(jì)值,從而得出樣本回歸函數(shù)為:kkxxxy22110第131頁/共246頁三、一元線性回歸分析 (一)散點(diǎn)圖 設(shè)樣本觀測(cè)值分別為(x1 y1)、(x2,y2)、(xn,yn),在平面直角坐標(biāo)系內(nèi)將這n對(duì)觀測(cè)值用n個(gè)點(diǎn)表示出來,所形成的圖形稱為散點(diǎn)圖。通過觀察散點(diǎn)圖的形狀,可輔助判斷回歸函數(shù)的具體形式。一元線性回歸模型的形式為: y01xu第132頁/共246頁(二)模型參數(shù)的最小二乘估計(jì) 1、最小二乘估計(jì)的原理 所謂最小二乘估計(jì),就是尋

55、找使樣本觀測(cè)模型的隨機(jī)誤差平方和最小的參數(shù)值作為回歸模型參數(shù)的估計(jì)值。 2、求一元線性回歸模型系數(shù)的正規(guī)方程組xyxxyxn21010第133頁/共246頁(二)模型參數(shù)的最小二乘估計(jì) 3、回歸系數(shù)的最小二乘估計(jì)公式 4、樣本回歸方程xyxxnyxxyn10221xy10第134頁/共246頁(二)模型參數(shù)的最小二乘估計(jì) 5、殘差與殘差平方和的計(jì)算 6、回歸模型隨機(jī)誤差的方差的估計(jì)jjjjjxyyye10 xyyyeQnjj10212222nQse第135頁/共246頁(三)回歸的方差分析 1、因變量總變動(dòng)平方和的分解即: SST=SSR+SSE 2、判定系數(shù)njjjnjjnjjyyyyyy1

56、21212222yyyySSTSSRR第136頁/共246頁(三)回歸的方差分析 3、一元線性回歸的方差分析表 4、檢驗(yàn)假設(shè) H0:=0,H1:0 5、檢驗(yàn)方法F檢驗(yàn)方差來源 平方和 自由度均方F值 p值回歸殘差SSRSSE1n-2SSRSSE/(n-2)Fp總和SSTn-12, 12nFnSSESSRF第137頁/共246頁 (四)回歸系數(shù)的t檢驗(yàn) 1、檢驗(yàn)的假設(shè) H0: 1=0 , H1: 10 H0: 0=0 , H1: 00 2、檢驗(yàn)的方法t檢驗(yàn)21111xxste220001xxxnste第138頁/共246頁(五)利用回歸直線進(jìn)行預(yù)測(cè) 所謂預(yù)測(cè)就是在給定自變量x的數(shù)值的條件下,估計(jì)

57、因變量y的數(shù)值,有點(diǎn)預(yù)測(cè)和區(qū)間預(yù)測(cè)兩種。 1、點(diǎn)預(yù)測(cè) 2、區(qū)間預(yù)測(cè) ppxy102222221111xxxxnstyxxxxnstyypeppepp第139頁/共246頁(六)一元線性回歸模型的推廣 實(shí)踐中,有時(shí)用線性模型來描述變量x和y之間的關(guān)系并不恰當(dāng),這時(shí)就需要考慮各種曲線模型。對(duì)于有些曲線模型來說,容易將它們化成下面的形式: g(y)=0+1h(x)+u 若仍假定隨機(jī)誤差u服從正態(tài)分布即uN(0,2),則y對(duì)x的曲線回歸問題就可化為函數(shù)g(y)對(duì)函數(shù)h(x)的直線回歸問題,從而就可用一元線性回歸的方法來處理,這實(shí)際上是一元線性回歸模型和方法的推廣。 第140頁/共246頁四、 多元線性

58、回歸分析 (一)多元線性回歸模型的設(shè)定 (二)模型參數(shù)的最小二乘估計(jì) (三)多元線性回歸模型的假設(shè)檢驗(yàn) (四)偏相關(guān)系數(shù)和復(fù)相關(guān)系數(shù) (五)利用多元線性回歸模型進(jìn)行預(yù)測(cè) (六)多元線性回歸模型的推廣 第141頁/共246頁五、 線性回歸診斷 (一)回歸診斷的內(nèi)容 1、線性回歸分析的基本假定對(duì)于線性回歸模型,通常假定隨機(jī)誤差uj滿足下列假定: (1)數(shù)學(xué)期望為0,即E(uj)0; (2)具有同一方差2,即Var(uj)2; (3)相互獨(dú)立,即Cov(ui,uj)0; (4)服從正態(tài)分布,即ujN(0,2)。 2、回歸診斷的內(nèi)容所謂回歸診斷,主要就是診斷樣本觀測(cè)數(shù)據(jù)是否滿足回歸分析的基本假定,以及

59、樣本觀測(cè)數(shù)據(jù)中是否存在不同于絕大部分?jǐn)?shù)據(jù)的異常數(shù)據(jù),等等。 第142頁/共246頁(二)回歸診斷的方法 1、殘差圖 進(jìn)行回歸診斷,通??捎脷埐顖D進(jìn)行。所謂殘差圖就是以因變量的觀測(cè)值yj或自變量值x1j、x2j、xkj或因變量回歸值等為橫坐標(biāo),且以殘差或其標(biāo)準(zhǔn)化數(shù)值為縱坐標(biāo)所作出的散點(diǎn)圖。 -100 -50 0 50 100 200 300 400 500 600 jy 圖 8.4 小麥畝產(chǎn)回歸的殘差圖 ej 第143頁/共246頁(二)回歸診斷的方法 2、異方差與方差穩(wěn)定性變換 所謂異方差,就是指因變量的方差不是常數(shù),而是隨著自身取值的變化而變化,或者隨著某個(gè)或某些自變量取值的變化而變化。對(duì)于

60、具有這種異方差性的樣本數(shù)據(jù),其殘差圖通常表現(xiàn)為在因變量回歸值較小的一端殘差點(diǎn)的散布范圍窄,而在因變量回歸值較大的一端殘差點(diǎn)的散布范圍寬,因而就可以用殘差圖來診斷是否存在異方差性。 如果樣本數(shù)據(jù)具有異方差性,那么可通過對(duì)因變量或一些自變量作變換,來改善方差的非齊性。這些變換統(tǒng)稱為方差穩(wěn)定化變換, 第144頁/共246頁(三)異常數(shù)據(jù)的診斷 1、異常數(shù)據(jù)的概念 所謂異常數(shù)據(jù)是指相對(duì)于多數(shù)觀測(cè)數(shù)據(jù)而言殘差絕對(duì)值較大的個(gè)別觀測(cè)數(shù)據(jù),通常稱為奇異值或奇異點(diǎn)。 2、異常數(shù)據(jù)的檢測(cè) 異常數(shù)據(jù)在樣本的散點(diǎn)圖上表現(xiàn)為遠(yuǎn)離絕大多數(shù)觀測(cè)點(diǎn)的孤立點(diǎn),在殘差圖上則表現(xiàn)為殘差值很大而遠(yuǎn)離大多數(shù)殘差點(diǎn)的孤立點(diǎn),因此也可以用

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論