




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、商務(wù)統(tǒng)計(jì)學(xué)習(xí)講座 雷欽禮雷欽禮 前言 一、商務(wù)統(tǒng)計(jì)課程的性質(zhì) 二、商務(wù)統(tǒng)計(jì)學(xué)習(xí)的方法 一、商務(wù)統(tǒng)計(jì)課程的性質(zhì) 1、商務(wù)統(tǒng)計(jì)是全面系統(tǒng)論述商務(wù)與經(jīng)濟(jì) 統(tǒng)計(jì)活動(dòng)全過程中所用統(tǒng)計(jì)理論與方法 的綜合性課程,在調(diào)查分析師證書系列 課程中是具有提綱挈領(lǐng)作用的一門課程。 2、商務(wù)統(tǒng)計(jì)課程的內(nèi)容都是碩士研究生 入學(xué)考試必考的內(nèi)容,是任何一個(gè)統(tǒng)計(jì) 人員和調(diào)查分析人員都必須掌握的統(tǒng)計(jì) 學(xué)的核心知識(shí)。 二、商務(wù)統(tǒng)計(jì)學(xué)習(xí)的方法 1、商務(wù)統(tǒng)計(jì)是一門應(yīng)用性統(tǒng)計(jì)學(xué)課程,在學(xué) 習(xí)過程中應(yīng)注重各種基本概念的含義和各種方 法的基本原理與應(yīng)用,要掌握每種方法的使用 條件、計(jì)算步驟、以及結(jié)果的意義與解釋。 2、要在理解和領(lǐng)會(huì)中記憶和
2、掌握課程的內(nèi)容。 如對(duì)于各種統(tǒng)計(jì)分布的復(fù)雜的密度函數(shù)公式就 不需記憶,但卻需要熟練掌握其概念定義以及 分布函數(shù)表的使用方法。 第一章第一章 緒論緒論 一、統(tǒng)計(jì)學(xué)的性質(zhì)一、統(tǒng)計(jì)學(xué)的性質(zhì) 二、統(tǒng)計(jì)學(xué)的作用二、統(tǒng)計(jì)學(xué)的作用 三、統(tǒng)計(jì)學(xué)的基本概念 四、統(tǒng)計(jì)指標(biāo)體系的設(shè)計(jì) 一、統(tǒng)計(jì)學(xué)的性質(zhì) (一)統(tǒng)計(jì)活動(dòng)的內(nèi)容與階段 對(duì)各種數(shù)據(jù)資料的搜集、整理、分析和推斷的 活動(dòng)過程稱為統(tǒng)計(jì)活動(dòng),一項(xiàng)完整的統(tǒng)計(jì)活動(dòng)過程 可分為統(tǒng)計(jì)資料的搜集整理和統(tǒng)計(jì)資料的分析推斷 兩大階段。 (二)統(tǒng)計(jì)學(xué)的定義與分科 統(tǒng)計(jì)學(xué)就是關(guān)于數(shù)據(jù)資料的搜集、整理、分析 和推斷的科學(xué)。關(guān)于統(tǒng)計(jì)資料的搜集整理和分析推 斷的理論與方法構(gòu)成了統(tǒng)計(jì)學(xué)的全
3、部?jī)?nèi)容。 (1)理論統(tǒng)計(jì)學(xué)與應(yīng)用統(tǒng)計(jì)學(xué) (2)描述統(tǒng)計(jì)學(xué)與推斷統(tǒng)計(jì)學(xué) 二、統(tǒng)計(jì)學(xué)的作用 (一)統(tǒng)計(jì)學(xué)在科學(xué)研究中的作用提出假 說并判定假說的正確與否 (二)統(tǒng)計(jì)學(xué)在生產(chǎn)中的作用通過試驗(yàn)分 析找出最佳工藝,并對(duì)生產(chǎn)過程進(jìn)行統(tǒng)計(jì)質(zhì)量 控制。 (三)統(tǒng)計(jì)學(xué)在管理中的作用抽樣調(diào)查了 解社會(huì)與市場(chǎng),為決策提供依據(jù);并可建立各 種社會(huì)與經(jīng)濟(jì)發(fā)展模型,定量地模擬社會(huì)與經(jīng) 濟(jì)的運(yùn)行,既可分析社會(huì)與經(jīng)濟(jì)的發(fā)展及其結(jié) 構(gòu)變化,又可進(jìn)行政策效果的評(píng)價(jià)。 三、統(tǒng)計(jì)學(xué)的基本概念 (一)總體和個(gè)體 組成統(tǒng)計(jì)活動(dòng)研究對(duì)象的全部事物的全 體集合,就稱為統(tǒng)計(jì)總體,簡(jiǎn)稱總體或 母體;而總體中的各個(gè)事物則稱為個(gè)體, 總體中個(gè)體的數(shù)
4、量稱為總體容量。 1、自然物體總體與人為劃定個(gè)體的總體; 2、有限總體與無限總體; 3、具體總體與設(shè)想總體(抽象總體)。 三、統(tǒng)計(jì)學(xué)的基本概念 (二)統(tǒng)計(jì)指標(biāo)及其測(cè)度(二)統(tǒng)計(jì)指標(biāo)及其測(cè)度 用來測(cè)度統(tǒng)計(jì)活動(dòng)研究對(duì)象某種特征數(shù)量的 概念稱為統(tǒng)計(jì)指標(biāo),簡(jiǎn)稱指標(biāo)。其中,測(cè)度總 體特征數(shù)量的概念稱為總體指標(biāo),而測(cè)度個(gè)體 特征數(shù)量的概念則稱為個(gè)體指標(biāo)。 指標(biāo)的測(cè)度計(jì)量尺度有(指標(biāo)的測(cè)度計(jì)量尺度有(1 1)定類尺度, (2)定序尺度,(3)定距尺度,(4)定比 尺度 。 三、統(tǒng)計(jì)學(xué)的基本概念 (三)樣本和統(tǒng)計(jì)推斷 1、樣本從總體中隨機(jī)抽出的部分 個(gè)體所組成的集合稱為樣本或子樣,樣 本中所含個(gè)體的數(shù)目稱為樣
5、本容量。 2、統(tǒng)計(jì)推斷根據(jù)樣本觀測(cè)資料來 對(duì)總體的分布狀況和分布特征進(jìn)行推斷。 3、樣本數(shù)據(jù)的分類(1)橫截面 數(shù)據(jù),(2)時(shí)間序列數(shù)據(jù)。 四、 統(tǒng)計(jì)指標(biāo)體系及其設(shè)計(jì) (一)統(tǒng)計(jì)指標(biāo)體系的定義 反映總體及其所含個(gè)體的各個(gè)方 面特征數(shù)量的一系列相互聯(lián)系、相互 補(bǔ)充的統(tǒng)計(jì)指標(biāo)所形成的體系,稱為 統(tǒng)計(jì)指標(biāo)體系。 (二)構(gòu)建統(tǒng)計(jì)指標(biāo)體系的意義 (三)指標(biāo)體系中指標(biāo)的分類 1、水平指標(biāo)(1)存量指標(biāo)與流量 指標(biāo),(2)實(shí)物指標(biāo)與價(jià)值指標(biāo)。 2、比率指標(biāo)(1)比例相對(duì)指標(biāo), (2)比值相對(duì)指標(biāo),(3)動(dòng)態(tài)相對(duì)指 標(biāo),(4)彈性相對(duì)指標(biāo),(5)強(qiáng)度相 對(duì)指標(biāo)。 (四)指標(biāo)體系設(shè)計(jì)的內(nèi)容 1 1、確定統(tǒng)計(jì)指標(biāo)
6、體系的框架;、確定統(tǒng)計(jì)指標(biāo)體系的框架; 2 2、確定每一個(gè)指標(biāo)的內(nèi)涵和外延;、確定每一個(gè)指標(biāo)的內(nèi)涵和外延; 3 3、確定每個(gè)統(tǒng)計(jì)指標(biāo)的計(jì)量單位;、確定每個(gè)統(tǒng)計(jì)指標(biāo)的計(jì)量單位; 4 4、確定每個(gè)統(tǒng)計(jì)指標(biāo)的計(jì)算方法。、確定每個(gè)統(tǒng)計(jì)指標(biāo)的計(jì)算方法。 (五)指標(biāo)體系設(shè)計(jì)的原則 1、目的性原則 2、科學(xué)性原則 3、可行性原則 4、聯(lián)系性原則 第二章 數(shù)據(jù)采集與整理 一、數(shù)據(jù)采集的方式與程序 二、現(xiàn)場(chǎng)調(diào)查 三、試驗(yàn)觀測(cè) 四、數(shù)據(jù)的整理顯示 一、數(shù)據(jù)采集的方式與程序 (一)數(shù)據(jù)采集根據(jù)統(tǒng)計(jì)指標(biāo)體系的要求, 對(duì)所研究總體中個(gè)體的相應(yīng)指標(biāo)進(jìn)行觀測(cè)記錄 取得數(shù)據(jù)的活動(dòng)過程。 (二)數(shù)據(jù)采集活動(dòng)的基本要求采集到的數(shù)
7、 據(jù)資料要具有代表性和真實(shí)性。所謂代表性, 是要求所觀測(cè)到的樣本必須對(duì)所研究總體具有 代表性;而所謂真實(shí)性,則是要求所采集到的 數(shù)據(jù)必須是真實(shí)的實(shí)際數(shù)據(jù)。 (三)數(shù)據(jù)采集方式的分類現(xiàn)場(chǎng)調(diào)查和試驗(yàn) 觀測(cè) 一、數(shù)據(jù)采集的方式與程序 (四)數(shù)據(jù)采集的程序 1、制定數(shù)據(jù)采集方案包括(1)采 集數(shù)據(jù)的目的,(2)采集總體和觀測(cè)單 位,(3)觀測(cè)指標(biāo)數(shù)值登記表,(4) 采集方式和組織,(5)采集時(shí)間和期限。 2、現(xiàn)場(chǎng)觀測(cè)登記 3、數(shù)據(jù)整理顯示 二、現(xiàn)場(chǎng)調(diào)查 (一)調(diào)查的取樣方式 1、隨機(jī)抽樣調(diào)查 (1)簡(jiǎn)單隨機(jī)抽樣,(2)系統(tǒng)抽樣, (3)分層抽樣,(4)整群抽樣。 2、非隨機(jī)抽樣調(diào)查 (1)任意抽樣,(
8、2)立意抽樣, (3)配額抽樣。 3、概率抽樣和非概率抽樣的特點(diǎn)比較 二、現(xiàn)場(chǎng)調(diào)查 (二)現(xiàn)場(chǎng)調(diào)查的觀測(cè)方式 1、訪問法 (1)口頭訪問當(dāng)面訪問或電話 訪問 (2)書面訪問郵局或互聯(lián)網(wǎng)郵 件傳遞,以及登門送收 2、觀察法 二、現(xiàn)場(chǎng)調(diào)查 (三)現(xiàn)場(chǎng)調(diào)查的問卷設(shè)計(jì) 1、提問方式 (1)封閉型提問 (2)開放型提問 2、提問次序 三、 試驗(yàn)觀測(cè) (一)試驗(yàn)觀測(cè)設(shè)計(jì)的原則 1、均衡分散性原則 2、整齊可比性原則 (二)試驗(yàn)觀測(cè)的方法 1、完全隨機(jī)試驗(yàn)觀測(cè) 2、隨機(jī)區(qū)組試驗(yàn)觀測(cè) 3、拉丁方試驗(yàn)觀測(cè) 4、正交試驗(yàn)觀測(cè) 四、數(shù)據(jù)整理與顯示 (一)構(gòu)建觀測(cè)資料數(shù)據(jù)庫的意義與方法 (二)觀測(cè)數(shù)據(jù)的分類顯示 1、
9、觀測(cè)個(gè)體的分類 (1)分類的功能與原則 (2)分類的方法 2、統(tǒng)計(jì)表的編制 (1)統(tǒng)計(jì)表的構(gòu)成 (2)統(tǒng)計(jì)表的編制規(guī)則內(nèi)容安排科學(xué) 合理,形式設(shè)計(jì)簡(jiǎn)練美觀。 第三章 次數(shù)分布 一、次數(shù)分布的概念 二、次數(shù)分布表及其編制 三、次數(shù)分布圖 四、次數(shù)分布的理論模型及其表示方法 五、離散變量概率分布模型 六、連續(xù)變量概率分布模型 一、次數(shù)分布的概念 (一)次數(shù)分布:觀測(cè)變量的各個(gè)不同取值及 其出現(xiàn)次數(shù)的順序排列,稱為變量的次數(shù)分布。 (二)總體次數(shù)分布和樣本次數(shù)分布 (三)次數(shù)分布的作用觀測(cè)變量的次數(shù)分 布包含了觀測(cè)變量取值的全部信息。根據(jù)觀測(cè) 變量的次數(shù)分布,可以對(duì)觀測(cè)變量的各種分布 特征進(jìn)行描述和
10、分析。 二、次數(shù)分布表及其編制 (一)次數(shù)分布表的種類 1、單值分組次數(shù)分布表 2、組距分組次數(shù)分布表 (二)組距分組次數(shù)分布表的編制方法 1、確定組數(shù) 等距分組的斯特吉斯公式:m=1+3.322lgn 2、確定組距 等距分組的參考組距: 3、確定組限 4、計(jì)數(shù)各組的次數(shù) 5、列出次數(shù)分布表 m xminxmax w ii 三、次數(shù)分布圖 用線和面等形狀來顯示觀測(cè)變量次數(shù)分 布狀況的幾何圖形,稱為次數(shù)分布圖。 常用的次數(shù)分布圖主要有柱狀圖、直方 圖和折線圖等幾種。 四、 次數(shù)分布的理論模型 (一)理論分布模型的概念與意義 隨機(jī)變量取某個(gè)數(shù)值或在某個(gè)區(qū)間取值是 一個(gè)隨機(jī)事件,使用概率理論計(jì)算的隨
11、機(jī)變量 在各個(gè)數(shù)值上或在各個(gè)區(qū)間內(nèi)取值的概率分布, 就是隨機(jī)變量的理論分布,計(jì)算此理論分布的 概率理論模型就是其理論分布模型。 在現(xiàn)實(shí)生活中,各種觀測(cè)變量的概率分布都 可以用某個(gè)理論概論分布模型去近似描述。因 此就可據(jù)此理論分布模型進(jìn)行分析推斷。 四、次數(shù)分布的理論模型 (二)理論分布模型的表示方法 1、概率分布表 2、概率分布圖 3、概率分布函數(shù)式 五、離散變量概率分布模型 記所考察的離散變量為x,假設(shè)該隨機(jī)變量 共可取m個(gè)不同的值,它取值為xi的概率為pi, 并記隨機(jī)事件x=xi的概率為p(x=xi),則離散隨 機(jī)變量的概率分布可表示為: p(x=xi)=pi ; i=1,2,m. 在統(tǒng)計(jì)
12、分析推斷中,常用的離散變量概率分 布模型主要有兩點(diǎn)分布、二項(xiàng)分布、超幾何分 布和泊松分布等幾種。 (一)兩點(diǎn)分布 假設(shè)總體中有兩類共n個(gè)個(gè)體,其中取 值為“是”的有n1個(gè),取值為“非”的有n0 個(gè),則有: q n n xp p n n xp 0 1 0 1 (二)二項(xiàng)分布 假設(shè)在0-1分布總體中,取“是”值的 個(gè)體比例為p,取“非”值的比例為q,現(xiàn) 從中有放回地隨機(jī)抽取n個(gè)個(gè)體,記x為取 “是”值的個(gè)體數(shù)目,則其中恰有n1個(gè)個(gè) 體取“是”值、且有n0=n-n1個(gè)個(gè)體取“非” 值的概率為: 011 1 nnn n qpcnxp (三)超幾何分布 假設(shè)0-1總體中共有n個(gè)個(gè)體,其中取 “是”值的個(gè)
13、體有n1個(gè),取“非”值的 個(gè)體有n0個(gè)?,F(xiàn)從不放回地隨機(jī)抽取n個(gè) 個(gè)體,記x為取“是”值的個(gè)體數(shù)目,則 其中恰有n 1 個(gè)個(gè)體取“是”值、且有 n0=n-n1個(gè)個(gè)體取“非”值的概率為: n n n n n n c cc nxp 0 0 1 1 1 (四)泊松分布 泊松分布是稀有事件出現(xiàn)次數(shù)的理 論分布模型,如自然災(zāi)害、意外事故、 機(jī)器故障等事件出現(xiàn)的次數(shù)都近似地服 從泊松分布。泊松分布概率模型為: e m mxp m ! 六、連續(xù)變量概率分布模型 連續(xù)型隨機(jī)變量的取值范圍可以是數(shù)軸上的 某個(gè)區(qū)間,也可以是整個(gè)數(shù)軸。由于它可以取 無窮多個(gè)不同的數(shù)值,所以描述其概率分布的 最完善方法是概率函數(shù)式。
14、在理論分析中,描 述連續(xù)變量概率分布的最常用的概率函數(shù)式是 概率分布密度函數(shù)。 在統(tǒng)計(jì)分析推斷中,常用的連續(xù)隨機(jī)變量概 率分布模型主要有均勻分布、正態(tài)分布、2分 布、t分布和f分布等幾種。 (一)均勻分布 若隨機(jī)變量x在區(qū)間a,b 上服從均勻分布,則該 隨機(jī)變量的概率密度函數(shù)為: .,0 ;, 1 bxax bxa ab xf f(x) a b x 圖3.4 均勻分布的概率密度曲線 (二)正態(tài)分布 若隨機(jī)變量x服從正態(tài)分布,則其概率密度函數(shù)就為: 2 2 2 2 1 x exf f(x) -3 -2 - + +2 +3 x 圖 3.5 正態(tài)分布的概率密度曲線 (三)2分布分布 若隨機(jī)變量z1、
15、z2、zn都服從標(biāo)準(zhǔn)正態(tài)分布 n(0,1),且兩兩之間相互獨(dú)立,則這些標(biāo)準(zhǔn)正態(tài)變量 的平方和x就服從2分布,其概率密度函數(shù)為: . 0,0 ; 0, 2 2 1 2 1 2 2 x xex n xf xn n f(x) n=1 n=4 n=10 n=20 0 x 圖 3.6 2分布的概率密度曲線 (四)t分布 若隨機(jī)變量z n(0,1),x2(n),且二者相互獨(dú)立,則: 服從學(xué)生氏t分布,概率密度函數(shù)為: nxzt 2 1 2 1 2 2 1 n n t n n n tf f(t) t分布 正態(tài)分布 0 t 圖3.7 t分布的概率密度曲線 (五)f分布 若隨機(jī)變量xm2(m),xn2(n),旦
16、二者相互獨(dú)立,則: 服從f分布,其概率密度函數(shù)為: nx mx x n m . 0,0 ; 0, 2 , 2 2 1 2 22 x xmxnx nm b nm xf nm m nm f(x) 0 x 圖3.8 f分布的概率密度曲線 第四章 分布特征測(cè)度 一、分布中心 二、離散程度 三、偏度與峰度 四、相關(guān)程度 一、分布中心測(cè)度的意義 (一)分布中心的概念所謂分布中心,就是 指隨機(jī)變量的一切取值的散布中心。 (二)測(cè)度分布中心的意義 1、隨機(jī)變量的分布中心是隨機(jī)變量一切取值 的一個(gè)代表,可以用來反映其數(shù)值的一般水平。 2、隨機(jī)變量的分布中心可以揭示隨機(jī)變量一 切取值的次數(shù)分布在直角坐標(biāo)系內(nèi)的集中
17、位置, 可以用來反映隨機(jī)變量分布密度曲線的中心位 置,即對(duì)稱中心或尖峰位置。 二、分布中心測(cè)度指標(biāo) 用來測(cè)度隨機(jī)變量次數(shù)分布中心的 指標(biāo)可以有多種,其中在統(tǒng)計(jì)分析推斷 中常用的主要有算術(shù)平均數(shù)、中位數(shù)和 眾數(shù)等幾種。 (一一)算術(shù)平均數(shù))算術(shù)平均數(shù) 1、定義算術(shù)平均數(shù)又稱算術(shù)均值,是 隨機(jī)變量的所有觀測(cè)值總和與觀測(cè)值個(gè) 數(shù)的比值。 2、計(jì)算方法 (1)簡(jiǎn)單算術(shù)平均數(shù)簡(jiǎn)單算術(shù)平均數(shù)適用于未分組整 理的各個(gè)單個(gè)觀測(cè)數(shù)值,其計(jì)算公式為: n x x n i i 1 (一一)算術(shù)平均數(shù))算術(shù)平均數(shù) (2)加權(quán)算術(shù)平均數(shù)加權(quán)算術(shù)平均數(shù)適用于已分組整 理的次數(shù)分布數(shù)據(jù),其計(jì)算公式為: n i i n i
18、ii f fx x 1 1 f f xx i n i i 1 (一一)算術(shù)平均數(shù))算術(shù)平均數(shù) (3)算術(shù)平均數(shù)的變形算術(shù)平均數(shù)的變形調(diào)和平均數(shù)。調(diào)和平均數(shù)。對(duì)于由觀測(cè)變量的 各個(gè)分組和各組變量總值順序排列所形成的分組數(shù)據(jù)。算術(shù) 平均數(shù)的公式需變換成調(diào)和平均數(shù)的形式: 當(dāng)各組的變量總值mi相等時(shí),就可簡(jiǎn)化為: n i i i n i i m x m x 1 1 1 n i i x n x 1 1 (一一)算術(shù)平均數(shù))算術(shù)平均數(shù) 3 3、理論分布的算術(shù)平均數(shù)、理論分布的算術(shù)平均數(shù)數(shù)學(xué)期望數(shù)學(xué)期望 (1)定義 對(duì)于離散型隨機(jī)變量,假設(shè)有n個(gè)不同的取值,其中 取某個(gè)數(shù)值xi的概率為pi,則該隨機(jī)變量的
19、數(shù)學(xué)期望可用 算術(shù)平均數(shù)公式定義為: 對(duì)于連續(xù)型隨機(jī)變量,仍可用算術(shù)平均數(shù)定義其數(shù)學(xué) 期望,不過因?yàn)檫B續(xù)變量求和要用定積分,所以定義中 需要用定積分符號(hào)代替總和符號(hào),即: n i ii pxxe 1 dxxxfxe (一一)算術(shù)平均數(shù))算術(shù)平均數(shù) 3 3、理論分布的算術(shù)平均數(shù)、理論分布的算術(shù)平均數(shù)數(shù)學(xué)期望數(shù)學(xué)期望 (2 2)例子)例子 例如,對(duì)于服從兩點(diǎn)分布的隨機(jī)變量x,其不同的 取值只有1和0,其中取1的概率為p,取0的概率為q=1-p, 則其數(shù)學(xué)期望為: 又如,對(duì)于服從位置參數(shù)為且尺度參數(shù)為2的正 態(tài)分布的隨機(jī)變量x,由其概率密度函數(shù)可計(jì)算出其 數(shù)學(xué)期望就是其位置參數(shù)。標(biāo)準(zhǔn)正態(tài)分布隨機(jī)變
20、量的數(shù)學(xué)期望為0。 pqppxxe n i ii 01 1 (一)算術(shù)平均數(shù) (3)數(shù)學(xué)期望的性質(zhì) 若c為常數(shù),則必有:e(c)=c 若c為任意常數(shù),x為隨機(jī)變量,則必有: e(cx)=ce(x) 若x1、x2、xm均為隨機(jī)變量,則必有: e(x1+x2+xm)=e(x1)+e(x2)+e(xm) 若x1、x2、xm均為隨機(jī)變量,且相互獨(dú)立,則: e(x1x2xm)=e(x1)e(x2)e(xm) 若x是隨機(jī)變量,則必有: e(x)e(x) (二)中位數(shù) 1 1、定義、定義 中位數(shù)是在按觀測(cè)變量值的大小順序排列 所形成的變量值數(shù)列中點(diǎn)位置上的變量值。對(duì) 于觀測(cè)變量x,假設(shè)共取得n個(gè)觀測(cè)值,各個(gè)
21、觀 測(cè)值按大小順序排列為x(1)、x(2)、x(n), 則其中位數(shù)可定義為: 為偶數(shù)。 為奇數(shù); nxx nx x nn n , 2 1 , 1 22 2 1 (二)中位數(shù) 2、組距分組次數(shù)分布數(shù)據(jù) 的中位數(shù)計(jì)算 w f f f ux w f f f lx m u m l 2 2 (三)眾數(shù) 1、定義:眾數(shù)是隨機(jī)變量的觀測(cè)值中出現(xiàn)次 數(shù)或密度最大的變量觀測(cè)值 。 2、組距分組次數(shù)分布數(shù)據(jù)計(jì)算眾數(shù) w ffff ff ux w ffff ff lx 1010 10 1010 10 f(x) x x x x f(x) x x x x 三三、均值、中位數(shù)和眾數(shù)三者、均值、中位數(shù)和眾數(shù)三者 之間的關(guān)系
22、之間的關(guān)系 對(duì)于對(duì)稱分布,有: 對(duì)于右偏分布,有: 對(duì)于左偏分布,有: 經(jīng)驗(yàn)關(guān)系式: xxx xxx xxx xxxx 3 四、離散程度測(cè)度的意義離散程度測(cè)度的意義 (一)離散程度的概念所謂離散程度, 即觀測(cè)變量各個(gè)取值之間的差異程度。 (二)離散程度測(cè)度的意義 1、通過對(duì)隨機(jī)變量取值之間離散程度的 測(cè)定,可以反映各個(gè)觀測(cè)個(gè)體之間的差 異大小,從而也就可以反映分布中心指 標(biāo)對(duì)各個(gè)觀測(cè)變量值代表性的高低。 2、通過對(duì)隨機(jī)變量取值之間離散程度的 測(cè)定,可以反映隨機(jī)變量次數(shù)分布密度 曲線的瘦俏或矮胖程度。 五、離散程度測(cè)度指標(biāo)離散程度測(cè)度指標(biāo) 可用來測(cè)度觀測(cè)變量值之間差異程度的 指標(biāo)有很多,在統(tǒng)計(jì)分
23、析推斷中最常用 的主要有極差、平均差和標(biāo)準(zhǔn)差等幾種。 (一)極差 極差又稱全距,是觀測(cè)變量的最大取值 與最小取值之間的離差,也就是觀測(cè)變 量的最大觀測(cè)值與最小觀測(cè)值之間的區(qū) 間跨度。 極差的計(jì)算公式為: r=max(xi)-min(xi) (二)平均差 平均差是隨機(jī)變量 各個(gè)取值偏差絕對(duì) 值的算術(shù)平均數(shù)。 由于所掌握數(shù)據(jù)形 式的不同,平均差 的計(jì)算有簡(jiǎn)單平均 差和加權(quán)平均差兩 種不同的方式。 n xx d n i i 1 n i i n i ii f fxx d 1 1 (三)標(biāo)準(zhǔn)差 標(biāo)準(zhǔn)差是隨機(jī)變量各個(gè)取值偏差平方的 平均數(shù)的算術(shù)平方根,是最常用的反映 隨機(jī)變量分布離散程度的指標(biāo)。 標(biāo)準(zhǔn)差既
24、可以根據(jù)樣本數(shù)據(jù)計(jì)算,也可 以根據(jù)觀測(cè)變量的理論分布計(jì)算,分別 稱為樣本標(biāo)準(zhǔn)差和總體標(biāo)準(zhǔn)差。 1、樣本標(biāo)準(zhǔn)差的計(jì)算樣本標(biāo)準(zhǔn)差的計(jì)算 (1)對(duì)于未分組整理的 各個(gè)觀測(cè)變量值數(shù)據(jù), 計(jì)算標(biāo)準(zhǔn)差應(yīng)采用簡(jiǎn)單 平均的方法。 (2)對(duì)于已分組整理的 分組次數(shù)分布數(shù)據(jù), 計(jì)算標(biāo)準(zhǔn)差應(yīng)采用加 權(quán)平均的方法 。 n xx s n i i 1 2 n i i n i ii f fxx s 1 1 2 2、理論分布的標(biāo)準(zhǔn)差與方差理論分布的標(biāo)準(zhǔn)差與方差 (1)定義 標(biāo)準(zhǔn)差是最常用的理論分布模型正態(tài) 分布的參數(shù)之一,在理論分析中最常用 來描述隨機(jī)變量分布的離散程度。標(biāo)準(zhǔn) 差的平方稱為方差,與標(biāo)準(zhǔn)差有著同樣 的作用。隨機(jī)
25、變量x的理論分布的方差常 記為var(x)或2,其定義為: 2=var(x)=ex-e(x)2 2、理論分布的標(biāo)準(zhǔn)差與方差理論分布的標(biāo)準(zhǔn)差與方差 (2)離散隨機(jī)變量的方差 對(duì)于離散隨機(jī)變量x,假設(shè)共有n個(gè)不同取 值,取值xi的概率為pi,i =1、2、n,則方 差為: 例如,對(duì)于服從兩點(diǎn)分布的隨機(jī)變量x,其 取值為1的概率為p,取值為0的概率為q=1-p, 數(shù)學(xué)期望為e(x)=p,則其方差為: var(x)=(1-p)2p+(0-p)2q=pq n i ii pxexxvar 1 2 2、理論分布的標(biāo)準(zhǔn)差與方差理論分布的標(biāo)準(zhǔn)差與方差 (3)連續(xù)隨機(jī)變量的方差 對(duì)于連續(xù)型隨機(jī)變量x,假設(shè)其分布密
26、度函 數(shù)f(x),則其方差的計(jì)算公式為: 例如,對(duì)于服從位置參數(shù)為且尺度參數(shù)為 2的正態(tài)分布的隨機(jī)變量x,其數(shù)學(xué)期望等于 其位置參數(shù),其方差就是其尺度參數(shù)2,標(biāo) 準(zhǔn)正態(tài)分布的方差為1。 dxxfxexxvar 2 2、理論分布的標(biāo)準(zhǔn)差與方差理論分布的標(biāo)準(zhǔn)差與方差 (4)方差的性質(zhì) 任何隨機(jī)變量的方差均非負(fù)。var(x)0 若c為常數(shù),x為隨機(jī)變量,則有: var(cx)=c2var(x) 若隨機(jī)變量x1、x2、xm均相互獨(dú)立,則有: var(x1+x2+xm)=var(x1)+var(x2)+var(xm) 若x為隨機(jī)變量,c為任一常數(shù),則有: e(x-c)2=ex-e(x)2+c-e(x)2
27、 對(duì)于任意隨機(jī)變量x,均有: var(x)=e(x2)-e(x)2 (四)離散系數(shù) 1、離散系數(shù)的概念 各個(gè)衡量隨機(jī)變量 取值之間絕對(duì)差異的 指標(biāo)與算術(shù)平均數(shù)的 比率,通稱為離散系 數(shù)。 2、計(jì)算離散系數(shù)的意 義消除量綱和數(shù) 量級(jí)的差異,便于不 同觀測(cè)變量之間的比 較。 3、計(jì)算公式 %100 %100 %100 x s v x d v x r v s d r 六、測(cè)度偏度和峰度的意義 (一)概念所謂偏度,就是觀測(cè)變量取值 分布的非對(duì)稱程度;所謂峰度,就是觀測(cè)變量 取值分布密度曲線頂部的平坦程度或尖峭程度。 (二)意義 1、加深人們對(duì)觀測(cè)變量取值的散布狀況的認(rèn) 識(shí); 2、將觀測(cè)變量的偏度和峰度
28、指標(biāo)值與某種理 論分布的偏度和峰度指標(biāo)值進(jìn)行比較,以判斷 觀測(cè)變量的分布與某種理論分布的近似程度。 七、偏度的測(cè)度 (一)直觀偏度系數(shù)一)直觀偏度系數(shù) 1、皮爾遜偏度系數(shù)皮爾遜偏度系數(shù) 2、鮑萊偏度系數(shù)鮑萊偏度系數(shù) s xx sk p lu lu b qq qxxq sk 七、偏度的測(cè)度 (二)矩偏度系數(shù) 1、矩的定義原點(diǎn)矩和中心矩 2、矩偏度系數(shù) f fxx s f fx x m m m m 3 3 s s skm 八、峰度的測(cè)度 矩峰度系數(shù)隨機(jī)變量的四階中心矩 與其標(biāo)準(zhǔn)差的四次方相除,所得比率就 稱為峰度系數(shù),其計(jì)算公式為: 4 4 s s ku 九、相關(guān)程度測(cè)度的意義相關(guān)程度測(cè)度的意義
29、(一)相關(guān)關(guān)系的概念 對(duì)于兩個(gè)觀測(cè)變量,若一個(gè)變量的取值除 了受另一個(gè)變量取值的影響外,還受各種隨機(jī) 因素的影響,則變量間的這種非確定性關(guān)系就 稱為相關(guān)關(guān)系。 (二)相關(guān)關(guān)系測(cè)度的意義 1、了解兩個(gè)觀測(cè)變量之間相關(guān)關(guān)系的方向; 2、了解兩個(gè)觀測(cè)變量之間相互依賴關(guān)系的程度, 為構(gòu)建觀測(cè)變量之間相互關(guān)系模型奠定基礎(chǔ)。 十、相關(guān)程度測(cè)度的指標(biāo)相關(guān)程度測(cè)度的指標(biāo) 對(duì)兩隨機(jī)變量之間的相關(guān)關(guān)系及其密切 程度進(jìn)行測(cè)度,需要根據(jù)兩變量觀測(cè)值 的復(fù)合分組次數(shù)分布進(jìn)行,或在理論上 根據(jù)兩變量的聯(lián)合概率分布模型進(jìn)行。 測(cè)度觀測(cè)變量之間相關(guān)關(guān)系的指標(biāo)主要 有協(xié)方差和相關(guān)系數(shù)兩個(gè)。 (一)協(xié)方差 1、定義協(xié)方差是兩個(gè)隨
30、機(jī)變量成對(duì) 觀測(cè)值偏差乘積的算術(shù)平均數(shù) 。 2、樣本協(xié)方差 n i iixy yyxx n s 1 1 n i i n i iii xy f fyyxx s 1 1 (一)協(xié)方差 3、總體協(xié)方差對(duì)于兩隨機(jī)變量的理論分 布,也可類似地定義其協(xié)方差。兩隨機(jī)變量x 和y的理論分布的協(xié)方差常記作cov(x,y)或xy, 其定義公式為: xy=cov(x,y)=ex-e(x)y-e(y) 例如,對(duì)于聯(lián)合分布為二元正態(tài)分布的 隨機(jī)變量x和y,可得二變量的協(xié)方差為: 2121 , dxdyyxfyxyxcov (一)協(xié)方差 4、協(xié)方差的性質(zhì) 隨機(jī)變量x與y的協(xié)方差和y與x的協(xié)方差相等。 cov(x, y)=
31、cov(y, x) 若隨機(jī)變量x和y相互獨(dú)立,則有:cov(x, y)=0 若1和2為任意常數(shù),則有: cov(1x, 2y)=12cov(x, y) 對(duì)于任意三個(gè)隨機(jī)變量,均有: cov(x1+x2, y)=cov(x1, y )+cov(x2, y) cov(x, y1+y2)=cov(x, y1)+cov(x, y2) 對(duì)于任意兩隨機(jī)變量,均有: cov(x, y)=e(xy)-e(x)e(y) (二)相關(guān)系數(shù) 1、定義相關(guān)系數(shù)是兩個(gè)隨機(jī)變量的 協(xié)方差對(duì)其兩標(biāo)準(zhǔn)差之積的比率 。 2、總體相關(guān)系數(shù) 3、樣本相關(guān)系數(shù) yx xy yx xy ss s r (二)相關(guān)系數(shù) 4、相關(guān)系數(shù)的取值范
32、圍 相關(guān)系數(shù)r的數(shù)值介于-1和+1之間,其絕對(duì)值 介于0和1之間。即有: -1r+1 5、相關(guān)系數(shù)的作用 (1)相關(guān)系數(shù)的符號(hào)可反映兩隨機(jī)變量相互依 存關(guān)系的方向。相關(guān)系數(shù)為正,稱為正相關(guān); 相關(guān)系數(shù)為負(fù),稱為負(fù)相關(guān)。 (2)相關(guān)系數(shù)的絕對(duì)值的大小則可反映兩隨機(jī) 變量線性相關(guān)關(guān)系的密切程度。 第五章 參數(shù)估計(jì) 一、總體參數(shù)及其估計(jì)量 二、構(gòu)造估計(jì)量的方法矩法估計(jì) 三、判斷估計(jì)量?jī)?yōu)劣的標(biāo)準(zhǔn) 四、估計(jì)量的標(biāo)準(zhǔn)誤 五、抽樣分布的概念 六、基本的抽樣分布 七、區(qū)間估計(jì)的概念 八、區(qū)間估計(jì)的方法 九、樣本容量的確定 一、總體參數(shù)及其估計(jì)量總體參數(shù)及其估計(jì)量 總體指標(biāo)又稱為總體參數(shù),根據(jù)樣本數(shù)據(jù)來推 斷總
33、體指標(biāo)數(shù)值就稱為參數(shù)估計(jì)。 集中了樣本中有關(guān)總體參數(shù)信息的樣本指標(biāo)稱 為統(tǒng)計(jì)量,該統(tǒng)計(jì)量就可用來估計(jì)所求的總體 指標(biāo)的數(shù)值。用來估計(jì)總體指標(biāo)數(shù)值的統(tǒng)計(jì)量 又稱為該總體指標(biāo)的估計(jì)量,該估計(jì)量的數(shù)值 就稱為該總體指標(biāo)的估計(jì)值。 總體參數(shù)值是確定的,但是未知的;樣本估計(jì) 量是隨機(jī)變量,其估計(jì)值是某個(gè)給定樣本的計(jì) 算值。 二、構(gòu)造估計(jì)量的方法構(gòu)造估計(jì)量的方法矩法估計(jì)矩法估計(jì) (一)矩法估計(jì)的概念所謂矩法估計(jì),概括來 說就是用樣本矩作為總體同一矩的估計(jì)量,用樣 本矩的函數(shù)作為總體相應(yīng)矩同一函數(shù)的估計(jì)量。 (二)常用的總體參數(shù)及其矩法估計(jì)量 n i i n i i x n n xnn n n pp x n
34、 x 1 1 1 1 yx xy n i i n i i ss s r xx n s xx n s 1 1 1 2 1 2 22 三、判斷估計(jì)量?jī)?yōu)劣的標(biāo)準(zhǔn)判斷估計(jì)量?jī)?yōu)劣的標(biāo)準(zhǔn) 為了保證用于估計(jì)總體指標(biāo)的估計(jì)量準(zhǔn) 確可靠,就必須要求所使用的估計(jì)量具 備一些優(yōu)良的性質(zhì),這些性質(zhì)就構(gòu)成了 判斷一個(gè)估計(jì)量?jī)?yōu)劣的標(biāo)準(zhǔn)。 常用的標(biāo)準(zhǔn)主要有一致性、無偏性、有 效性、充分性和穩(wěn)健性等。 (一)一致性 對(duì)于總體指標(biāo)的一個(gè)估計(jì)量,若其取值隨著樣 本容量的增大越來越接近于總體指標(biāo)的真值, 即估計(jì)誤差越來越小的可能性越來越大直至 100%,則該估計(jì)量就稱為總體指標(biāo)的一致估計(jì) 量,或稱為相合估計(jì)量。 可以證明,由矩估計(jì)
35、法所構(gòu)造出的估計(jì)量都是 所估計(jì)總體指標(biāo)的一致估計(jì)量。如樣本均值是 總體均值的一致估計(jì)量,樣本比例p是總體比 例p的一致估計(jì)量,樣本方差s2也是總體方差 2的一致估計(jì)量。 (二)無偏性 對(duì)于總體指標(biāo)的一個(gè)估計(jì)量,若其估計(jì)值的數(shù)學(xué)期 望等于該總體指標(biāo)的真值,即其估計(jì)誤差的數(shù)學(xué)期 望為0,則該估計(jì)量就稱為是總體指標(biāo)的無偏估計(jì)量。 可以證明,樣本均值是總體均值的無偏估計(jì)量,而 常規(guī)樣本方差卻并不是總體方差2的無偏估計(jì)量, 修正樣本方差s2是總體方差2的無偏估計(jì)量。修正 樣本方差即無偏樣本方差為: n i i xx n s 1 2 2 1 1 (三)有效性 對(duì)于任一總體指標(biāo),若存在兩個(gè)無偏估計(jì)量,其中一
36、 個(gè)估計(jì)量的估計(jì)誤差平均來說小于另一個(gè)估計(jì)量的估 計(jì)誤差,則稱前一個(gè)估計(jì)量比后一個(gè)估計(jì)量有效。 無偏估計(jì)量的估計(jì)誤差大小可用其方差衡量,所以兩 個(gè)無偏估計(jì)量比較,方差較小者較為有效。 對(duì)于一個(gè)總體指標(biāo)來說,若在其所有無偏估計(jì)量中能 夠找到一個(gè)估計(jì)量,其方差最小,則該估計(jì)量就稱為 是該總體指標(biāo)的最佳無偏估計(jì)量。可以證明,樣本均 值是總體均值的最佳無偏估計(jì)量。 對(duì)于有偏估計(jì)量,衡量其有效性可用均方誤差代替方 差。估計(jì)量的均方誤差為: 2 emse (四)充分性 對(duì)于一個(gè)總體指標(biāo),若其估計(jì)量提取了 樣本中包含的有關(guān)該總體指標(biāo)的全部信 息,則此估計(jì)量就稱為該總體指標(biāo)的充 分估計(jì)量。 在多數(shù)情形下,矩法
37、估計(jì)給出的總體指 標(biāo)的估計(jì)量均是充分的。如在正態(tài)分布 總體之下,樣本均值是總體均值的充分 估計(jì)量,樣本方差s2也是總體方差2的 充分估計(jì)量。 (五)穩(wěn)健性 如果用來估計(jì)總體指標(biāo)的樣本估計(jì)量對(duì)樣 本數(shù)據(jù)的污染不敏感,也就是說估計(jì)量的 數(shù)值不受被污染數(shù)據(jù)的干擾或受其干擾不 大,那么該估計(jì)量就是總體指標(biāo)的一個(gè)穩(wěn) 健估計(jì)量。 實(shí)踐中常用的一種估計(jì)總體均值的穩(wěn)健估 計(jì)量是切尾均值,切尾均值的計(jì)算公式為: 1 1 1 n nj j x n x 四、估計(jì)量的標(biāo)準(zhǔn)誤估計(jì)量的標(biāo)準(zhǔn)誤 (一)標(biāo)準(zhǔn)誤的概念標(biāo)準(zhǔn)誤的概念 樣本估計(jì)量的標(biāo)準(zhǔn)差通常稱為該估 計(jì)量的標(biāo)準(zhǔn)誤差,簡(jiǎn)稱標(biāo)準(zhǔn)誤。即: 標(biāo)準(zhǔn)誤是衡量一個(gè)估計(jì)量抽樣估計(jì)
38、誤差大小的一個(gè)尺度。 2 eevar (二)標(biāo)準(zhǔn)誤的計(jì)算標(biāo)準(zhǔn)誤的計(jì)算 1 1、樣本均值的標(biāo)準(zhǔn)誤、樣本均值的標(biāo)準(zhǔn)誤 (1 1)放回抽樣)放回抽樣 (2 2)不放回抽樣)不放回抽樣 n x n n n x 1 2 n s x n n n s x 1 2 (二)標(biāo)準(zhǔn)誤的計(jì)算標(biāo)準(zhǔn)誤的計(jì)算 2 2、樣本比例的標(biāo)準(zhǔn)誤、樣本比例的標(biāo)準(zhǔn)誤 (1 1)放回抽樣)放回抽樣 (2 2)不放回抽樣)不放回抽樣 n pp p 1 n n n pp p 1 1 n pp p 1 n n n pp p 1 1 (三)影響標(biāo)準(zhǔn)誤的因素(三)影響標(biāo)準(zhǔn)誤的因素 1、總體中各個(gè)體之間的差異程度??傮w中各 個(gè)體取值之間的差異程度大即
39、2也大,各總體 指標(biāo)估計(jì)量的標(biāo)準(zhǔn)誤的數(shù)值也就大,抽樣估計(jì) 誤差也就大。 2、樣本容量的大小。樣本容量大,總體指標(biāo) 估計(jì)量的標(biāo)準(zhǔn)誤則小,抽樣估計(jì)誤差也就越??; 反之,樣本容量越小,抽樣估計(jì)誤差及其標(biāo)準(zhǔn) 誤也就越大。 3、抽取樣本的方式方法。抽樣方式方法不同, 總體指標(biāo)估計(jì)量的標(biāo)準(zhǔn)誤就會(huì)不同,抽樣估計(jì) 誤差的大小也就不同。 五、抽樣分布的概念五、抽樣分布的概念 對(duì)于給定的總體和抽樣方式以及樣本容 量,樣本指標(biāo)取值的概率分布就稱為抽 樣分布。 確定樣本容量下的抽樣分布稱為樣本統(tǒng) 計(jì)量的精確分布,而樣本容量趨于無窮 大時(shí)的抽樣分布則稱為樣本統(tǒng)計(jì)量的極 限分布。 六、基本的抽樣分布六、基本的抽樣分布 (
40、 (一一) )樣本均值的抽樣分布樣本均值的抽樣分布 1、任意總體大樣本 2、正態(tài)總體小樣本 n nx 2 , 1 ,0 n n x z 1 nt ns x t 六、基本的抽樣分布六、基本的抽樣分布 ( (二二) )樣本比例的抽樣分布樣本比例的抽樣分布大樣本 n pp pnp 1 , 1 , 0 1 n n pp pp z 六、基本的抽樣分布六、基本的抽樣分布 (三)樣本方差的抽樣分布(三)樣本方差的抽樣分布正態(tài)總體正態(tài)總體 1 1 2 2 2 n sn 七、區(qū)間估計(jì)的概念七、區(qū)間估計(jì)的概念 記總體指標(biāo)為,樣本估計(jì)量為 ,事先給定 概率為1-,若根據(jù)樣本估計(jì)量的概率分布可計(jì) 算出一個(gè)區(qū)間 ,使得
41、該區(qū)間包含總體參數(shù) 的概率等于事先給定的概率1-,即有: 成立,則該區(qū)間 就稱為總體參數(shù)的置信 區(qū)間,而概率1-就稱為是置信概率或置信度。 ul , 1 ul p ul , 八、區(qū)間估計(jì)的方法八、區(qū)間估計(jì)的方法 (一)均值的區(qū)間估計(jì)(一)均值的區(qū)間估計(jì) 1 1、大樣本下均值的區(qū)間估計(jì)、大樣本下均值的區(qū)間估計(jì) 由中心極限定理可知,對(duì)于大樣本而言, 樣本均值的概率分布總可近似地看作是 正態(tài)分布。若事先給定置信概率為1-, 則查標(biāo)準(zhǔn)正態(tài)分布概率數(shù)值表,可得標(biāo) 準(zhǔn)正態(tài)分布的上側(cè)分位數(shù)z/2,就可得出 總體均值的置信區(qū)間為: n zx n zx 22 , (一)均值的區(qū)間估計(jì) 2、小樣本下正態(tài)總體均值的
42、區(qū)間估計(jì) 對(duì)于來自正態(tài)總體的一個(gè)小樣本,在給定 的置信概率1-之下,查自由度為(n-1) 的t分布表,可得t分布的上側(cè)分位數(shù)t/2, 可得總體均值的置信區(qū)間為: n tx n tx 22 , (二)比例的區(qū)間估計(jì)(二)比例的區(qū)間估計(jì) 總體比例是兩點(diǎn)分布總體的均值,其估 計(jì)量樣本比例則是來自該總體的隨機(jī)樣 本的均值。因此,在大樣本條件下,可 根據(jù)中心極限定理用類似于大樣本情形 下總體均值區(qū)間估計(jì)的方法來對(duì)總體比 例進(jìn)行區(qū)間估計(jì)。有: n pp zp n pp zp 1 , 1 22 (三)(三)方差的區(qū)間估計(jì)方差的區(qū)間估計(jì) 由抽樣分布理論可知,對(duì)于來自正態(tài)總體 的一個(gè)簡(jiǎn)單隨機(jī)樣本,其修正樣本方差
43、s2 與總體方差2比值的(n-1)倍服從自由 度為(n-1)的2分布。若給定置信概率 1-,查自由度為(n-1)的2分布表可 得兩個(gè)分位數(shù)1-/2和/2,則可得正態(tài) 總體方差2的置信區(qū)間為: 2 21 2 2 2 2 1 , 1 snsn (四)(四)單側(cè)置信區(qū)間單側(cè)置信區(qū)間 所謂單側(cè)置信區(qū)間,是將待估總體指標(biāo)的上置信限 或下置信限指定在其上界或下界值上,并根據(jù)給定 的置信概率求出另一置信限而得到的置信區(qū)間。記 待估計(jì)總體指標(biāo)為,其取值上界為 ,取值下界 為 ,樣本估計(jì)量為 ,對(duì)于給定的置信概率1-, 若有: 或者,有: 則稱區(qū)間 和 為總體指標(biāo)的單側(cè)置信 區(qū)間。 u l 1 ul p 1 u
44、l p ul , ul , 九、樣本容量的確定九、樣本容量的確定 若在給定1-的置信概率之下,要求用樣 本均值估計(jì)總體均值的抽樣估計(jì)誤差不超 過,則由總體均值的抽樣估計(jì)誤差限的 計(jì)算公式,可計(jì)算出必需最小樣本容量。 (一)放回抽樣 (二)不放回抽樣 2 22 2 0 z n n n n n z z zn nz n 0 0 222 2 222 2 22 2 2 22 2 1 1 1 第六章第六章 假設(shè)檢驗(yàn)假設(shè)檢驗(yàn) 一、假設(shè)檢驗(yàn)的原理 二、總體指標(biāo)假設(shè)檢驗(yàn) 三、分布假設(shè)檢驗(yàn) 四、假設(shè)檢驗(yàn)的兩類錯(cuò)誤及功效 一、假設(shè)檢驗(yàn)的原理 (一)統(tǒng)計(jì)假設(shè)和檢驗(yàn)統(tǒng)計(jì)量 所謂統(tǒng)計(jì)假設(shè),就是關(guān)于總體分布特征的某種論斷。
45、 關(guān)于總體參數(shù)假設(shè)的檢驗(yàn),是假設(shè)檢驗(yàn)的核心內(nèi)容。 記總體參數(shù)為,若要判斷是否等于某已知數(shù)值0, 則該參數(shù)假設(shè)可表示為: h0:=0, h1:0 其中,假設(shè)h0:=0就是所要檢驗(yàn)的假設(shè),稱為原 假設(shè)或零假設(shè);而假設(shè)h1:0則稱為對(duì)立假設(shè)或 備擇假設(shè)。 要檢驗(yàn)?zāi)硞€(gè)假設(shè)是否正確,需根據(jù)樣本所提供的信 息來進(jìn)行。包含總體分布特征的全部樣本信息的樣 本指標(biāo),是進(jìn)行假設(shè)檢驗(yàn)的依據(jù),稱為檢驗(yàn)統(tǒng)計(jì)量。 (二)顯著性水平和拒絕(二)顯著性水平和拒絕域域 進(jìn)行假設(shè)檢驗(yàn),概率論中關(guān)于小概率事件在一次 試驗(yàn)中是不可能事件的原則是其所遵循的基本原 則。通常取小概率事件的概率臨界值為0.05或 0.01,用表示,稱為假設(shè)
46、檢驗(yàn)的顯著性水平。 在原假設(shè)成立的條件下,由檢驗(yàn)統(tǒng)計(jì)量的概率分 布,對(duì)于給定的顯著性水平,就可確定出由抽樣 誤差引起的樣本估計(jì)值對(duì)總體參數(shù)原假設(shè)值的可 能的最大偏離值,作為判斷原假設(shè)正確與否的臨 界值。樣本估計(jì)量偏離總體參數(shù)原假設(shè)值過大的 區(qū)域,就是否定原假設(shè)的區(qū)域,稱為否定域或拒 絕域,而否定域以外的區(qū)域則稱為接受域。 (二)顯著性水平和拒絕(二)顯著性水平和拒絕域域 1、雙側(cè)檢驗(yàn) 若要檢驗(yàn)的假設(shè)為: h0:=0, h1:0 則否定域應(yīng)建立在 與原假設(shè)值的正 負(fù)偏離超出給定 臨界值的兩邊, 這種檢驗(yàn)方法稱 為雙側(cè)檢驗(yàn)。 f /2 /2 0 拒絕域 l 2 接受域 u 2 拒絕域 (二)顯著性
47、水平和拒絕域(二)顯著性水平和拒絕域 2、左側(cè)檢驗(yàn) 若要檢驗(yàn)的假設(shè)為: h0:0, h1:0 則否定域應(yīng)建立在 與原假設(shè)值的負(fù) 偏離超出給定臨 界值的一邊,這 種檢驗(yàn)方法稱為 左側(cè)檢驗(yàn)。 f 0 拒絕域 l 接受域 (二)顯著性水平和拒絕域(二)顯著性水平和拒絕域 3、右側(cè)檢驗(yàn) 若要檢驗(yàn)的假設(shè)為: h0:0, h1:0 則否定域應(yīng)建立在 與原假設(shè)值的正 偏離超出給定臨 界值的一邊,這 種檢驗(yàn)方法稱為 右側(cè)檢驗(yàn)。 f 0 接受域 u 拒絕域 (三)假設(shè)檢驗(yàn)的(三)假設(shè)檢驗(yàn)的p值值 檢驗(yàn)統(tǒng)計(jì) 量的取值 落在其實(shí) 際樣本值 之外的概 率,就稱 為假設(shè)檢 驗(yàn)的p值。 f p 0 u s (四)假設(shè)檢驗(yàn)
48、的程序(四)假設(shè)檢驗(yàn)的程序 (1)提出原假設(shè)h0和備擇假設(shè)h1; (2)規(guī)定檢驗(yàn)的顯著性水平; (3)構(gòu)造用于檢驗(yàn)的樣本指標(biāo),即檢驗(yàn)統(tǒng)計(jì)量; (4)在原假設(shè)為真的假定下,根據(jù)檢驗(yàn)統(tǒng)計(jì)量的 概率分布,確定出檢驗(yàn)統(tǒng)計(jì)量的臨界值,并由此 臨界值構(gòu)造出檢驗(yàn)的拒絕域和接受域;或者計(jì)算 出假設(shè)檢驗(yàn)的p值; (5)比較檢驗(yàn)統(tǒng)計(jì)量的實(shí)際樣本值與其臨界值, 或者比較檢驗(yàn)的p值與顯著性水平,并根據(jù)比 較的結(jié)果做出拒絕或不能拒絕原假設(shè)的決策。 二、總體指標(biāo)假設(shè)檢驗(yàn)二、總體指標(biāo)假設(shè)檢驗(yàn) (一)均值的檢驗(yàn)(一)均值的檢驗(yàn) 1 1、單一總體均值的檢驗(yàn)、單一總體均值的檢驗(yàn) h0:=0,h1:0或0或0 (1)大樣本情形正態(tài)
49、分布z檢驗(yàn) (2)小樣本情形(正態(tài)總體)t檢驗(yàn) 1 , 0 0 n n x z 1 0 nt ns x t (一)均值的檢驗(yàn)(一)均值的檢驗(yàn) 2 2、兩總體均值的比較、兩總體均值的比較 h0:1=2,h1:12或12或12 (1)大樣本情形正態(tài)分布z檢驗(yàn) (2)小樣本情形(正態(tài)總體)t檢驗(yàn) 其中s2為用自由度加權(quán)的兩樣本方差的平均數(shù)。 1 ,0 2 2 2 1 2 1 2121 n nn xx z 2 11 21 21 2121 nnt nn s xx t (二)比例的檢驗(yàn)(二)比例的檢驗(yàn) 1 1、單一總體比例的檢驗(yàn)、單一總體比例的檢驗(yàn) 大樣本 (1)假設(shè) h0: p=p0 , h1: pp0
50、 或pp0 或pp2 或p10, 使用z檢驗(yàn)法,可得: 2 01 2 2 zz n 第七章 方差分析 一、方差分析的概念 二、方差分析的意義 三、單因子數(shù)據(jù)結(jié)構(gòu)模型三、單因子數(shù)據(jù)結(jié)構(gòu)模型 四、模型參數(shù)的估計(jì)四、模型參數(shù)的估計(jì) 五、單因子方差分析表五、單因子方差分析表 六、各水平效應(yīng)的多重比較六、各水平效應(yīng)的多重比較 七、隨機(jī)區(qū)組試驗(yàn)與多因素方差分析的特點(diǎn) 一、方差分析的概念 在科學(xué)實(shí)驗(yàn)和生產(chǎn)經(jīng)營(yíng)活動(dòng)中,人們常常 需要對(duì)影響所觀測(cè)變量的各種主要因素進(jìn) 行分析,以便找出各個(gè)因素在什么狀態(tài)下 可使所觀測(cè)的變量取得最佳數(shù)值。為此, 首先需要在各種主要影響因素的不同狀態(tài) 下對(duì)所研究變量的取值進(jìn)行觀測(cè),然
51、后再 對(duì)觀測(cè)所得數(shù)據(jù)進(jìn)行比較分析。方差分析 就是分析推斷各種因素狀態(tài)對(duì)所觀測(cè)變量 的影響效應(yīng)的一種統(tǒng)計(jì)分析方法。 二、方差分析的意義 首先,需要確定的是一個(gè)因子的各個(gè)水平的作用 是否相同。如果相同,說明這個(gè)因子不管取哪種 水平對(duì)觀測(cè)變量無不同影響,那么這個(gè)因子實(shí)際 上無關(guān)緊要,可納入平均效應(yīng)中去,這時(shí)稱這個(gè) 因子是不顯著的。自然,如果一個(gè)因子的各個(gè)水 平的作用不同,那么這時(shí)就稱此因子是顯著的。 其次,如果所考察的因子是顯著的,那么就要找 出該因子的最佳水平或者各個(gè)顯著因子的各種水 平的最佳配合,以指導(dǎo)生產(chǎn)經(jīng)營(yíng)的實(shí)踐活動(dòng)。 三、單因子數(shù)據(jù)結(jié)構(gòu)模型三、單因子數(shù)據(jù)結(jié)構(gòu)模型 假設(shè)所考察的因子為a,有m
52、個(gè)不同的水平a1, a2,am。在各個(gè)水平下分別進(jìn)行了n1,n2,nm次 獨(dú)立實(shí)驗(yàn)觀測(cè),得到變量觀測(cè)值為yij,i1,2,m, j1,2,ni,則有數(shù)據(jù)結(jié)構(gòu)模型為: yij=+i+ij;i1,2,m;j1,2,ni. 或者寫為: yij=i+ij ;i1,2,m;j1,2,ni. 其中為平均效應(yīng),i為因子a的第i個(gè)水平ai對(duì)觀測(cè) 變量的作用,稱為水平ai的效應(yīng),i=+i為在水平 ai下觀測(cè)變量的總體平均值,ij仍表示實(shí)驗(yàn)觀測(cè)的 隨機(jī)誤差。 四、模型參數(shù)的估計(jì)四、模型參數(shù)的估計(jì) (一)總均值和組均值 (二)模型參數(shù)的矩估計(jì) i n j ij i i y n y 1 1 m i ii m i n
53、j ij yn n y n y i 111 11 yy y y ii ii m i n j iije i yy mn s 11 2 22 1 五、單因子方差分析表五、單因子方差分析表 (一)檢驗(yàn)的假設(shè) h0: 12m=0 h1: 至少i0 或 h0: 12m h1: 至少ik (二)總變動(dòng)平方和的分解 sstssasse 即: m i n j iij m i ii m i n j ij ii yyyynyy 11 2 1 2 11 2 五、單因子方差分析表五、單因子方差分析表 (三)方差分析表的構(gòu)造 (四)檢驗(yàn)方法f檢驗(yàn)(單側(cè)) 單因子方差分析表 方差來源 平方和 自由度 均方 f 值 p 值
54、 組間 組內(nèi) ssa sse m-1 n-m ssa/(m-1) sse/(n-m) f p 總和 sst n-1 mnmf mnsse mssa s s f e a , 1 1 2 2 六、各水平效應(yīng)的多重比較六、各水平效應(yīng)的多重比較 (一)檢驗(yàn)假設(shè) h0:ik h1: ik 或 h0: ik h1: ik (二)檢驗(yàn)方法t檢驗(yàn)(雙側(cè)) mnt nn s yy t ki e kiki 11 七、多因子方差分析的特點(diǎn) 一、隨機(jī)區(qū)組試驗(yàn)的特點(diǎn)及其數(shù)據(jù)分析 試驗(yàn)單位之間存在較大的差異 二、多因子方差分析的特點(diǎn) 不同因子的水平組合可能存在 交互作用 第八章 回歸分析 一、回歸的概念與回歸模型的確定回
55、歸的概念與回歸模型的確定 二二、樣本觀測(cè)模型和樣本回歸函數(shù)、樣本觀測(cè)模型和樣本回歸函數(shù) 三、一元線性回歸分析三、一元線性回歸分析 四、多元線性回歸分析四、多元線性回歸分析 五、回歸診斷五、回歸診斷 一、回歸的概念與模型確定 設(shè)隨機(jī)變量y與變量x1、x2、xk之間存在相關(guān) 關(guān)系,則y與x1、x2、xk的數(shù)學(xué)模型可表示為: yf(x1,x2,xk)u 其中u為隨機(jī)因素影響,若自變量x1、x2、xk的值 給定時(shí),隨機(jī)影響u的期望為0,則因變量y的條件數(shù) 學(xué)期望就是唯一確定的,即有: e(y/x)f(x1、x2、xk) 此條件期望就稱為y的回歸值,表示y的回歸值與自 變量關(guān)系的函數(shù)式就稱為y的回歸函數(shù)
56、。若自變量只 有一個(gè),則稱為一元回歸函數(shù);若自變量有兩個(gè)或 多個(gè),則稱為多元回歸函數(shù)。 一、回歸的概念與模型確定回歸的概念與模型確定 回歸模型的確定方法有二: (一)定性分析 (二)線性近似實(shí)踐中,常用的回歸函數(shù)為 線性函數(shù),相應(yīng)的數(shù)學(xué)模型的形式為: y01x12x2kxku 其中0、1、2、k統(tǒng)稱為回歸系數(shù),因 變量y對(duì)自變量x1、x2、xk的回歸函數(shù)為: e(y/x)01x12x2kxk 二、樣本觀測(cè)模型和樣本回歸函數(shù)二、樣本觀測(cè)模型和樣本回歸函數(shù) 設(shè)樣本觀測(cè)值為(yj,x1j,x2j,xkj), j1,2,n,則對(duì)于線性模型來說,有: yj01x1j2x2jkxkjuj , j1,n.
57、這n個(gè)關(guān)系式稱為因變量y的觀測(cè)模型。由 此觀測(cè)模型可估計(jì)得出模型中各個(gè)參數(shù)的 估計(jì)值,從而得出樣本回歸函數(shù)為: kk xxxy 22110 三、一元線性回歸分析 (一)散點(diǎn)圖 設(shè)樣本觀測(cè)值分別為(x 1 y1)、(x2, y2)、(xn,yn),在平面直角坐標(biāo)系內(nèi) 將這n對(duì)觀測(cè)值用n個(gè)點(diǎn)表示出來,所形成 的圖形稱為散點(diǎn)圖。通過觀察散點(diǎn)圖的形 狀,可輔助判斷回歸函數(shù)的具體形式。一 元線性回歸模型的形式為: y01xu (二)模型參數(shù)的最小二乘估模型參數(shù)的最小二乘估 計(jì)計(jì) 1、最小二乘估計(jì)的原理 所謂最小二乘估計(jì),就是尋找使樣本觀測(cè) 模型的隨機(jī)誤差平方和最小的參數(shù)值作為回歸 模型參數(shù)的估計(jì)值。 2
58、、求一元線性回歸模型系數(shù)的正規(guī)方程組 xyxx yxn 2 10 10 (二)模型參數(shù)的最小二乘估模型參數(shù)的最小二乘估 計(jì)計(jì) 3、回歸系數(shù)的最小二乘估計(jì)公式 4、樣本回歸方程 xy xxn yxxyn 10 2 2 1 xy 10 (二)模型參數(shù)的最小二乘估模型參數(shù)的最小二乘估 計(jì)計(jì) 5、殘差與殘差平方和的計(jì)算 6、回歸模型隨機(jī)誤差的方差的估計(jì) jjjjj xyyye 10 xyyyeq n j j10 2 1 2 2 22 n q s e (三)(三)回歸的方差分析回歸的方差分析 1、因變量總變動(dòng)平方和的分解 即: sst=ssr+sse 2、判定系數(shù) n j jj n j j n j j
59、yyyyyy 1 2 1 2 1 2 2 2 2 yy yy sst ssr r (三)(三)回歸的方差分析回歸的方差分析 3、一元線性一元線性回歸的方差分析表回歸的方差分析表 4、檢驗(yàn)假設(shè) h0:=0,h1:0 5、檢驗(yàn)方法f檢驗(yàn) 方差來源 平方和 自由度均方f值 p值 回歸 殘差 ssr sse 1 n-2 ssr sse/(n-2) fp 總和sstn-1 2, 1 2 nf nsse ssr f (四)(四)回歸系數(shù)的回歸系數(shù)的t檢驗(yàn)檢驗(yàn) 1、檢驗(yàn)的假設(shè) h0: 1=0 , h1: 10 h0: 0=0 , h1: 00 2、檢驗(yàn)的方法t檢驗(yàn) 2 11 1 1 xx s t e 2 2
60、 00 0 1 xx x n s t e (五)利用回歸直線進(jìn)行預(yù)測(cè)(五)利用回歸直線進(jìn)行預(yù)測(cè) 所謂預(yù)測(cè)就是在給定自變量x的數(shù)值的條 件下,估計(jì)因變量y的數(shù)值,有點(diǎn)預(yù)測(cè)和區(qū)間 預(yù)測(cè)兩種。 1、點(diǎn)預(yù)測(cè)點(diǎn)預(yù)測(cè) 2、區(qū)間預(yù)測(cè)區(qū)間預(yù)測(cè) pp xy 10 2 2 2 2 2 2 1 1 1 1 xx xx n sty xx xx n sty y p ep p ep p (六)一元線性回歸模型的推(六)一元線性回歸模型的推 廣廣 實(shí)踐中,有時(shí)用線性模型來描述變量x和y之 間的關(guān)系并不恰當(dāng),這時(shí)就需要考慮各種曲線模 型。對(duì)于有些曲線模型來說,容易將它們化成下 面的形式: g(y)=0+1h(x)+u 若仍假
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 私人二手房售房合同范本
- 司機(jī)保密合同范本
- 年度框架采購(gòu)合同范本
- 低首付貸款合同范本
- 樂器租賃合同范本模板
- 原料肉購(gòu)銷合同范本
- 同行競(jìng)爭(zhēng)合同范本
- 單間鋪面出售合同范本
- 叉車機(jī)床購(gòu)銷合同范本
- 合同范例軟件叫
- 戶外廣告制作安裝合同模板
- 廠房改公寓出租合同范例
- 污水處理廠SBR工藝的設(shè)計(jì)說明
- 2025年國(guó)家自然科學(xué)基金委員會(huì)招聘流動(dòng)編制人員59人歷年高頻重點(diǎn)模擬試卷提升(共500題附帶答案詳解)
- 歷史地理學(xué)研究-深度研究
- 2025江蘇太倉市城市建設(shè)投資集團(tuán)限公司招聘易考易錯(cuò)模擬試題(共500題)試卷后附參考答案
- 2.2 學(xué)會(huì)管理情緒(同步課件)2024-2025學(xué)年七年級(jí)道德與法治下冊(cè)(統(tǒng)編版2024)
- 14磁極與方向(教學(xué)設(shè)計(jì))-二年級(jí)科學(xué)下冊(cè)(教科版)
- 2025年山西經(jīng)貿(mào)職業(yè)學(xué)院高職單招職業(yè)技能測(cè)試近5年??及鎱⒖碱}庫含答案解析
- 2024年09月江蘇2024年蘇州金融租賃校園招考筆試歷年參考題庫附帶答案詳解
- 2025年八省聯(lián)考數(shù)學(xué)試題(原卷版)
評(píng)論
0/150
提交評(píng)論