有限數(shù)據(jù)統(tǒng)計處理(總體參數(shù)估計)第三章_第1頁
有限數(shù)據(jù)統(tǒng)計處理(總體參數(shù)估計)第三章_第2頁
有限數(shù)據(jù)統(tǒng)計處理(總體參數(shù)估計)第三章_第3頁
有限數(shù)據(jù)統(tǒng)計處理(總體參數(shù)估計)第三章_第4頁
有限數(shù)據(jù)統(tǒng)計處理(總體參數(shù)估計)第三章_第5頁
已閱讀5頁,還剩37頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、化學(xué)化工與生命科學(xué)系化學(xué)化工與生命科學(xué)系任課老師 王麗華實驗設(shè)計與數(shù)據(jù)處理第三章 有限數(shù)據(jù)統(tǒng)計處理3.13.2總體的參數(shù)估計總體的參數(shù)估計期望值和方差、參數(shù)估計期望值和方差、參數(shù)估計一般統(tǒng)計檢驗一般統(tǒng)計檢驗平均值檢驗、平均值檢驗、F檢驗、離群值檢驗檢驗、離群值檢驗內(nèi)容內(nèi)容總體、個體和樣本總體、個體和樣本:v總體總體(Population):調(diào)查研究的事物或現(xiàn)象的全體v個體個體(Item unit):組成總體的每個元素v樣本樣本(Sample):從總體中所抽取的部分個體v樣本容量樣本容量(Sample size):樣本中所含個體的數(shù)量示例:示例:有限數(shù)據(jù)的統(tǒng)計處理有限數(shù)據(jù)的統(tǒng)計處理總體總體樣本樣

2、本甲甲樣本容量樣本容量平均值平均值500g500g乙乙平行測定平行測定 3 3 次次1x平行測定平行測定 4 4 次次2x丙丙平行測定平行測定 4 4 次次3x有限數(shù)據(jù)的處理:有限數(shù)據(jù)的處理:.,.,321321xxxxxx計算計算x估計估計 顯著性檢驗顯著性檢驗沒有系統(tǒng)誤差,沒有系統(tǒng)誤差, = T有系統(tǒng)誤差,有系統(tǒng)誤差, T3.1.1 期望值和方差期望值和方差數(shù)據(jù)集中趨勢的表示:對一數(shù)據(jù)集中趨勢的表示:對一B物質(zhì)客觀存在量為物質(zhì)客觀存在量為T 的分析對象進行的分析對象進行分析,得到分析,得到n 個個別測定值個個別測定值 x1、x2、x3、 xn,平均值平均值 Average niixnx11

3、有限次測量:測量值向有限次測量:測量值向平均值平均值 集中集中無限次測量:測量值向無限次測量:測量值向總體平均值總體平均值 集中集中xn,數(shù)據(jù)分散程度的表示:數(shù)據(jù)分散程度的表示:極差極差R R RangeminmaxxxR%100 xRxxdiinxxdnii1%100%xdRMD1)(12nxxsnii100%xsRSD總體標準偏差與標準偏差的比較:總體標準偏差與標準偏差的比較:總體標準偏差nxi2)(標準偏差標準偏差1)(2nxxsi無限次測量,無限次測量,對總體平均值的離散對總體平均值的離散有限次測量有限次測量對平均值的離散對平均值的離散自由度自由度1 nf計算一組數(shù)據(jù)分散計算一組數(shù)據(jù)分

4、散度的獨立偏差數(shù)度的獨立偏差數(shù)自由度的理解:例如,有三個測量值,求得平均值,也知道自由度的理解:例如,有三個測量值,求得平均值,也知道x1和和x2與與平均值的差值,那么,平均值的差值,那么,x3與平均值的差值就是確定的了,不是一個獨與平均值的差值就是確定的了,不是一個獨立的變數(shù)。立的變數(shù)。平均值的標準偏差:平均值的標準偏差:nxnssxS(x)的物理意義:的物理意義:在有限次測量中,每個測量值平均所具有的標準偏差。在有限次測量中,每個測量值平均所具有的標準偏差。對有限次測量:對有限次測量:nssx1、增加測量次數(shù)、增加測量次數(shù)可以提高精密度??梢蕴岣呔芏取?、增加(過多)、增加(過多)測量次

5、數(shù)的代價不測量次數(shù)的代價不一定能從減小誤差一定能從減小誤差得到補償。得到補償。結(jié)論:結(jié)論:ssx測量次數(shù)測量次數(shù)0.00.20.40.60.81.00510152025期望值和方差期望值和方差 在概率論和統(tǒng)計學(xué)中,期望值(或數(shù)學(xué)期望數(shù)學(xué)期望、或均值均值,亦簡稱期望期望,物理學(xué)中稱為期待值期待值)是指在一個離散性隨機變量試驗中每次可能結(jié)果的概率乘以其結(jié)果的總和。 換句話說,期望值是隨機試驗在同樣的機會下重復(fù)多次的結(jié)果計算出的等同“期望”的平均值。需要注意的是,期望值并不一定等同于常識中的“期望”“期望值”也許與每一個結(jié)果都不相等。(換句話說,期望值是該變量輸出值的平均數(shù)。期望值并不一定包含于變量

6、的輸出值集合里。) 方差(variance)是在概率論和統(tǒng)計方差衡量隨機變量或一組數(shù)據(jù)是離散程度的度量。統(tǒng)計中的方差(樣本方差)是各個數(shù)據(jù)分別與其平均數(shù)之差的平方的和的平均數(shù)。在許多實際問題中,研究方差即偏離程度有著重要意義。3.1.2 參數(shù)估計參數(shù)估計估估 計計 方方 法法點點 估估 計計區(qū)間估計區(qū)間估計 在實際生活中,我們不能通過去測定無限多次去獲得在實際生活中,我們不能通過去測定無限多次去獲得 和和 2但可但可以利用樣本的統(tǒng)計量對總體平均值(以利用樣本的統(tǒng)計量對總體平均值( )和方差()和方差( 2)進行估算)進行估算一、點估計一、點估計v從總體中抽取一個樣本,根據(jù)該樣本的統(tǒng)計量對總體的

7、未知參數(shù)作出一個數(shù)值點的估計例如: 用樣本均值作為總體未知均值的估計值就是一個點估計2. 點估計沒有給出估計值接近總體未知參數(shù)程度的信息v點估計的方法有矩估計法、順序統(tǒng)計量法、最大似然法、最小二乘法等概念要點:概念要點:被估計的總體參數(shù)被估計的總體參數(shù)總體參數(shù)總體參數(shù)符號表示符號表示用于估計的樣用于估計的樣本統(tǒng)計量本統(tǒng)計量一個總體一個總體均值方差兩個總體兩個總體均值之差方差比2122212x2s21xx 2221ss估計量的優(yōu)良性準則估計量的優(yōu)良性準則v無偏性:無偏性:估計量的數(shù)學(xué)期望等于被估計的總體參數(shù)有效性:有效性:一個方差較小的無偏估計量稱為一個更有效的估計量。如,與其他估計量樣本相比均

8、值是一個更有效的估計量。v充分性:充分性:作為估計參數(shù)用的統(tǒng)計量已經(jīng)提取了樣本中所有可利用的信息(隨著樣本容量的增大,估計量越來越接近被估計的總體參數(shù) )。 問題:問題:.)(.x在在 的的 內(nèi)包含內(nèi)包含 的的有多大?有多大?x對有限次測量對有限次測量1 1、概率、概率2 2、區(qū)間界限,多大區(qū)間、區(qū)間界限,多大區(qū)間置信水平置信水平 Confidence level置信度置信度 Degree of confidence Probability level置信區(qū)間置信區(qū)間 Confidence interval 置信界限置信界限 Confidence limit 必然的聯(lián)系必然的聯(lián)系這個問題涉及兩

9、個方面:這個問題涉及兩個方面:二、區(qū)間估計二、區(qū)間估計總體平均值的置信區(qū)間總體平均值的置信區(qū)間概率概率區(qū)間大小區(qū)間大小00.80 x例:例: 包含在包含在 區(qū)間區(qū)間 15. 000.8005. 000.80幾率相對大幾率相對大幾率幾率 相對小相對小00.80幾率為幾率為100%無意義無意義平均值的置信區(qū)間的問題平均值的置信區(qū)間的問題二、區(qū)間估計二、區(qū)間估計 在實際測定分析中,為了評價測定結(jié)果的可靠性,人們總希望能夠估計出實際有限次測定的平均值與真實值的接近程度,即在測量值附近估計出真實值可能存在的范圍以及試樣含量落在此范圍內(nèi)的概率,從而說明分析結(jié)果的可靠程度。由此引出置信區(qū)間與置信概率的問題。

10、置信區(qū)間和置信概率置信區(qū)間和置信概率置信區(qū)間與置信概率置信區(qū)間與置信概率1. 根據(jù)一個樣本的觀察值給出總體參數(shù)的估計范圍v給出總體參數(shù)落在這一區(qū)間的概率2.例如: 總體均值落在5070之間,置信度為 95%概念要點:概念要點:置信區(qū)間置信區(qū)間v無限多次測定中才有總體平均值和總體標準偏差,而實際測定為有限次測定,與未知,只能用有限次測定的平均值及標準偏差S來估計。用S代替引起的誤差可用校正系數(shù)t來補償。置信區(qū)間和置信概率置信區(qū)間和置信概率v總體平均值將包括在區(qū)間內(nèi),即包括在X平均值附近的某區(qū)間內(nèi)。因此稱在 的區(qū)間為置信區(qū)間。置信區(qū)間:在一定置信度下,以測定結(jié)果x 為中心的,包括總體平均值在內(nèi)的可

11、靠性范圍。把測定值在置信區(qū)間內(nèi)出現(xiàn)的概率稱為把測定值在置信區(qū)間內(nèi)出現(xiàn)的概率稱為置信概率置信概率(P),也稱為置信度),也稱為置信度。置信水平:置信水平: v總體未知參數(shù)落在區(qū)間內(nèi)的概率v表示為P= (1-)%l為顯著性水平,是總體參數(shù)未在區(qū)間內(nèi)的概率v常用的置信水平值有 99%, 95%, 90%l 相應(yīng)的為為0.01,0.05.0.10置信區(qū)間與置信水平:置信區(qū)間與置信水平:xxX置信區(qū)間與置信概率置信區(qū)間與置信概率置信區(qū)間與置信概率置信區(qū)間與置信概率t 分布表置信區(qū)間和置信概率置信區(qū)間和置信概率v結(jié)論:v(1)根據(jù)平均值x,查t可求出 可能存在的范圍即置信區(qū)間。v(2)測定次數(shù)越多、精密度

12、越高、S越小,置信區(qū)間就越小,算術(shù)平均值和總體平均值 越接近,算術(shù)平均值的可靠性就越大,因此用置信區(qū)間表示分析結(jié)果更合理。v(3)t越小,置信區(qū)間越小,校正系數(shù)t與自由度有關(guān),f=n-1,測定次數(shù)越多,t越小,當n,t分布曲線為正態(tài)分布曲線。置信區(qū)間和置信概率置信區(qū)間和置信概率v結(jié)論:v(4)t值隨測定次數(shù)的增加而減小,隨置信概率的提高而增大。當測定次數(shù)較少時,可適當增加測定次數(shù),縮小置信區(qū)間,從而使測定值的平均值與總體平均值 更接近。v(5)比較兩個或多個測定結(jié)果的準確程度,應(yīng)在同一置信概率下進行。v(三)(三)總體平均數(shù)總體平均數(shù)的區(qū)間估計的區(qū)間估計v1、大樣本大樣本條件下的區(qū)間估計條件下

13、的區(qū)間估計v(1)、總體標準差)、總體標準差已知已知條件下,對總條件下,對總體平均數(shù)的區(qū)間估計體平均數(shù)的區(qū)間估計v案例案例2:某茶葉進出口公司,準備處理一:某茶葉進出口公司,準備處理一批庫存批庫存2年的茶葉,出庫之前要進行一次檢年的茶葉,出庫之前要進行一次檢驗。檢驗數(shù)據(jù)如下;樣本容量為驗。檢驗數(shù)據(jù)如下;樣本容量為64包,樣包,樣本平均數(shù)為每包本平均數(shù)為每包2公斤,入庫記錄表明總體公斤,入庫記錄表明總體標準差為標準差為0.2公斤。經(jīng)理要求在公斤。經(jīng)理要求在95%的可信的可信度下,估計一下這批茶葉的平均重量在多度下,估計一下這批茶葉的平均重量在多大范圍內(nèi)?大范圍內(nèi)?解:解: 答:這批茶葉平均重量在

14、答:這批茶葉平均重量在1.9512.049公斤,公斤,其可信程度為其可信程度為95%。(公斤)(公斤)049.2025.096.12951.1025.096.12 ,025.0642.096.1 ,475.02/95.0,95.01 ,2.0,30,6421cctxntnnxxv(2)、總體標準差)、總體標準差未知未知條件下的區(qū)間估計條件下的區(qū)間估計v總體標準差總體標準差未知條件下,一般用樣本標準未知條件下,一般用樣本標準差差S代替總體標準差代替總體標準差。v案例:某項抽樣調(diào)查中獲得如下資料:案例:某項抽樣調(diào)查中獲得如下資料: N可以視可以視為無限總體,為無限總體,n=81,樣本平均數(shù)為,樣本

15、平均數(shù)為500,樣本標,樣本標準差為準差為90,求:總體平均數(shù)可信度為,求:總體平均數(shù)可信度為90%的置信的置信區(qū)間。區(qū)間。v解:解:v答:此項調(diào)查中,總體平均數(shù)的可信度為答:此項調(diào)查中,總體平均數(shù)的可信度為90%的的置信區(qū)間是在置信區(qū)間是在483.55516.45之間。之間。45.51610645.150055.48310645.1500,108190645.1,500,90,308121cctxnstxsnxxv2、小樣本小樣本條件下的區(qū)間估計條件下的區(qū)間估計v(1)、總體標準差)、總體標準差已知已知條件下,對總體條件下,對總體平均數(shù)的區(qū)間估計平均數(shù)的區(qū)間估計v使用使用t分布的條件分布的條

16、件:當樣本容量:當樣本容量n30,且總體標準差,且總體標準差未未知知時,用樣本標準差時,用樣本標準差S代替總體標準差代替總體標準差。樣本標準差。樣本標準差S v計算公式:計算公式: 1)x-(xs s 2xnnssxtxxv例例1:從大學(xué)一年級學(xué)生中隨機抽?。簭拇髮W(xué)一年級學(xué)生中隨機抽取12名學(xué)名學(xué)生,其閱讀能力得分為生,其閱讀能力得分為28,32,36,22,34,30,33,25,31,33,29,26。試評。試評估一下大學(xué)一年級學(xué)生閱讀能力的總體平估一下大學(xué)一年級學(xué)生閱讀能力的總體平均分數(shù)。要求置信度分別是均分數(shù)。要求置信度分別是95%和和99%。v解:步驟:解:步驟:v(1)計算樣本平均

17、數(shù):)計算樣本平均數(shù): v(2)計算樣本標準差:)計算樣本標準差: v(3)計算平均誤差:)計算平均誤差: v(4)確認自由度:)確認自由度:df=12-1=11,誤差概率:,誤差概率:v=1-0.95=0.05,查表,查表,t=2.201917.29/nxx1 . 41)(2nxxs184. 1121 . 4nssxv(5)估計總體平均數(shù)置信區(qū)間:)估計總體平均數(shù)置信區(qū)間: v解釋:有解釋:有95%的把握程度說大學(xué)一年級學(xué)的把握程度說大學(xué)一年級學(xué)生閱讀能力平均分數(shù)在生閱讀能力平均分數(shù)在27.31132.523分之分之間。間。v當當=1-0.99=0.01,查表,查表,t=3.106v29.917-3.1061.184=26.24;29.917+3.1061.184=33.59。523.32311.27 2.606 184. 1201. 2917.29;上限下限xtsx置信區(qū)間和置信概率置信區(qū)間和置信概率v例:某銨鹽含氮量的測定結(jié)果x=21.30%,S=0.06%,n=4。求置信概率為95%和99%時平均值的置信區(qū)間?若n=10(假定其它數(shù)據(jù)不變),置信概率為99%時平均值的置信區(qū)間為多少? v 置信區(qū)間和置信概率置信區(qū)間和置信概率v注意:例題結(jié)果說明v(1)置信概

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論