定量分析研究方法課件_第1頁
定量分析研究方法課件_第2頁
定量分析研究方法課件_第3頁
定量分析研究方法課件_第4頁
定量分析研究方法課件_第5頁
已閱讀5頁,還剩1136頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1MPA定量分析方法

2引言1.為什么學(xué)定量分析方法?(1)實(shí)踐的需要; 社會(huì)科學(xué)領(lǐng)域,環(huán)境生態(tài)與水資源問題,能源問題,信息網(wǎng)絡(luò)與用戶,農(nóng)業(yè)問題,交通運(yùn)輸問題,科技教育與工程項(xiàng)目管理(2)理論研究的需要。32.學(xué)什么?(1)統(tǒng)計(jì)學(xué)①社會(huì)經(jīng)濟(jì)統(tǒng)計(jì)學(xué):綜合指標(biāo),動(dòng)態(tài)數(shù)列,統(tǒng)計(jì)指數(shù),②數(shù)理統(tǒng)計(jì)學(xué):基本概念(樣本,總體etc),參數(shù)估計(jì),如估計(jì)一批產(chǎn)品合格率假設(shè)檢驗(yàn)。如從一批產(chǎn)品中抽取200件,有次品兩件,則產(chǎn)品合格率的估計(jì)值是99%。現(xiàn)在規(guī)定一批產(chǎn)品的合格率若低于95%,則這批產(chǎn)品就不合格。提出假設(shè)合格率≥95%,那么如何判定這個(gè)假設(shè)正確,有多大把握,這即為假設(shè)檢驗(yàn)問題!4回歸分析:確定變量的相互關(guān)系和相關(guān)程度,建立相關(guān)模型,檢驗(yàn)變量間的相關(guān)程度并應(yīng)用相關(guān)模型進(jìn)行預(yù)測(cè)etc函數(shù)關(guān)系(特殊相關(guān)關(guān)系)。線性相關(guān)與非線性相關(guān)。如:年齡與體重,銷售額與廣告費(fèi)用etc都具有一定的相關(guān)關(guān)系。方差分析影響產(chǎn)品質(zhì)量的因素很多:操作不當(dāng),設(shè)備磨損,潮濕etc。分析哪些因素對(duì)產(chǎn)品質(zhì)量起顯著作用,并了解什么時(shí)候最起作用,方差分析就是解決這一個(gè)問題的一種有效方法。5其他:多元統(tǒng)計(jì)分析,時(shí)間序列法,正交實(shí)驗(yàn)法etc。

主成分分析:在實(shí)際問題中,常遇到多指標(biāo)問題,不同指標(biāo)之間具有一定的相關(guān)性,增加了分析問題的難度。設(shè)法將原有指標(biāo)重新組合成一組相互獨(dú)立的少數(shù)幾個(gè)綜合指標(biāo)來代替原有指標(biāo),并且反映指標(biāo)的主要信息。將多指標(biāo)化為少數(shù)獨(dú)立的綜合指標(biāo)的統(tǒng)計(jì)方法即為主成分分析法!

6(2)決策學(xué)概論(3)經(jīng)濟(jì)預(yù)測(cè)數(shù)量方法①時(shí)間序列法;②回歸分析法;③馬爾可夫法;④灰色模型法7(4)系統(tǒng)評(píng)價(jià)方法①模糊綜合評(píng)價(jià)法;②層次分析法(5)效用理論及應(yīng)用(6)基本決策方法貝葉斯決策法8(7)多目標(biāo)決策目標(biāo)規(guī)劃法、主成分法、因子分析法(8)博弈論初步及其應(yīng)用3.怎樣學(xué)?(1)了解基本思想(2)必要的數(shù)學(xué)基礎(chǔ)94.參考書(1)決策理論與方法岳超源,科學(xué)出版社,1987年9月第1版(2)決策分析陳珽,科學(xué)出版社(3)商務(wù)決策數(shù)量方法李一智,徐選華,經(jīng)濟(jì)科學(xué)出版社(4)決策分析張家琦,首都師范大學(xué)出版社10(5)管理科學(xué)定量分析引論侯定丕,中國科學(xué)技術(shù)大學(xué)出版社(6)灰色系統(tǒng)理論及其應(yīng)用劉思峰等,科學(xué)出版社(7)多元統(tǒng)計(jì)分析于秀林等,中國統(tǒng)計(jì)出版社(8)數(shù)理經(jīng)濟(jì)學(xué)方法——線性和非線性規(guī)劃、不動(dòng)點(diǎn)理論.富蘭克林著,俞建等譯,198511(9)工商業(yè)和經(jīng)濟(jì)學(xué)中應(yīng)用的統(tǒng)計(jì)方法〔美〕羅伯特·D·梅森著人大出版社(10)管理研究應(yīng)用統(tǒng)計(jì)學(xué)歐陽文安etc譯北京科學(xué)技術(shù)出版社(11)應(yīng)用統(tǒng)計(jì)學(xué)袁衛(wèi)etc編著人大出版社12(12)應(yīng)用數(shù)理統(tǒng)計(jì)孫榮恒編著科學(xué)出版社(13)實(shí)用多元統(tǒng)計(jì)分析方開泰編著華東師范大學(xué)出版社(14)多元統(tǒng)計(jì)數(shù)據(jù)分析——理論·方法·實(shí)例任若恩、王惠文著國防工業(yè)出版社13第一章數(shù)據(jù)的整理與抽樣14一、統(tǒng)計(jì)學(xué)中的基本概念(一)統(tǒng)計(jì)資料1.統(tǒng)計(jì)資料的定義、分類與性質(zhì)可以推導(dǎo)出某項(xiàng)論斷的事實(shí)或數(shù)字都稱為統(tǒng)計(jì)資料。統(tǒng)計(jì)資料是統(tǒng)計(jì)分析、統(tǒng)計(jì)推斷和預(yù)測(cè)的基礎(chǔ)。統(tǒng)計(jì)資料分為原始(初級(jí))資料(未加工)與次級(jí)資料(加工過)如:統(tǒng)計(jì)年鑒etc。統(tǒng)計(jì)數(shù)據(jù)可分:度量數(shù)據(jù)(如銷量等)和品質(zhì)數(shù)據(jù)(性別、民族e(cuò)tc)152.統(tǒng)計(jì)資料收集的方法間接引用或直接收集3.統(tǒng)計(jì)資料收集的途徑直接觀察、訪問、問卷調(diào)查4.統(tǒng)計(jì)資料收集的組織方式可分:專門調(diào)查(普查,重點(diǎn)調(diào)查,抽樣調(diào)查,典型調(diào)查)和統(tǒng)計(jì)報(bào)表(自上而下地逐級(jí)提供統(tǒng)計(jì)資料的一種調(diào)查方法)16

(二)總體與個(gè)體1.定義凡是客觀存在的、具有統(tǒng)一性質(zhì)的若干個(gè)別事物的集合體,就稱為統(tǒng)計(jì)總體。構(gòu)成總體的個(gè)別事物稱為個(gè)體(總體單位)考察一批10000件產(chǎn)品的質(zhì)量情況,10000件產(chǎn)品=總體,每一件產(chǎn)品=一個(gè)個(gè)體。172.總體和個(gè)體的必備條件(1)客觀性總體和個(gè)體必須是客觀存在的具體事物。如:工業(yè)企業(yè)是總體(客觀存在),自然數(shù)(集合體)但非總體,因1,2,3,……是抽象的

“產(chǎn)品”,“糧食”非總體(2)大量性總體的個(gè)體須是大量的(足夠多)因?yàn)榻y(tǒng)計(jì)的目的是反映大量現(xiàn)象的規(guī)律和特點(diǎn)。18(3)同質(zhì)性總體的個(gè)體在性質(zhì)上須相同,因?yàn)榻y(tǒng)計(jì)研究的目的是反映總體的特性。例如,將機(jī)械零件與書本放在一起,就不會(huì)得出整個(gè)總體的任何結(jié)論。(4)差異性如10000件產(chǎn)品雖屬同一種產(chǎn)品,但在質(zhì)量、顏色、尺寸等方面不盡相同。若所有個(gè)體都完全相同的話,就無必要進(jìn)行統(tǒng)計(jì)研究了。如:同一種郵票800枚(同時(shí)出版)要研究這種郵票的面值、版面設(shè)計(jì)、圖案花紋etc,只需任取一枚郵票進(jìn)行鑒賞,就能通曉800枚郵票。這種研究方法不是統(tǒng)計(jì)方法。193.總體的分類按其包含的個(gè)體數(shù)目可分:有限總體與無限總體。按其個(gè)體的時(shí)間分:空間總體(個(gè)體處于同一時(shí)間的不同空間),如人口普查,全國總?cè)丝诩礊榭臻g總體,時(shí)間總體(個(gè)體處于同一空間的不同時(shí)間),如某商店一年的銷售情況,即是時(shí)間總體??傮w與個(gè)體的概念是相對(duì)的!20(三)樣本1.定義樣本,是從總體中抽取出來進(jìn)行調(diào)查并據(jù)以推斷總體的那部分個(gè)體。樣本中包含的個(gè)體數(shù)目稱為樣本容量,用n表示,n>30,大樣本,反之,小樣本。樣本容量n與總體容量N的比,n/N稱為抽樣比,用f表示。212.樣本的類型(1)代表性樣本樣本單位頻數(shù)是某種特征的樣本占總樣本數(shù)的比例。總體的頻數(shù)是某種特征的個(gè)體占總體的比例若樣本單位頻數(shù)與總體的頻數(shù)成正比,則這種樣本稱之為代表性樣本。22(2)有偏樣本人為因素的影響,這種情況下的樣本稱為有偏樣本,是產(chǎn)生抽樣偏差的來源。(3)隨機(jī)樣本按隨機(jī)原則抽取的樣本。23(4)分層樣本(類型樣本)①將總體按某一標(biāo)志分成若干組。②再從各組中隨機(jī)抽樣??疾烊珖ど唐髽I(yè)時(shí),先按行業(yè)分組,再抽樣,以避免所選出的樣本集中在某一行業(yè)。代表性高。24(5)整群樣本按群抽樣的樣本。如:考察某市小學(xué)生身體發(fā)育情況,隨機(jī)抽取若干小學(xué),對(duì)抽中小學(xué)的全體學(xué)生逐一考察。(省力省時(shí))(6)系統(tǒng)抽樣按某種規(guī)律(如固定的間隔)在總體中抽取樣本的方法。如:按身份證的編號(hào)抽取尾數(shù),為了進(jìn)行居民收入狀況調(diào)查。但當(dāng)總體呈現(xiàn)某種系統(tǒng)規(guī)律時(shí)(周期律)則不能采用,否則有系統(tǒng)誤差。25(四)標(biāo)志標(biāo)志是一種名稱,不是具體數(shù)字,是對(duì)個(gè)體某一特征質(zhì)的規(guī)定。標(biāo)志在個(gè)體的不同取值叫標(biāo)志值。其具體表現(xiàn)是文字值或數(shù)值。學(xué)習(xí)成績分別為80,98,91,86等成績=標(biāo)志分?jǐn)?shù)是標(biāo)志值26

標(biāo)志可分為:數(shù)量標(biāo)志:表明個(gè)體數(shù)量方面的特征(如成績)品質(zhì)標(biāo)志:個(gè)體屬性方面的特征(性別)不變標(biāo)志(性別)可變標(biāo)志(成績)27二、抽樣方法1.簡單隨機(jī)抽樣(樣本同分布,抽樣相互獨(dú)立)每個(gè)個(gè)體被抽中的可能性相等。如:抽簽。2.分層隨機(jī)抽樣先分組,在分別從各組中簡單隨機(jī)抽樣,可增大樣本代表性,推斷結(jié)果準(zhǔn)確性高,層內(nèi)差異小,層間差異大。283.整群抽樣將總體分成若干群,在隨機(jī)抽一部分群體做樣本,并對(duì)這些群體的所有個(gè)體全面調(diào)查,隨機(jī)抽組法與組內(nèi)普查法的結(jié)合。4.系統(tǒng)隨機(jī)抽樣法(等距抽樣或機(jī)械抽樣)基本思想:對(duì)于容量為N的總體,將個(gè)體編號(hào)從1到N。若要抽取容量為n的樣本,則應(yīng)先從編號(hào)為1到K(K=[N/n])的K個(gè)個(gè)體中,隨機(jī)抽取一個(gè),然后,按照一定的規(guī)律,抽取個(gè)體,順次得到容量為n的樣本。舉例(略)29三、數(shù)據(jù)的整理與圖形表示。(一)分組按一定的變異標(biāo)志,將總體分成若干部分,統(tǒng)計(jì)分組是分組整理的基礎(chǔ)??蓜澐稚鐣?huì)經(jīng)濟(jì)現(xiàn)象的類型,研究現(xiàn)象的內(nèi)部結(jié)構(gòu)及分析現(xiàn)象之間的依存關(guān)系。統(tǒng)計(jì)分組的要求和基本原則(略)。(二)數(shù)據(jù)的圖形表示餅圖、直方圖、尋形圖、柱狀圖etc表示統(tǒng)計(jì)數(shù)據(jù),顯直觀。30四、數(shù)據(jù)的描述性指標(biāo)(一)集中趨勢(shì)

1.均值,是算術(shù)平均數(shù),是數(shù)據(jù)集中趨勢(shì)的最重要測(cè)度值。(1)原始數(shù)據(jù):

31(2)分組后的數(shù)據(jù):xi表示第i組的組中值,fi表示第i組數(shù)據(jù)的個(gè)數(shù)均值反映了數(shù)據(jù)的數(shù)量集中的特征,是數(shù)據(jù)偶然性、隨機(jī)性特征相互抵消后的穩(wěn)定數(shù)值,反映了一些數(shù)據(jù)必然的特點(diǎn)。

32(3)幾何平均數(shù)G=ai為第i期發(fā)展速度或各個(gè)比率。332.中位數(shù)(中數(shù))中位數(shù)是將數(shù)據(jù)按大小順序排隊(duì)后,位置處在最中間的那個(gè)數(shù)。不受極端值(大、?。┑挠绊?。如數(shù)據(jù)個(gè)數(shù)為偶數(shù),則最中間兩數(shù)的平均數(shù)為中位數(shù)。343.上四分位數(shù)(設(shè)為xi),則i=[]xi

表示約有1/4的數(shù)據(jù)比xi

大,3/4的數(shù)據(jù)比xi小4.下是分位數(shù)(設(shè)為x)其中j=[]

表示約有3/4的數(shù)據(jù)比xj

大,1/4的數(shù)據(jù)比xj小。355、眾數(shù),出現(xiàn)次數(shù)最多的數(shù)值(可能有多個(gè)),均值是計(jì)算的測(cè)度值,其它從位置考慮。例:某班30MBA學(xué)生的年齡按上升順序排序?yàn)椋?4、24、25、25、25、25、26、26、26、26、27、27、27、27、27、28、28、28、28、28、29、29、30、30、30、30、31、31、31、32

眾數(shù)為27和28(5次),中數(shù)==27.5

平均數(shù)為27.67,上四分位數(shù)為x23=30,下四分位數(shù)x8=26,36(二)離散趨勢(shì),1.極差(全距)R=max(Xi)-min(Xi)只利用了數(shù)據(jù)兩端的信息。372、方差和標(biāo)準(zhǔn)差:

標(biāo)準(zhǔn)差=σ2大反映均值的代表性差,反之,強(qiáng)。383.四分位差即上四分位數(shù)與下四分位數(shù)的差39五、統(tǒng)計(jì)量的分布(一)統(tǒng)計(jì)量的定義設(shè)X1、X2、……、Xn是來自總體X的一個(gè)樣本,g(X1、X2、……、Xn)是X1、X2、……、Xn的函數(shù),若g是連續(xù)函數(shù),且不含任何未知參數(shù),則g(X1、X2、……、Xn)是一個(gè)統(tǒng)計(jì)量。40(二)常用統(tǒng)計(jì)量設(shè)X1、X2、……、Xn是來自總體X的一個(gè)樣本,x1、x2、……、xn是這一樣本的觀測(cè)值,則1.樣本平均值:2.樣本方差:413.樣本標(biāo)準(zhǔn)差:4.樣本k階(原點(diǎn))矩:,k=1,2,……5.樣本k階中心矩:,k=1,2,……用xi代替Xi,相應(yīng)得到觀察值,s2,s,ak,bk(名稱不變)42(三)幾種常用的分布1.χ2分布設(shè)x1,x2,……,xn是來自總體

N(0,1)的樣本,則稱隨機(jī)變量=x12+x22+……+xn243

服從自由度為n的χ2分布,記為χ2~χ2(n),χ2(n)分布的概率密度為:

44χ2分布的性質(zhì):

(1)可加性:設(shè)χ12

~χ2(n1),χ22

~χ2(n2),且χ12

與χ22相互獨(dú)立,則有:

χ12+χ22~χ2(n1+n2)

(2)若χ2~χ2(n),則有:

E(χ2)=n,D(χ2)=2n45(3)對(duì)于給定的正數(shù),0<<1,若則為χ2(n)分布的上分布點(diǎn)46如查表知χ0.012(10)=2.558當(dāng)n充分大時(shí),有其中是標(biāo)準(zhǔn)正態(tài)分布的上分位點(diǎn)。

47附:若Z~N(0,1),則Z為標(biāo)準(zhǔn)正態(tài)變量,其密度函數(shù)為:

48(1)若對(duì),有,則為N(0,1)分布的上點(diǎn)

49(2)若對(duì),有,則為N(0,1)的雙側(cè)分位點(diǎn)50(3)上點(diǎn)的求法∵,又∴φ()=1-,反查表,得512.t分布設(shè)χ~N(0,1),Y~χ2(n),且χ,Y相互獨(dú)立,則稱隨機(jī)變量

服從自由度為n的t-分布,記為t~t(n)52其密度函數(shù)為:53對(duì)給定,若則點(diǎn)為t(n)分布的上分位點(diǎn)54顯然(n)=-(n)(WHY)t0.95(8)=-t0.05(8)=-1.8595當(dāng)n充分大的時(shí)候,有(n)=553、F分布設(shè)U~2(n1),V~2(n2),且U,V相互獨(dú)立,則稱隨機(jī)變量服從自由度為(n1,n2)的F分布,記為F~F(n1,n2).56其密度函數(shù)為:顯然,若F~F(n1,n2),則~F(n2,n1)(定義知)57對(duì)于結(jié)果0<α<1,若則稱F(n1,n2)為F(n1,n2)分布的上分位點(diǎn)。

58顯然有(n1,n2)=(定義知)F0.9(5,10)==0.3030594.正態(tài)總體的樣本均值和樣本方差的分布(1)設(shè)總體X的均值為μ,方差為σ2,x1,x2,……,xn是X的一個(gè)樣本,則有,(2)設(shè)x1,x2,……,xn為來自總體X~N(μ,σ2)的一個(gè)樣本,則,60(3)設(shè)x1,x2,……,xn為來自總體X~N(μ,σ2)的一個(gè)樣本,則有①②與S2相互獨(dú)立

61(4)x1,x2,……,xn為來自總體X~N(μ,σ2)的一個(gè)樣本,與S2分別是樣本均值和樣本方差,則有:

62(5)設(shè)x1,x2,……,xn1與Y1,Y2,……,Yn2分別是具有相同方差的兩個(gè)正態(tài)總體N(μ1,σ2),N(μ2,σ2)的樣本,且這兩個(gè)樣本相互獨(dú)立。設(shè),,分別是這兩個(gè)樣本的均值

63

,分別是這兩個(gè)樣本的方差,則有其中64(6)(獨(dú)立同分布的)中心極限定理設(shè)隨機(jī)變量x1,x2,……,xn相互獨(dú)立,服從同一分布,且具有數(shù)學(xué)期望和方差:,,k=1,2,……,n)則(樣本均值)65將其標(biāo)準(zhǔn)化:66設(shè)Zn分布函數(shù)為Fn(x),則有即Yn極限分布為標(biāo)準(zhǔn)正態(tài)分布。推論:不論總體是什么分布,只要μ和σ2存在,則樣本容量為n的樣本均值近似~(n足夠大時(shí))。67

第3章

參數(shù)估計(jì)§3.1參數(shù)估計(jì)概述

參數(shù)估計(jì)是統(tǒng)計(jì)推斷的基本方法之一。我們把刻劃總體X的某些特征的常數(shù)稱為參數(shù),最常用的參數(shù)是總體X的數(shù)學(xué)期望和方差。假如總體X~N(),則X的分布是由參數(shù)μ和σ2確定的,其中,μ=E(X),σ2=D(X)。

在實(shí)際問題中,總體X的參數(shù)是未知的,例如紗廠細(xì)紗機(jī)上的斷頭次數(shù)X~P(λ),如果求每只紗綻在某一時(shí)間間隔內(nèi)斷頭的次數(shù)為K的概率,就需要先確定參數(shù)λ,才能求出所求的概率。又如,燈泡廠生產(chǎn)的燈泡,由經(jīng)驗(yàn)知其壽命X~N(),但是由于生產(chǎn)過程中各種隨機(jī)因素的影響,生產(chǎn)出來的燈泡的壽命是不一致的,為了保證燈泡的質(zhì)量,必須進(jìn)行抽樣檢查,根據(jù)樣本所提供的信息,對(duì)總體X的分布做出估計(jì),也即對(duì)參數(shù)μ,σ2做出估計(jì)。這類問題稱為參數(shù)估計(jì)問題。

參數(shù)估計(jì)問題,就是要從樣本出發(fā)構(gòu)造一些統(tǒng)計(jì)量作為總體某些參數(shù)的估計(jì)量,當(dāng)取得一個(gè)樣本值時(shí),就以相應(yīng)的統(tǒng)計(jì)量的值作為總體參數(shù)的估計(jì)值。例如,常以統(tǒng)計(jì)量作為總體數(shù)學(xué)期望的估計(jì)量。當(dāng)要估計(jì)某批燈泡的平均壽命時(shí),就從該批燈泡中隨機(jī)地抽取若干個(gè),分別測(cè)出其壽命,以這些測(cè)量數(shù)據(jù)的平均值作為該批燈泡的平均壽命的估計(jì)值。

設(shè)總體X的分布函數(shù)的類型已知,但是其中有一個(gè)或多個(gè)參數(shù)未知,設(shè)X1,X2,X3,……,Xn為總體X的容量為n的樣本。參數(shù)估計(jì)就是討論如何由樣本X1,X2,X3,……,Xn提供的信息對(duì)未知參數(shù)作出估計(jì),以及討論如何建立一些準(zhǔn)則對(duì)所作出的估計(jì)進(jìn)行評(píng)價(jià)。一般是建立適當(dāng)?shù)慕y(tǒng)計(jì)量(X1,X2,X3,……,Xn),當(dāng)樣本觀察值為x1,x2,x3,……,xn時(shí),如果以(x1,x2,x3,……,xn)作為總體分布中未知參數(shù)的估計(jì)值,這樣的估計(jì)方法叫做點(diǎn)估計(jì),如果總體分布函數(shù)中有t個(gè)未知參數(shù),則要建立t個(gè)估計(jì)量作為t個(gè)未知參數(shù)的估計(jì)量。

參數(shù)估計(jì)的形式分為兩類:點(diǎn)估計(jì)和區(qū)間估計(jì)。由估計(jì)量的觀察值作為未知參數(shù)的估計(jì)值,這種作法稱為點(diǎn)估計(jì)或定值估計(jì)。而有時(shí)并不要求對(duì)參數(shù)作定值估計(jì),只要求估計(jì)出未知參數(shù)的一個(gè)所在范圍,并指出參數(shù)被包含在該范圍的概率,這種方法稱為區(qū)間估計(jì),進(jìn)行參數(shù)估計(jì)并不一定要預(yù)先知道總體的分布類型。有時(shí),雖然未知總體的分布類型,但仍可對(duì)總體的某些數(shù)字特征作出估計(jì)。

§3.2參數(shù)的點(diǎn)估計(jì)

點(diǎn)估計(jì)方法很多,本節(jié)介紹最常見的矩估計(jì)法和極大似然法。一、矩估計(jì)法

由大數(shù)定律可知,樣本分布函數(shù)依概率收斂于總體分布函數(shù),樣本均值依概率收斂于總體均值,我們自然會(huì)想到,是否能用有關(guān)的樣本矩來估計(jì)總體分布的相應(yīng)矩呢?統(tǒng)計(jì)實(shí)踐表明,這個(gè)方法是可取的,這種用樣本矩來估計(jì)總體分布參數(shù)的方法稱為矩估計(jì)法,通常,用樣本均值來估計(jì)總體的均值,用樣本方差S2來估計(jì)總體的方差。

【例3.1】試用矩估計(jì)法對(duì)總體X~N()的參數(shù)μ,σ2作出估計(jì)。

解:因E(X)=μ,D(X)=σ2設(shè)X1,X2,……,Xn為X的一個(gè)樣本,其樣本均值為,樣本方差為S2。令E(X)=,D(X)=S2,即得的估計(jì)量為,。

【例5.2】設(shè)X1,X2,……,Xn是取自總體X的樣本,已知X的概率密度為:

試用矩估計(jì)法估計(jì)總體參數(shù)。解:

由于

樣本均值為,令E(X)=,得:,

從而總體參數(shù)的矩估計(jì)為,其

中。

【例5.3】X1,X2,……,Xn為總體X~B(N,P)的樣本,其中N,P為未知參數(shù),試用矩估計(jì)法估計(jì)參數(shù)N及P。

解:∵

E(X)=NPD(X)=NP(1-P)樣本均值與方差分別為,S2。令

E(X)=D(X)=S2

解得N、P的矩估計(jì)量為

,其中,。

二、極大似然估計(jì)法

先考察兩個(gè)簡單的例子。

【例3.4】某同學(xué)與一位男獵人一起外出打獵,只見一只野雞在前方竄過,只聽一聲槍響,野雞被他們兩人中某一位一槍命中,試推測(cè)這一發(fā)命中的子彈是誰打的,答案是簡單的,既然只發(fā)一槍且命中,而男獵人的命中的概率一般大于這位同學(xué)命中的概率,因此可以認(rèn)為這一槍是男獵人射中的。

【例3.5】假定在一個(gè)箱子里放著黑、白兩種球共4只,且知道這兩種球的數(shù)目之比為1∶3,但不知道究竟哪一種顏色的球多。

設(shè)黑球所占的比例為P,由上述假定推知P僅可能取1/4和3/4這兩個(gè)值,現(xiàn)在采用有放回抽樣的方法,從箱子中隨機(jī)地抽取三個(gè)球,觀察到球的顏色為黑、白、黑,你會(huì)對(duì)箱子中的黑球數(shù)作出什么推斷呢?即你認(rèn)為P的值是1/4,還是3/4?直觀上覺得P=3/4(即箱子中黑球數(shù)為3)更可信,因?yàn)楫?dāng)P=1/4時(shí)抽到這樣一個(gè)具體樣本的概率為1/4

3/4

1/4=3/64,當(dāng)P=3/4時(shí),抽到這樣一個(gè)具體樣本的概率為3/4

1/4

3/4=9/64,由于9/64>3/64,因此在觀察到上述樣本中的三個(gè)球的顏色之后,覺得P=3/4更可信,即你傾向于認(rèn)為箱子中放有三個(gè)黑球,這里體現(xiàn)了極大似然法的基本思想。

現(xiàn)在我們來闡明極大似然法的基本原理。

設(shè)總體X的概率密度為,它只含一個(gè)未知參數(shù)(若X是離散型,表示概率),X1,X2,X3,……,Xn是取自X的樣本,x1,x2,x3,……,xn為樣本觀察值。X1,X2,X3,……,Xn的聯(lián)合密度等于,顯然,對(duì)于樣本的一組觀察值x1,x2,x3,……,xn,它是的函數(shù),記作

并稱為似然函數(shù)

當(dāng)已知時(shí),似然函數(shù)描述了樣本取得樣本觀察值x1,x2,x3,……,xn的可能性。同樣,當(dāng)一組樣本觀察值取定時(shí)(即抽樣完成時(shí)),要問它最大可能取自什么樣的總體(即總體的參數(shù)應(yīng)等于什么時(shí)的可能性最大),也要從似然函數(shù)的極大化中求出相應(yīng)的值來,這個(gè)值就是的一個(gè)估計(jì)值。于是,我們可以給出極大似然估計(jì)的定義。

定義3.1設(shè)總體的概率密度為,其中是未知參數(shù),x1,x2,…,xn為X的一組樣本觀察值。若能求得觀察值的某個(gè)函數(shù),使得似然函數(shù)取極大值,即,則稱為的一個(gè)極大似然估計(jì)值,其相應(yīng)的統(tǒng)計(jì)量,稱為參數(shù)的極大似然估計(jì)量。

由定義3.1可知,求總體參數(shù)的極大似然估計(jì)值的問題,就是求似然函數(shù)L()的極大值問題。在L()可微時(shí),要使L()取極大值必須滿足(3.1)從上式可解得的極大似然估計(jì)值。

由于lnL()與L()有相同的極值點(diǎn),而且,求lnL()的極值點(diǎn)更為容易,所以常用下式

(3.2)來代替(3.1)式。方程(3.1)或(3.2)都稱為似然方程。

當(dāng)似然函數(shù)包含多個(gè)參數(shù)時(shí),即:

若L關(guān)于各參數(shù)的偏導(dǎo)數(shù)存在,則j的極大似然估計(jì)

一般可由方程組:或解得。上面方程組稱為似然方程組。

[注意]上面的討論中,我們沒有提到似函數(shù)取極大值的充分條件,對(duì)于具體的函數(shù)可作驗(yàn)證。

【例3.6】設(shè)總體X服從參數(shù)為的泊松分布,求參數(shù)的極大似然估計(jì)量。

設(shè)X1,X2,X3,……,Xn是來自X的樣本,則

的極大似然估計(jì)量為。其中

為樣本均值。

【例3.7】設(shè)總體X~N,其中及是未知參數(shù),如果取得樣本觀測(cè)值為x1,x2,…,xn,求參數(shù)及的極大似然估計(jì)值。

解:

似然函數(shù)為:∴

對(duì)及求偏導(dǎo)數(shù),并讓它們等于零,得:

解此方程組,即得及的極大似然估計(jì)值為:

【例3.8】設(shè)總體X服從均勻分布,求參數(shù)與的極大似然估計(jì)量

設(shè)X1,X2,…,Xn是X的樣本,則

∴從而有

顯然由此方程組解不出

1與

2,現(xiàn)利用定義求

1與

2的極大似然估計(jì)量,因?yàn)椋?/p>

,即∴

的極大似然估計(jì)量分別為。三、估計(jì)量的優(yōu)良標(biāo)準(zhǔn)

在對(duì)總體參數(shù)做出估計(jì)時(shí)并非所有的估計(jì)量都是優(yōu)良的,從而產(chǎn)生了評(píng)價(jià)估計(jì)量是否優(yōu)良的標(biāo)準(zhǔn)。對(duì)于點(diǎn)估計(jì)量來說,一個(gè)好的估計(jì)量有如下三個(gè)標(biāo)準(zhǔn):

1.無偏性如果樣本統(tǒng)計(jì)量的期望值等于該統(tǒng)計(jì)量所估計(jì)的總體參數(shù),則這個(gè)估計(jì)量叫做無偏估計(jì)量。這是一個(gè)好的估計(jì)量的一個(gè)重要條件。用樣本平均數(shù)作為總體平均數(shù)的點(diǎn)估計(jì)量,就符合這一要求。無偏性也就是沒有系統(tǒng)的偏差,它是從平均意義講的,即如果這種估計(jì)方法重復(fù)進(jìn)行,則從估計(jì)量所獲得的平均數(shù)等于總體參數(shù)。顯然,如果說一個(gè)估計(jì)量是無偏的,并不是保證用于單獨(dú)一次估計(jì)中沒有隨機(jī)性誤差,只是沒有系統(tǒng)性的偏差而已。若以代表被估計(jì)的總體參數(shù),代表的無偏估計(jì)量,則用數(shù)學(xué)式表示為:

我們知道,總體參數(shù)中最重要的一個(gè)參數(shù)是總體平均數(shù),樣本平均數(shù)是它的一個(gè)無偏估計(jì)量,即。另外,樣本方差也是總體方差的無偏估計(jì)量。

2.一致性當(dāng)樣本容量n增大時(shí),如果估計(jì)量越來越接近總體參數(shù)的真值時(shí),就稱這個(gè)估計(jì)量為一致估計(jì)量。估計(jì)量的一致性是從極限意義上講的,它適用于大樣本的情況。如果一個(gè)估計(jì)量是一致估計(jì)量,那么,采用大樣本就更加可靠。當(dāng)然,在樣本容量n增大時(shí),估計(jì)量的一致性會(huì)增強(qiáng),但調(diào)查所需的人力、物力也相應(yīng)增加。

3.有效性有效性的概念是指估計(jì)量的離散程度。如果兩個(gè)估計(jì)量都是無偏的,其中方差較小的(對(duì)給定的樣本容量而言)就可認(rèn)為相對(duì)來說是更有效的。嚴(yán)格地說,如果和是的兩個(gè)無偏估計(jì)量,它們的相對(duì)有效性按下述比率決定:其中,是較小的方差。

以上這三個(gè)標(biāo)準(zhǔn)并不是孤立的,而應(yīng)該聯(lián)系起來看。如果一個(gè)估計(jì)量滿足這三個(gè)標(biāo)準(zhǔn),這個(gè)估計(jì)量就是一個(gè)好的估計(jì)量。數(shù)理統(tǒng)計(jì)已證明,用樣本平均數(shù)來估計(jì)總體平均數(shù)和用樣本比率來估計(jì)總體比率時(shí),它們是無偏的,一致的和有效的?!?.3參數(shù)的區(qū)間估計(jì)一、區(qū)間估計(jì)的概念

對(duì)未知參數(shù)來說,我們除了關(guān)心它的點(diǎn)估計(jì)外,往往還希望估計(jì)出它的一個(gè)范圍,以及這個(gè)范圍覆蓋參數(shù)真值的可靠程度,這種范圍通常用區(qū)間的形式給出,這種區(qū)間就叫參數(shù)的置信區(qū)間。

定義3.2設(shè)總體分布含有一個(gè)未知參數(shù)

,若由樣本確定的兩個(gè)統(tǒng)計(jì)量

(X1,X2,X3,…,Xn)與(X1,X2,X3,…,Xn),對(duì)于給定數(shù)值,滿足

(3.3)

則稱隨機(jī)區(qū)間為

的一個(gè)雙側(cè)置信區(qū)間,稱為雙側(cè)置信下(上)限,1-稱為置信水平或置信度。

(3.3)式表示置信區(qū)間包含未知參數(shù)

真值的概率是1-,若反復(fù)抽樣多次(每次樣本容量相等),每組樣本觀察值確定一個(gè)區(qū)間,每個(gè)這樣的區(qū)間或者包含

的真值,或者不包含

的真值,按貝努利定理,在所有這些區(qū)間中,包含

真值的約占,不包含

真值的僅占左右。

當(dāng)和時(shí),稱為置信區(qū)間觀察值,也稱為置信區(qū)間。

在有些問題中,我們關(guān)心的是未知參數(shù)至少有多大(如設(shè)備元件使用的壽命),或不超過多大(如產(chǎn)品的次品率),因此下面給出單側(cè)置信區(qū)間的概念。定義3.4在定義3.3中,如果將(3.3)式改成

則稱或?yàn)閱蝹?cè)置信區(qū)間,和分別稱為單側(cè)置信下限與單側(cè)置信上限。

評(píng)價(jià)一個(gè)置信區(qū)間的好與壞有兩個(gè)標(biāo)準(zhǔn),一是精度,即越小精度越高,也就越好。另一個(gè)是置信度,即越大越好。我們當(dāng)然希望盡可能地小,同時(shí)希望盡可能地大,但是當(dāng)樣本容量n固定時(shí),精度與置信度不可能同時(shí)提高。

因?yàn)楫?dāng)精度提高時(shí)即變小時(shí),()覆蓋真值

的可能性也變小,從而降低了置信度,相反,當(dāng)置信度增大時(shí),必然也增大,從而降低了精度,在實(shí)際問題中,一般是根據(jù)實(shí)際問題的需要,先選定置信度為1-,然后再通過增加樣本容量n提高精度。

二、區(qū)間估計(jì)的步驟

(1)構(gòu)造一個(gè)隨機(jī)變量g(

)(含待估計(jì)的未知參數(shù),分布已知);

(2)給定置信水平,使;

(3)從不等式

中解出即

得的置信區(qū)間;(4)將xi代替中的xi,即得觀察區(qū)間。

§3.4單正態(tài)總值均值與方差的區(qū)間估計(jì)

假設(shè)總體X~N(),構(gòu)造與的置信區(qū)間有重要的實(shí)用意義,而且有關(guān)結(jié)果是完滿的。

一、均值的置信區(qū)間

從總體X中取樣本(X1,X2,…,Xn),設(shè)樣本值為(x1,x2,x3,…,xn)由于

隨機(jī)變量很明顯,統(tǒng)計(jì)量Z的分布函數(shù)不依賴于未知參數(shù)μ。

設(shè)已給定對(duì)μ的區(qū)間估計(jì)置信度為1-令

為Z的雙側(cè)點(diǎn))解不等式(關(guān)于μ):

得從而所求的100(1-)%置信區(qū)間為將樣本平均值取其觀察值,則100(1-)%的置信區(qū)間為

【例3.9】某廠質(zhì)量管理部門的負(fù)責(zé)人希望估計(jì)移交給接受部門的5500包原材料的平均重量,一個(gè)由250包原材料組成的隨機(jī)樣本所給出的平均值=65千克??傮w標(biāo)準(zhǔn)差

=15千克。試構(gòu)造總體未知的平均值的μ置信區(qū)間,假定95%的置信區(qū)間已能令人滿意,并假定總體為正態(tài)分布

解:(1)樣本平均值=65千克

(2)由1-

=0.95,/2=0.025,查標(biāo)準(zhǔn)正態(tài)分布表得

(3)寫出置信區(qū)間==

=(63.14,66.86)于是,我們有95%的把握說總體平均值μ介于63.14和66.86千克之間。

[注意]在很多情況下,我們遇到的總體為非正態(tài)分布,但中心極限定理告訴我們,當(dāng)樣本容量n足夠大,無論總體服從什么分布,的柚樣分布將近似地服從正態(tài)分布,因此當(dāng)樣本取自總體方差已知的非正態(tài)分布時(shí),我們?nèi)钥梢杂?/p>

公式來近似求出總體平均值μ的置信區(qū)間。

2.未知時(shí),求μ的置信區(qū)間

稍微留意上述求得的μ的置信區(qū)間,不難發(fā)現(xiàn)只有在已知時(shí)方法才可行。如果未知,則可用樣本方差S2代替總體方差,從而根據(jù)統(tǒng)計(jì)量:

對(duì)給定的置信水平1-,令可解得μ的1-置信區(qū)間為將、S2分別取其觀察值則μ的1-置信區(qū)間為例3.10為了估計(jì)一分鐘一次廣告的平均費(fèi)用,抽出了15電視臺(tái)的隨機(jī)樣本。樣本的平均值=2000元,其中標(biāo)準(zhǔn)差S=1000元。假定所有被抽樣的這類電視臺(tái)服從正態(tài)分布,試構(gòu)造總體平均值μ的95%的置信區(qū)間。解:(1)樣本均值與方差分別為=2000元,S=1000元

(2)由1-

=0.95,得/2=0.025,n-1=14,查t分布表,得

(3)寫出置信區(qū)間:顯然我們有95%的把握說明,總體平均數(shù)處在1447.5元和2552.5元之間。

=(1447.5,2552.5)[注意]當(dāng)

未知但樣本容量n>30,即大樣本時(shí),可用標(biāo)準(zhǔn)正態(tài)分布近似地當(dāng)作t分布。因此,在實(shí)際工作中,只有在小樣本的情況下,即樣本容量n<30時(shí),才應(yīng)用t分布,而對(duì)于大樣本,則通常采用正態(tài)分布來構(gòu)造總體平均數(shù)的置信區(qū)間。另外,根據(jù)中心極限定理,從非正態(tài)總體中抽樣時(shí),只要能夠抽取大樣本,那么,樣本平均數(shù)的抽樣分布就會(huì)服從正態(tài)分布。這時(shí),我們也就能夠用來構(gòu)造置信區(qū)間,但由于

是未知的,因此,只能用來構(gòu)造置信區(qū)間。

二、方差

2的置信區(qū)間設(shè)X1,X2,X3,…,Xn是總體X~N(

,

2)的一個(gè)樣本,其觀察值為x1,x2,x3,…,xn。因?yàn)樵谝话闱闆r下,總體的均值是未知的,所以我們只討論均值

未知時(shí),對(duì)

2的區(qū)間估計(jì)。要對(duì)

2進(jìn)行區(qū)間估計(jì),須考慮樣本方差S2,由分布理論知隨機(jī)變量對(duì)于給定的置信水平1-,有

由此得

2的置信水平為1-的置信區(qū)間為而

標(biāo)準(zhǔn)差的置信水平為1-的置信區(qū)間是例3.11某制造廠的一名生產(chǎn)管理人員需要知道完成某件工作所需的時(shí)間。為此他進(jìn)行了一項(xiàng)研究,得出一個(gè)適于分析的31個(gè)觀察值組成的隨機(jī)樣本,從樣本數(shù)據(jù)算出的方差為0.3小時(shí),試問:(1)構(gòu)造方差

2的95%的置信區(qū)間(2)構(gòu)造

的95%的置信區(qū)間(3)構(gòu)造置信區(qū)間時(shí)作了何種假定?解:(1)S2=0.3,自由度=n-1=31-1=30查分布表得:從而求得0.1916<

2

<0.5360因此,我們有95%的把握說

2落在0.1916和0.5360之間的范圍內(nèi)。(2)其總體標(biāo)準(zhǔn)差的置信區(qū)間為:0.4377<

<0.7321(3)被抽樣的總體服從或近似服從正態(tài)分布是置信區(qū)間估計(jì)的假定條件。上面我們討論了正態(tài)總體的兩個(gè)參數(shù)

2的雙側(cè)置信區(qū)間,至于單側(cè)置信區(qū)間的求法完全類同,只是所用的百分位點(diǎn)不同,舉例說明如下。例3.12從某一批燈泡中隨機(jī)地抽取5只作壽命試驗(yàn),測(cè)得壽命(以小時(shí)計(jì))如下:10501100112012501280設(shè)壽命X~N(

,

2),

2未知,求壽命X的均值

的置信水平為95%的單側(cè)置信下限和單側(cè)置信區(qū)間。155解:∵X~N(

,

2),

2未知∴隨機(jī)變量其中,S分別為總體X的樣本均值與樣本方差。對(duì)于給定的置信水平1-,有由不等式,可解得

的1-單側(cè)置信下限與單側(cè)置信區(qū)間分別為:

根據(jù)本題所給數(shù)據(jù),具體計(jì)算(1050+1100+1120+1250+1=1160查t分布表得

故所求單側(cè)置信下限是

單側(cè)置信區(qū)間為(1065,+∞)。

§3.5兩個(gè)正態(tài)總體均值差與方差比的區(qū)間估計(jì)

在實(shí)際應(yīng)用中常有這樣的問題,如已知某種產(chǎn)品的質(zhì)量指標(biāo)X服從正態(tài)分布,但由于設(shè)備改善,工藝改革或原料改變等因素,使得總體X的均值和方差有所改變,對(duì)于這種情況,就需要知道均值和方差的改變情況,因此,需要考慮二正態(tài)均值差和方差比的區(qū)間估計(jì)問題。

一、二正態(tài)總體均值差的置信區(qū)間

設(shè)和S12

是總體X~N(

1,

12

)的容量為n1的樣均值和樣本方差;和S22是總體Y~N(

2,

22

)的容量為n2的樣本均值和樣本方差,并設(shè)這兩個(gè)總體相互獨(dú)立?,F(xiàn)在考慮二正態(tài)總體均值差的區(qū)間估計(jì)。因?yàn)榉謩e是的點(diǎn)估計(jì)量,故服從正態(tài)分布,而且

所以

1.已知

12,

22時(shí),求的

1-2置信區(qū)間

由于隨機(jī)變量

所以對(duì)于給定的置信水平1-,有

從不等式中解出

1-

2,即得

1-

2的置信水平為1-的置信區(qū)間為將取其觀察值,得置信區(qū)間為2.

12,

22都未知時(shí),求

1-2的置信區(qū)間當(dāng)樣本容量n1,n2都很大時(shí)(>30),可用S12,S22、分別代替

12、

22,于是可用區(qū)間作為

1-

2的近似的1-置信區(qū)間。

3.未知時(shí),求

1-

2的置信區(qū)間,則t分布理論知其中

在給定的置信水平1-的條件下,有由此可得

1-

2的置信水平為1-的置信區(qū)間當(dāng)及Sw取樣本觀察值時(shí),置信區(qū)間為

【例3.13】某銀行負(fù)責(zé)人想知道存戶存入兩家銀行的錢數(shù),他從每一家銀行各抽選了一個(gè)由25個(gè)存戶組成的隨機(jī)樣本。樣本平均值如下:銀行A:=450元;銀行B:

=325元。兩個(gè)總體均服從方差分別為

A2=750和

B2=850的正態(tài)分布。試構(gòu)造

A-

B的95%的置信區(qū)間。

由于兩個(gè)總體均服從正態(tài)分布,因此也服從正態(tài)分布,從而計(jì)算總體均值之差的置信區(qū)間可用:

這個(gè)公式。

已知

12=750,

22=850,=450,=325,所以所求的置信區(qū)間為:這意味著有95%的把握認(rèn)為總體均值之差在109.32元和140.68元之間。:

【例3.14】某工廠中有兩臺(tái)生產(chǎn)金屬棒的機(jī)器。一個(gè)隨機(jī)樣本由機(jī)器A生產(chǎn)的11根金屬棒組成,另一個(gè)隨機(jī)樣本由機(jī)器B生產(chǎn)的21根金屬棒組成。兩個(gè)樣本分別給出兩臺(tái)機(jī)器所生產(chǎn)金屬棒的長度數(shù)據(jù)如下: =6.10英寸,=5.95英寸,SA2=0.018,SB2=0.020。假定兩個(gè)總體近似服從正態(tài)分布,且總體方差相等,試構(gòu)造

A-

B的95%的置信區(qū)間。解

1-=95%,=0.05,查t分布表得t/2=t0.025(30)=2.042所以所求置信區(qū)間為:

=(0.05,0.25)4.兩個(gè)總體均不服從正態(tài)分布且方差未知對(duì)于一般不服從正態(tài)分布的兩個(gè)總體,我們往往根據(jù)中心極限定理采用大樣本抽樣方法。如果兩個(gè)總體方差未知,就用S1和S2分別作為

1和

2的估計(jì)值,當(dāng)n1和n2足夠大時(shí),

1-

2的置信水平為1-的近似置信區(qū)間為:

【例3.15】東大和西大兩所大學(xué)某學(xué)期期末英語考試采用同一試題,東大認(rèn)為該校學(xué)生英語考試成績能比西大高出10分,為了證實(shí)這一說法,主管部門從兩校各抽取一個(gè)隨機(jī)樣本并得到如下數(shù)據(jù):n東=75人,n西=80人,東=78.6分,

西=73.8分,S東=8.2分,S西=7.4分。試在95%的置信度下確定兩校平均分?jǐn)?shù)之差的置信區(qū)間。

解:

分1-=0.95,=0.025,查標(biāo)準(zhǔn)正態(tài)分布表得,從而其置信區(qū)間為:(78.6–73.8±1.96×1.26)=(2.3,7.3)

因此,我們有95%的把握說東大、西大兩校英語考試成績之差在2.3分和7.3分之間。這一結(jié)果說明東大的平均成績確實(shí)高于西大,但并未高出10分。二、二正態(tài)總體方差比的置信區(qū)間

在實(shí)際工作中還常常需要比較兩個(gè)總體的方差。例如,在選擇產(chǎn)品時(shí),我們通常需要方差較小的產(chǎn)品,因?yàn)榉讲钶^小的產(chǎn)品的質(zhì)量比較均勻。比較兩個(gè)總體方差的大小,可以將兩個(gè)方差相比,當(dāng)兩個(gè)方差相等時(shí)其比值為1。但兩個(gè)總體方差

12和

22都是未知的,所以需要通過兩個(gè)樣本方差來加以比較推斷。設(shè)二正態(tài)總體X~N(

1,

12)與Y~N(

2,

22),其中的參數(shù)均未知,它們相互獨(dú)立的兩個(gè)樣本的容量分別為n1,n2,樣本方差為S12與S22,現(xiàn)在求其方差比

12/

22的置信區(qū)間由分布理論知

從而

于是,對(duì)給定的置信水平為1-,有:

所以

12/

22的置信水平為1-的置信區(qū)間為:

(此處利用了公式:)

【例3.16】為了比較用兩種不同方法生產(chǎn)的某種產(chǎn)品的壽命,進(jìn)行一項(xiàng)試驗(yàn)。試驗(yàn)中抽選了由方法1生產(chǎn)的16個(gè)產(chǎn)品組成一個(gè)隨機(jī)樣本,其方差為1200小時(shí)。又抽選了用方法2生產(chǎn)的21個(gè)產(chǎn)品組成另一個(gè)隨機(jī)樣本,得出的方差為800小時(shí)。試以95%的置信度估計(jì)

12/

22的置信區(qū)間解:由于S12=1200,S22=800,S12>S22從而所求的置信區(qū)間為:即:0.58<

12/

22<4014

也就是(0.58,4.14)§3.6關(guān)于比例的區(qū)間估計(jì)一、一個(gè)總體比例的區(qū)間估計(jì)

我們?cè)趯?shí)際工作中時(shí)常會(huì)碰到對(duì)總體比例的估計(jì)問題。例如,企業(yè)領(lǐng)導(dǎo)想知道本企業(yè)生產(chǎn)中合格品率是多少?商店經(jīng)理想了解對(duì)他們服務(wù)滿意的顧客在全部顧客中所占的比率等等。我們知道樣本比例的抽樣分布,當(dāng)nP和n(1-P)兩者皆大于5時(shí)(P為總體比例),的分布近似服從平均值為P,標(biāo)準(zhǔn)差

p為的正態(tài)分布。但是,在實(shí)際工作中P往往是未知的,我們所要估計(jì)的也正是這個(gè)總體比例P,所以,就需要用樣本比例來代替P。這樣,我們就得到了標(biāo)準(zhǔn)差的估計(jì)值:因此,可對(duì)總體比例的區(qū)間估計(jì)作表述如下:如果nP和n(1-P)兩者皆大于5,并且n相對(duì)總體容量來說很小,則P的近似100(1-)%的置信區(qū)間由下式給出:如果我們研究的總體是有限的,尤其是抽樣比重較大時(shí),即n/N>0.05,就要采用有限總體修正系數(shù),從而P的區(qū)間估計(jì)公式為:【例3.17】某一大公司的人事處長希望知道本公司內(nèi)專業(yè)不對(duì)口的職員究竟占多大比例。于是,他從2000名具有大專以上學(xué)歷的職員中隨機(jī)抽取了一個(gè)由150人組成的樣本進(jìn)行研究,結(jié)果表明,其中有45人說他們從事的工作與所學(xué)專業(yè)不對(duì)口。試在95.5%的置信度下構(gòu)造出專業(yè)不對(duì)口人員所占真正比例的置信區(qū)間。解:由于樣本容量很大,n=150,

=45/150=0.3,和都大于5,故可用正態(tài)分布逼近。但又由于抽樣比重,故需用有限總體修正系數(shù)計(jì)算Sp,則

=(0.228,0.372)

計(jì)算結(jié)果表明,我們有95.5%的把握說,該公司具有大專以上學(xué)歷的人員中,有22.8%~37.2%的

人專業(yè)不對(duì)口。

二、兩個(gè)總體比例之差的區(qū)間估計(jì)

為了估計(jì)兩個(gè)總體比例之差P1-P2,我們可從每一個(gè)總體中各抽一個(gè)隨機(jī)樣本,并利用兩個(gè)樣本比例之差。這樣就可以按通常的方式構(gòu)造出一個(gè)區(qū)間的估計(jì)值。我們知道,當(dāng)n1和n2都很大,即大樣本,而且總體比例不太接近0或1時(shí),兩個(gè)獨(dú)立樣本的抽樣分布近似服從正態(tài)分布,其平均值為P1-P2,標(biāo)準(zhǔn)差為:

因?yàn)镻1和P2皆未知,所以標(biāo)準(zhǔn)差應(yīng)通過下式來估計(jì):于是上述條件下P1-P2的100(1-)%的置信區(qū)間由下式給出:

【例3.18】某企業(yè)有兩個(gè)車間,分別用A和B表示。為了降低廢品率,該企業(yè)對(duì)車間B的工人首先進(jìn)行業(yè)務(wù)培訓(xùn)。3個(gè)月后,該企業(yè)負(fù)責(zé)人對(duì)兩個(gè)車間的產(chǎn)品質(zhì)量進(jìn)行了檢驗(yàn)。從車間A抽取了200件產(chǎn)品,從車間B抽取了220件產(chǎn)品。查得廢品率A車間為,B車間為,試在95%的把握程度下,構(gòu)造兩個(gè)廢品率之間的置信區(qū)間。解:

Z

/2=Z0.025=1.96,從而其區(qū)間估計(jì)為:(0.15-0.03±1.96×0.0277)=(0.066,0.174)

根據(jù)這一結(jié)果,我們有95%的把握說,車間A和車間B的廢品率之差為6.6%~17.4%。這說明,車間B人員的業(yè)務(wù)培訓(xùn)收到了效果?!?.7樣本容量的確定

以上所舉的例子中,都假定樣本容量已定。在實(shí)際設(shè)計(jì)抽樣方案中有一個(gè)重要的問題,就是在特定的情況下,應(yīng)該用多大的樣本?如果使用一個(gè)比需要大的樣本,就會(huì)浪費(fèi)資料;如果樣本太小,就不能達(dá)到分析的目的。

事實(shí)上,決定樣本大小的因素有以下三點(diǎn):(1)受總體方差

2數(shù)值大小的影響。總體方差大,抽樣誤差大,則應(yīng)多抽一些樣本容量,反之,則可少抽一些。當(dāng)然,當(dāng)總體方差為0時(shí),那么只需抽出其中一個(gè)就能代表總體。問題是實(shí)際工作中我們往往不知道總體方差,因而必須作試驗(yàn)性調(diào)查,或以過去的歷史資料作參考。

(2)可靠性程度的高低。要求可靠性越高,所必需的樣本容量就越大,也就是說,為獲得所需精度而指定的概率越大,所需要的樣本容量就越大。

(3)允許誤差的大小。這主要由研究目的而定。若要求推斷比較精確,允許誤差應(yīng)該低一些,隨之抽取的樣本容量也要求多一些。反之,若允許誤差可以大一些,樣本容量也可以少一些。

一、估計(jì)總體平均數(shù)樣本容量的確定

在重復(fù)抽樣的條件下,我們用△表示允許誤差,用

表示總體標(biāo)準(zhǔn)差,用1-表示可靠性,用Z/2表示相應(yīng)的概率度,那么,允許誤差的公式可表述如下:

這就是在重復(fù)抽樣條件下確定樣本容量的計(jì)算公式。當(dāng)我們采用不重復(fù)抽樣時(shí),就要采用有限總體修正系數(shù)。這時(shí)∴

這就是不重復(fù)抽樣條件下確定樣本容量的計(jì)算公式。

【例3.19】某批產(chǎn)品的平均重量=70千克,總體標(biāo)準(zhǔn)差

=5千克?,F(xiàn)準(zhǔn)備對(duì)這批產(chǎn)品采用重復(fù)抽樣方式進(jìn)行簡單隨機(jī)抽樣檢驗(yàn),要求可靠程度達(dá)到95%,允許誤差不超過0.9千克。試問需要抽多少樣本容量?解:

=5,Z/2=1.96,(件)即應(yīng)抽取樣本容量119件。在實(shí)際工作中,總體標(biāo)準(zhǔn)可能是未知的,因此必須通過某種途徑來估計(jì)

,主要有:(1)當(dāng)以前有過類似的抽樣,并且總體變動(dòng)又不太大時(shí),便可用以往的資料來估計(jì),總體標(biāo)準(zhǔn)差

。(2)在正式抽樣研究之前,先抽出一個(gè)實(shí)驗(yàn)樣本,算出其標(biāo)準(zhǔn)差S,并用它來代替

。(3)當(dāng)總體近似服從正態(tài)分布時(shí),便可根據(jù)全距來估計(jì)標(biāo)準(zhǔn)差S。二、估計(jì)總體比例時(shí)樣本容量的確定估計(jì)總體比例時(shí),其樣本容量的確定類似Z于估計(jì)總體平均數(shù)時(shí)樣本容量的確定。在重復(fù)抽樣時(shí),由于

在不重復(fù)抽樣時(shí),由于∴

上述兩個(gè)公式的計(jì)算都需要知道總體比例P,但一般情況下P是未知的。因此,要想確定其樣本容量,必須首先尋找P的估計(jì)值,一般有以下幾種方式:(1)用以往的資料估計(jì)P。(2)在正式抽樣之前,先抽一個(gè)實(shí)驗(yàn)樣本,用此樣本比例來代替P。(3)當(dāng)研究者對(duì)某一總體比例有很大把握時(shí),則可用它作為P的估計(jì)值。(4)如果什么資料也沒有,那么可以令P=0.5,因?yàn)榇藭r(shí),P(1-P)最大,從而所需的樣本也比較多,推斷也就比較可靠。【例3.20】一家市場調(diào)查公司希望估計(jì)某地區(qū)有25英寸彩色電視機(jī)的家庭所占的比例。該公司希望對(duì)P的估計(jì)誤差不超過0.07,置信度為95.5%,但沒有可利用的P的估計(jì)值。試問應(yīng)抽取多大容量的樣本?解:

由于沒有較好的P的估計(jì)值可供利用,因此只能取P=0.5,從而即應(yīng)抽取容量為204的樣本。215第四章假設(shè)檢驗(yàn)216§4.1假設(shè)檢驗(yàn)的基本概念

對(duì)總體的概率分布或分布參數(shù)作出某種“假設(shè)”,根據(jù)抽樣得到的樣本觀測(cè)值,運(yùn)用數(shù)理統(tǒng)計(jì)的分析方法,檢驗(yàn)這種“假設(shè)”是否正確,從而決定接受或拒絕“假設(shè)”,這就是本章要討論的假設(shè)檢驗(yàn)問題。2171、小概率原理小概率原理是假設(shè)檢驗(yàn)的基本依據(jù),即認(rèn)為小概率事件在一次試驗(yàn)中幾乎是不可能發(fā)生的。當(dāng)進(jìn)行假設(shè)檢驗(yàn)時(shí),先假設(shè)H0正確,在此假設(shè)下,若小概率事件A出現(xiàn)的概率很小,例如P(A)=0.01,經(jīng)過取樣試驗(yàn)后,A出現(xiàn)了,則違反了上述原理,我們認(rèn)為這是一個(gè)不合理的結(jié)果。218

這時(shí),我們只能懷疑作為小概率事件A的前提假設(shè)H0的正確性,于是否定H0。反之,如果試驗(yàn)中A沒有出現(xiàn),我們就沒有理由否定假設(shè)H0,從而做出接受H0的結(jié)論。下面我們通過實(shí)例來說明假設(shè)檢驗(yàn)的基本思想及推理方法。2192、假設(shè)檢驗(yàn)的基本思想及推理方法例1某車間為了提高零件的強(qiáng)度進(jìn)行了技改,已知零件強(qiáng)度X(單位:kg/mm)服從正態(tài)分布N(52.8,0.8),其中μ0=52.8kg/mm是零件強(qiáng)度,現(xiàn)進(jìn)行了技改后,抽取n=16的樣本,測(cè)得強(qiáng)度為:(kg/mm)

51.953.452.954.353.852.453.754.052.452.553.551.354.952.854.552.9

假設(shè)=0.8不變,試問技改后零件強(qiáng)度是否發(fā)生了實(shí)質(zhì)性變化?2

2

2

2

2

2

220

我們的問題就是:已知總體X~N(),且要求檢驗(yàn)下面的假設(shè):(4-1)通常把H0稱為原假設(shè)或零假設(shè),把H1稱為備擇假設(shè)或?qū)α⒓僭O(shè)。從取樣結(jié)果看,樣本均值與總體均值之間存在差異,這種差異是因?yàn)槌闃拥碾S機(jī)性導(dǎo)致的不可避免的誤差,還是因?yàn)榧几亩鴮?dǎo)致的實(shí)質(zhì)性差異?

221

為了回答這個(gè)問題,首先給定一個(gè)小概率,稱為顯著性水平,通常取較小的值,如0.05,0.01。在本例中,我們選取。選取統(tǒng)計(jì)量,它包含待檢驗(yàn)參數(shù),當(dāng)H0為真時(shí),它的分布是已知的,本例中,選?。?-2)于是有

222

其中,為臨界值,查表得。

|μ|的拒絕域?yàn)椋海ǎ⒊闃又荡?-1式得:

落入拒絕域中,即小概率事件竟然出現(xiàn),于是否定假設(shè)H0,認(rèn)為技改后零件強(qiáng)度發(fā)生了變化。223

應(yīng)當(dāng)注意的是,上面例1的結(jié)論是在顯著性水平的情況下得出的,如果,則,代入觀察值,則會(huì)得出,技改后零件強(qiáng)度無實(shí)質(zhì)變化的相反結(jié)論??梢姡僭O(shè)取舍與否與的取值直接相關(guān),當(dāng)我們傾向于不要輕易否H0時(shí),可取小一些,反之,取大一些。2243、單邊檢驗(yàn)在上面例中,我們關(guān)心的是總體均值μ是否比μ0大,我們要確定是接受假設(shè),還是接受另一假設(shè),即技改后,零件的強(qiáng)度是否得到了提高。這樣,問題就是要檢驗(yàn)下面的假設(shè):

這一假設(shè)檢驗(yàn)稱為右邊檢驗(yàn),同樣存在左邊檢驗(yàn),統(tǒng)稱單邊檢驗(yàn)。

225

例2在例1中,是否可以認(rèn)為技改后,零件的強(qiáng)度有明顯的提高?()解:依題意假設(shè):

選擇統(tǒng)計(jì)量查表得拒絕域?yàn)椋ǎ⒊闃又荡氲?26

落入拒絕域中,拒絕H0,接受H1,認(rèn)為零件的強(qiáng)度技改后有明顯的提高。根據(jù)實(shí)際問題可以進(jìn)行不同形式的假設(shè),歸納如下:右邊檢驗(yàn),假設(shè)形式為:左邊檢驗(yàn),假設(shè)形式為:

2274、兩類錯(cuò)誤小概率原理是假設(shè)檢驗(yàn)的基本依據(jù),然而,對(duì)于小概率事件,無論其概率多么小,還是可能發(fā)生的,所以,利用小概率原理為基礎(chǔ)的假設(shè)檢驗(yàn)方法進(jìn)行檢驗(yàn),可能會(huì)做出錯(cuò)誤的判斷,主要有以下兩種形式228(1)原假設(shè)H0實(shí)際是正確的,但卻錯(cuò)誤地拒絕了H0,這樣就犯了“棄真”的錯(cuò)誤,通常稱為第一類錯(cuò)誤。由于僅當(dāng)所考慮的小概率事件A發(fā)生時(shí)才拒絕H0,所以犯第一類錯(cuò)誤的概率就是條件概率。229

(2)原假設(shè)A0實(shí)際是不正確的,但是卻錯(cuò)誤地接受了H0,這樣就犯了“取偽”的錯(cuò)誤,通常稱為第二類錯(cuò)誤。犯第二類錯(cuò)誤的概率記為。我們自然希望犯這兩類錯(cuò)誤的概率越小越好。但當(dāng)樣本容量n確定后,犯這兩類錯(cuò)誤的概率不可能同時(shí)被控制,通常在我們根據(jù)歷史經(jīng)驗(yàn)選取恰當(dāng)?shù)娘@著性水平后,通過擴(kuò)大樣本容量n的方式來使第二類錯(cuò)誤的概率減小。2305、假設(shè)檢驗(yàn)的基本步驟(1)根據(jù)實(shí)際問題提出基本假設(shè)H0和備擇假設(shè)H1。(2)選取適當(dāng)?shù)娘@著性水平,通常等。(3)根據(jù)H0選取適當(dāng)?shù)慕y(tǒng)計(jì)量,當(dāng)H0為真時(shí),該統(tǒng)計(jì)量的分布應(yīng)為已知。(4)求出此檢驗(yàn)的拒絕域,記作w。(5)根據(jù)樣本觀察值,計(jì)算統(tǒng)計(jì)量的觀察值。(6)作出判斷,若0落在拒絕域內(nèi),則拒絕H0,接受H1,否則接受H0。。231§4.2單個(gè)正態(tài)總體均值和方差的檢驗(yàn)

我們首先討論單個(gè)正態(tài)總體中參數(shù)的假設(shè)檢驗(yàn)問題。設(shè)從總體抽取樣本容量為n的樣本,其中2321、已知,關(guān)于的檢驗(yàn)(z檢驗(yàn))在上一節(jié)例1中,已討論過正態(tài)總體,當(dāng)已知時(shí),關(guān)于=0的檢驗(yàn)問題。在這些問題中,我們都是利用H0為真時(shí)服從N(0,1)分布的統(tǒng)計(jì)量來確定拒絕域的,這種檢驗(yàn)法常稱為z檢驗(yàn)法。2

2

233

下面我們?cè)賮砗唵谓榻B其步驟:已知=0,假設(shè)

易知統(tǒng)計(jì)量對(duì)于給定的顯著性水平,

234

查正態(tài)分布表得拒絕域?qū)颖居^察值代入,如果,

則否定H0,接受H1,否則接受H1。其單邊檢驗(yàn)參照有關(guān)內(nèi)容,在此不再敘述。

235

2、未知,關(guān)于的檢驗(yàn)(t檢驗(yàn))設(shè)總體,其中未知,是來自總體x的樣本。因?yàn)橐阎?,不能用統(tǒng)計(jì)量進(jìn)行檢驗(yàn),當(dāng)H0成立時(shí),我們可以使用此統(tǒng)計(jì)量來進(jìn)行在未知的情況下的檢驗(yàn)。2

2

236

具體檢驗(yàn)過程如下: 未知,假設(shè)

選取統(tǒng)計(jì)量(4-3)對(duì)于給定的,查表得臨界值確定拒絕域

237

代入樣本觀察值,如果則否定H0,接受H1,否則,接受H0。其單邊檢驗(yàn)過程如下:右邊檢驗(yàn):假設(shè)

拒絕域:

238

例3某種電子元件壽命x(以小時(shí)計(jì))服從正態(tài)分布,,未知,現(xiàn)抽取9只元件測(cè)得壽命如下:

10599971009698103104107

問:是否可以認(rèn)為元件的壽命大于100小時(shí)?解:依題意假設(shè):

選取統(tǒng)計(jì)量n=9。

2

239

對(duì)于給定的,查表得臨界值,拒絕域?yàn)椋?.753,)計(jì)算代入(4-3)式

t沒有落入拒絕域,故接受H0,認(rèn)為元件的壽命不超過100小時(shí)。

2403、未知,檢驗(yàn)關(guān)于的假設(shè)(檢驗(yàn)法)設(shè)總體,其中未知,是來自等于總體x的樣本。假設(shè),,0為已知常數(shù)當(dāng)H0成立時(shí),統(tǒng)計(jì)量

241對(duì)于給定的顯著性水平,查表得:拒絕域?yàn)?42

其單邊檢驗(yàn)情況如下:右邊檢驗(yàn):假設(shè)

拒絕域:

243

左邊檢驗(yàn):假設(shè)

拒絕域:

計(jì)算s代入得,如果落入拒絕域,則否定H0,否則接受H0。244例4假設(shè)鋼板重量總體近似服從正態(tài)分布,按照規(guī)定,這種鋼板的方差不得超過0.016kg,現(xiàn)隨機(jī)抽取n=25的鋼板樣本,測(cè)得其樣本,試問:是否可以認(rèn)為這批鋼板不合規(guī)格?2

245

解:依題意,假設(shè)選取統(tǒng)計(jì)量對(duì)于給定的顯著性水平,查表得將樣本值代入得:

落入拒絕域中,拒絕假設(shè)H0,即鋼板的方差不合格。

246§4.2兩個(gè)正態(tài)總體均值與方差的檢驗(yàn)

1、關(guān)于兩個(gè)正態(tài)總體均值的檢驗(yàn)(t檢驗(yàn))設(shè)總體,,與分別是來自總體x與Y的樣本,且兩樣本獨(dú)立。均未知,但要注意在這里,假設(shè)兩總體的方差是相等的。247

檢驗(yàn)假設(shè)

當(dāng)H0成立時(shí),統(tǒng)計(jì)量

其中

248

對(duì)于給定的顯著性水平,查表得

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論