




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、第二章概率分布與臉驗§2-1理論分布§2-2樣本平均數(shù)的抽樣分布§23統(tǒng)計假設(shè)檢驗概述§ 2-1理論分布、事件與概率1事件(1)必然事件:(2)不可能事件:隨機事件:隨機事件的特點: 在一定的條件下,有多種可能的結(jié)果發(fā)生,事前人們不 能預(yù)言哪種結(jié)果; 對一次或少數(shù)幾次觀察或試驗而言,其結(jié)果呈現(xiàn)偶然性、 不確定性; 但在相同條件下進行大量重復(fù)試驗時,其試驗結(jié)果呈現(xiàn) 出某種固有的規(guī)律性一頻率,即隨機事件的統(tǒng)計規(guī)律性。F例如,種子的發(fā)芽率試驗,少量的種籽作試驗時,其發(fā)芽率可能是85%、95%,0但當進行重復(fù)大量樣本的試驗時,其發(fā)芽率越來越接近90%,V這90%
2、實際上是這批種籽的發(fā)芽率或稱為概1.2概 率:在相同條件下進行n次重復(fù)試驗,如果隨機事 件A發(fā)生的次數(shù)為m,那么m/n稱為隨機事件A 的頻率(frequency);心當試驗重復(fù)數(shù)n逐漸增大時,隨機事件A的頻 率m/n越來越穩(wěn)定地接近某一數(shù)值P,那么就 把為隨機事件A的概率。13小概率事件原理*概率表示了隨機事件在一次試驗中出現(xiàn)的機率。、若隨機事件的概率很小,例如<0. 05. 001、0. 001,稱之為小概率事件。心小概率事件雖然不是不可能事件,但在一次試驗 中出現(xiàn)的可能性很小,實際上可以看成是不可能/ 發(fā)生的。-*統(tǒng)計學上,把小概率事件在一次試驗中看成是不可 能發(fā)生的事件稱為小概率事
3、件原理。V此原理是統(tǒng)計學上進行假設(shè)檢驗(顯著性檢驗)的 基本依據(jù)。2概率分布(連續(xù)型隨機變量)1)連續(xù)型隨機變量(如身高、體重、物質(zhì)濃度)的概率 分布,可用隨機變量X在某個區(qū)間內(nèi)取值的概率 P (ax<b)來表示。卻概率分布密度函數(shù),當X取值于區(qū)間a,b的概率為 中陰影部分的面積P(a<x<b)= fx)dx圖2-1概率分布曲線0s正態(tài)分布(Normal distribution)11正態(tài)分布的定義及其特征(1)正態(tài)分布的定義«若連續(xù)型隨機變量X的概率分布密度函數(shù)為I1 )/U) = e "2CT y! 2717其中"為平均數(shù),昭為方差,則稱隨機
4、變量X服從 正態(tài)分希,iB為xN(pe2)20(比)=jJ e 2 du4)3.2標準正態(tài)分布:將一般的N(P , O 2)轉(zhuǎn)換為P =0, a 2二1的正態(tài) 5布。我們稱U =0, a 2=1的正態(tài)分布為標準 正態(tài)分布。:標準正態(tài)分布的概率密度函數(shù)及分布函數(shù)分別記作V(U)和(U),如式3)及4)式得:3)s3) =j=a/ 2花十菇柱何一個服從正態(tài)分布N ( P ,。2)的隨機 變量X,都可以通過標準化變換,u=(X- U ) / a5)將其變換為服從標準正態(tài)分布的隨機變量U。U稱為標準正態(tài)變量(standard normal deviate)。心按5)式計算,對不同的U值編成函數(shù)表,稱為
5、 正態(tài)分布表,見附表1,從中可查到U在任意 -個區(qū)間內(nèi)取值的概率。3.3正態(tài)分布概率的計算1)標準正態(tài)分布的概率計算(N0RMSDI ST) 心設(shè)U服從標準正態(tài)分布,貝lju在葉出內(nèi)取值 的概率為:1III、1二I p« UII !«, -M" P(«i <u <Uj)= . I £ 2 du = j=0 2 du1= f e 2 du=<t>(U2)(Ui)心而(W)與(U2)可由附表1查得。關(guān)于標準正態(tài)分布,以下幾種 概率應(yīng)當熟記:<P(-l<f/ <1)=0.683"(J96M <
6、196) =C心P (-2.58</ <2.58) =C:對于一般正態(tài)分布2卸+<0 =0.6!0P (p-1.96oS < p+1.'=0.95gP (p-2.58tySt <p+2.58o)=0.99(3)兩尾概率和一尾概率數(shù)理統(tǒng)計中,把隨機變量精在平均數(shù)P加、減不 同倍數(shù)標準差O區(qū)間之外的概率稱為兩尾概率,記 作a。隨機變量"W U 一kG或Nu +/ro的概率,稱為一尾 概率,記作0/2。心例如,X落在(U-1.96O, U+1.96O)之外的雙尾概率為 0. 05,而單尾概率為0. 025o心即P(xV U-1.96 0)= P(x&g
7、t; u+1.96 0)=0. 025兩尾概率或一尾概率如圖2-4所示。0 熾在(U -2. 58 O . U +2. 58 O )之外的雙尾概率為0. 01, 心而單尾概率P(xV U -2. 58 O ) = P(x> u +2. 58 a ) =0. 005§ 2-2樣本平均數(shù)的抽樣分布1、樣本平均數(shù)抽樣分布1.1定義:從一總體隨機地抽取樣本容量為n的樣本,由 這些樣本算得的平均數(shù)隨抽樣次數(shù)的分布, 稱為樣本平均數(shù)的抽樣分布。樣本平均數(shù)與原總體平均數(shù)U相比表現(xiàn)出的 差異是由隨機抽樣造成的,稱為抽樣誤差 (sampling error) o由總體隨機抽樣(random sa
8、mpling)的 方法可分為有返置抽樣和不返置抽樣兩 種OV前者指每次抽出一個個體后,這個個體應(yīng) 重返原總體;心后者指每次抽出的個體不返回原總體。:對于無限總體,返置與否都可保證各個 體被抽到的機會相等。心對于有限總體,就應(yīng)該采取返置抽樣, 否則各個體被抽到的機會就不相等。1.2中心極限定理:若有一隨機變量服從總體平均數(shù)為U、 方差為O 2的分布,則從這個總體中隨機/ 抽取容量為的樣本,隨樣本容量打的不斷增大,其樣本平均 數(shù)的分布亦愈來愈趨于正態(tài)分布,誦本平均數(shù)分布的平均數(shù)和標準差分別記為和6°心且具有平均數(shù)為P、方差為o2/n的分布J 稱為中心極限定理。V b丘是樣本平均數(shù)抽樣總體
9、的標準差,簡稱標準誤 (standard error)。總體的兩個參數(shù)與X原總體的兩個參數(shù)有如下關(guān)系:&=“,樂=刃厶無論胡艮從何種分布,一般只要n>30,就可認為的 分布是正態(tài)的。在正態(tài)分布總體中,以相同n抽取若干個樣本(如:試 驗重復(fù)n=3)時,樣本均數(shù)的分布仍服從正態(tài)分布。1.3標準誤樣本平均數(shù)抽樣總體的標準誤G的大小反映 樣本平均數(shù)抽樣誤差的大小,即精確性的高 低。心總體標準差。往往是未知的,七難計算,但可 用樣本標準差S估計:故,S壬即樣本標準誤或平均數(shù)標準誤可估計 總體平均數(shù)的標準誤。S _ 1工(宀)2-1)_ I工兀2 一(丫兀)2 Inq n(n-l)卞蒔禱準差
10、與樣本標準誤是兩個不同的統(tǒng)計S。i二者的區(qū)別在于:心樣本標準差S是樣本中各觀測值兀"兀力兀3,變異程度的一個 指標,反映了 X對該樣本代表性的強弱。心樣本標準誤是樣本平均數(shù)的標準差,它是亍抽樣誤差的估 計值,說明了 X精確性的高低。:對于大樣本資料,常將樣本標準差S與樣本平均數(shù)配 合使用,記為元土S,用以說明所考察指標的優(yōu)良性 與穩(wěn)定性。對于小樣本資料,常將樣本標準誤與樣本平均數(shù)配g 使用,記為牙土Sn用以表示所考察指標的優(yōu)良性旦 抽樣誤差的大小。)2、/分布(f-distribution)E用來研究小樣本的抽樣分布,是由William S. Cosset 于1908年以Studen
11、t的筆名發(fā)表的論文.由樣本平均數(shù)迪樣分布的性質(zhì)知道:若XXN ( " , O 2),貝阮NI , a 2/n)。則"心將隨機變量標準化得:U =(X II)/cr-:當總體標準差a未知時,以樣本標準差易弋替。所 得到的統(tǒng)計®記為仁r = (x-/z)/S-在計算升時,由于采用S來代替。,使得亡變量不 再服從標準正態(tài)分布,而是服從 旳*布(Cosset & Fisher)。專它的概率分布密度函數(shù)如下:=十廠51)/2(1 + 11)-辰W/2) df)V式中,亡的取值范圍是(-8, +8); d仁nT 為自由度。j:布的平均數(shù)和標準差為:P £=0
12、,6 = yldf/(df-2)(少2)* r分布的標準差與總體標準差沒有關(guān)連。因此,特別 適用于抽樣誤差大的小樣本。二I)形>布受自由度的制約,每一個自由度都有一條 旳布密度曲線。 2)冊布密度曲線以縱軸左右對稱,且在十=0時, 函數(shù)值最大。 3)與標準正態(tài)分布曲線相比,旳<布曲線頂部略低, 兩尾部稍高而平。刃越小這種趨勢越明顯。 4) 越大,f分布越趨近于標準正態(tài)分布。9當/2>30時,/分布與標準正態(tài)分布的區(qū)別很小; x?»w>100時,r分布基本與標準正態(tài)分布相同;飛2-3統(tǒng)計假設(shè)檢驗概述K顯著14檢驗的基本原理1.1概念«1)統(tǒng)計檢驗(統(tǒng)計
13、推斷兒 根據(jù)抽樣分布規(guī)律 和概率理論,由樣本統(tǒng)計數(shù)去推斷總體參數(shù) 的方法。包括假設(shè)檢驗和參數(shù)估計«2)假設(shè)檢驗:根據(jù)某種實際需要,對未知或 不完全知道的統(tǒng)計總體提出一些假設(shè)(這些假 設(shè)構(gòu)成完全事件),然后由樣本的實際結(jié)果計 算后作出的在一定概率意義上應(yīng)當接受的那 種假設(shè)的檢驗。V如在白班生產(chǎn)的產(chǎn)品與晩班生產(chǎn)的產(chǎn)品, 其質(zhì)量的差異是由抽樣誤差產(chǎn)生的還是由生 產(chǎn)工人產(chǎn)生的差異。 3)參數(shù)估計.由樣本的統(tǒng)計數(shù)對總體的 參數(shù)作出的點估計和區(qū)間估計。 4)點估計:以統(tǒng)計數(shù)估計相應(yīng)的總體參 數(shù)。如由樣本平均數(shù)估計總體平均數(shù),由樣本標準誤估計總體標準誤。 5)區(qū)間估計.根據(jù)統(tǒng)計數(shù)的概率分布, 估計
14、出相應(yīng)的總體參數(shù)(8 )的范圍區(qū)間1.2顯著性檢驗的意義:對兩個樣本進行比較時,判斷樣本間差異是 抽樣誤差造成的,還是本質(zhì)不同引起的。心這正是顯著性檢驗要解決的問題。:由于總體平均數(shù)未知,在進行顯著性檢驗時 只能以樣本平均數(shù)作為檢驗對象,更確切地 說,是以兩樣本平均數(shù)的差數(shù)作為檢驗對象。,為什么以樣本平均數(shù)作為檢驗對象呢? 這是因為樣本平均數(shù)具有下述特征: 1)、離均差的平方和最小。說明樣本平均1 數(shù)與樣本各個觀測值最接近,平均數(shù)是資1 料的代表數(shù)。!心2)、樣本平均數(shù)是總體平均數(shù)的無偏估計 4caIB. o根據(jù)統(tǒng)計學中心極限定理,樣本平均 數(shù)的分布服從或逼近正態(tài)分布。1-3統(tǒng)計假設(shè)檢驗的數(shù)學
15、模型:對于兩個不同處理的樣本,其平均值表示為:兀1 = “1 + 6兀2 = “2 + 2迢 X兀2 (“ 勺2)+(6 2)和 分:一部分是兩個總體平均數(shù)的差(),稱試驗的(treatment effect) 昂l部分是()o巧&22、顯著性檢驗的基本步驟(1) 首先對試驗樣本所在的總體作假設(shè)I、無效假設(shè)(HA 假設(shè)總體平均數(shù)與某一指定 值相等或假設(shè)兩個總體參數(shù)相等,這種假設(shè) 稱為無效假設(shè),表示處理效應(yīng)無效,是由誤差 造成的。HQ : fl =卩2II、備擇假設(shè)(Ha):備擇假設(shè)是在無效假設(shè)被 否定時準備接受的假設(shè),與無效假設(shè)一起構(gòu) 成完全事件。Ha : “工“21) 提出無效假設(shè)與
16、備擇假設(shè):“ = 50Q/a :“h5002) 計算地 經(jīng)計算得:元=5027, S = 8.6416心匕= 5027-5譽 “988S 8.64167106 = n-l = 10-l=9由莎9,查婕利附表3) />0. 05,故,> (2)確定顯著水平a ,般為005或0. 01的小 概率。心(3)在無效假設(shè)成立的前提下,根據(jù)統(tǒng)計數(shù)的 抽樣分布規(guī)律,計算無效假設(shè)正確的概率。J (4)根據(jù)“小概率事件不可能性原理”否定或 接受無效假設(shè)O、若Pvz,或t >1,則在a水平上否定Ho,接受Ha; 、若PM,或Irl丸,則在"水平上接受Ho,表明是因 誤差而產(chǎn)生的。>
17、;L'irrr某礦泉水企業(yè)的自動裝罐機,在正常工作狀態(tài)時, 每罐凈容S具正態(tài)分布N (500, 64)(單位:mDo某日隨機 抽查了 10瓶,得結(jié)果如下:505,512,497,493,50& 515, 502, 495, 490. 510,問瓶裝機工作是否正常? 解:根據(jù)題意,本例應(yīng)進行雙尾十檢驗。)3)查臨界地,作出統(tǒng)計推斷 得0.05=2.262,因為I十|<七0 05, 即裝罐機工作正常。、兩尾檢驗與單尾檢驗(1)兩尾檢驗:無效假設(shè)HQ :從=d:備擇假設(shè)H幷:“ H “2V備擇假設(shè)中包括了“2或“ “2兩種可能。 心這個假設(shè)的目的在于判斷兩均值有無差異, 而不考
18、慮誰大誰小。«在生產(chǎn)實踐中,雙尾檢驗不一定符合實際情況, 常用一尾檢驗。V如采用某種新的技術(shù)來提高某化工產(chǎn)品的質(zhì)量, 此種技術(shù)的實施不會降低質(zhì)量。)尾檢驗即統(tǒng)計假設(shè)僅有一個否定區(qū)域的檢驗叫一尾 檢驗。此時查一尾檢驗的臨界tfiS。心無效假設(shè)應(yīng)為:Ho :“心備擇假設(shè)應(yīng)為:Ha:從4 即新配套技術(shù)的實 施使質(zhì)量有所提高。這時的否定域在椅布曲線 的右尾。反之,若無效假設(shè)丹0 : “I “7備擇假設(shè)/人:“1 " 此時的否定域在朽 布曲經(jīng)的左尾。顯然,單尾檢驗的/二雙尾檢驗的tgHa: M >M 0Ha: M <P o尾檢驗*4*識;尾檢驗還是雙尾檢驗,應(yīng)根據(jù)專業(yè)知 識及要求在試驗設(shè)計時確定。一般若事先不知道所比較的兩個處理效果 誰好誰壞,分析的目的在于推斷兩個處理 效果有無差別,則選
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025至2031年中國拖拉機放線車行業(yè)投資前景及策略咨詢研究報告
- 2025年度防水工程承包合同
- 2025至2031年中國四方葉片鎖行業(yè)投資前景及策略咨詢研究報告
- 2025至2031年中國助駁接爪行業(yè)投資前景及策略咨詢研究報告
- 2025年安徽省高考數(shù)學對標命題2(教師版)
- 2025年公有土地租賃合同樣本
- 2025至2030年中國離心力卸料離心機數(shù)據(jù)監(jiān)測研究報告
- 門診部健康教育課件
- 2025至2030年中國接線端子自動裝配機數(shù)據(jù)監(jiān)測研究報告
- 風險預(yù)控管理體系
- 貫徹落實清理規(guī)范非融資性擔保方案指導(dǎo)意見
- 期中模擬卷(新疆專用)-2024-2025學年八年級英語下學期核心素養(yǎng)素質(zhì)調(diào)研模擬練習試題(考試版)A4
- 2025年簽訂好的勞動合同模板
- 物理試題2025年東北三省四城市聯(lián)考暨沈陽市高三質(zhì)量監(jiān)測(二)及答案
- 2025廣東省深圳市中考數(shù)學復(fù)習分類匯編《函數(shù)綜合題》含答案解析
- 七年級地理下冊第七單元測試題(人教版)
- 【9道一?!?025年安徽省合肥市蜀山區(qū)九年級中考一模道法試卷(含答案)
- 金融工程重點總結(jié)
- 控煙知識培訓(xùn)課件
- 設(shè)備的技改和更新管理制度
- GB/T 5453-2025紡織品織物透氣性的測定
評論
0/150
提交評論