配合度檢驗(yàn)獨(dú)立性檢驗(yàn)與同質(zhì)性檢驗(yàn)_第1頁
配合度檢驗(yàn)獨(dú)立性檢驗(yàn)與同質(zhì)性檢驗(yàn)_第2頁
配合度檢驗(yàn)獨(dú)立性檢驗(yàn)與同質(zhì)性檢驗(yàn)_第3頁
配合度檢驗(yàn)獨(dú)立性檢驗(yàn)與同質(zhì)性檢驗(yàn)_第4頁
配合度檢驗(yàn)獨(dú)立性檢驗(yàn)與同質(zhì)性檢驗(yàn)_第5頁
已閱讀5頁,還剩56頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

本資料來源第十章χ2檢驗(yàn)χ2檢驗(yàn)(chi-squaretest)是專門用于計(jì)數(shù)數(shù)據(jù)的統(tǒng)計(jì)方法。由于這類數(shù)據(jù)在整理時,常常以列聯(lián)表(contingencytable)或交叉表(crosstabulation)呈現(xiàn),因此這種分析方法又被稱為列聯(lián)表分析或交叉表分析。χ2檢驗(yàn)用于對點(diǎn)計(jì)而來的離散型數(shù)據(jù)資料進(jìn)行假設(shè)檢驗(yàn),對總體的分布不做要求,也不對總體參數(shù)進(jìn)行推論,因此屬于自由分布的非參數(shù)檢驗(yàn)。χ2檢驗(yàn)是對由樣本得來的實(shí)際頻數(shù)與理論頻數(shù)的分布是否有顯著性差異所進(jìn)行的檢驗(yàn)。其計(jì)算公式為:(15.1)三大類別配合度檢驗(yàn)獨(dú)立性檢驗(yàn)同質(zhì)性檢驗(yàn)配合度檢驗(yàn)把實(shí)得的點(diǎn)計(jì)數(shù)據(jù)只按一種分類標(biāo)準(zhǔn)編制成表就是單向表。對單向表的數(shù)據(jù)所進(jìn)行的χ2檢驗(yàn),稱為單向表的χ2檢驗(yàn),也稱為配合度檢驗(yàn)(goodnessoffittest)。獨(dú)立性檢驗(yàn)獨(dú)立性檢驗(yàn)主要用以兩個或兩個以上因素多項(xiàng)分類的計(jì)數(shù)資料分析,也就是研究兩類變量的關(guān)聯(lián)性和依存性問題。如人的血型和人的性格是否有關(guān)聯(lián)。把兩個因素實(shí)得的點(diǎn)計(jì)數(shù)據(jù)按兩種分類標(biāo)準(zhǔn)編制成的表就是雙向表。對雙向表的數(shù)據(jù)所進(jìn)行的χ2檢驗(yàn),叫作雙向表的χ2檢驗(yàn),即雙因素的χ2檢驗(yàn)。兩個以上因素形成的表稱為多維列聯(lián)表。重點(diǎn)是兩因素的獨(dú)立性檢驗(yàn)。假如雙向表中橫行所分的組數(shù)用R表示,縱列所分的組數(shù)用C表示,那么,雙向表的χ2檢驗(yàn)也稱為R×C表的χ2檢驗(yàn)。在雙向表的χ2檢驗(yàn)中,如果要判斷兩種分類特征,即兩個因素之間是否有依從關(guān)系,這種χ2檢驗(yàn)稱為獨(dú)立性檢驗(yàn)。如果是判斷幾次重復(fù)實(shí)驗(yàn)的結(jié)果是否相同,這種χ2檢驗(yàn)稱為同質(zhì)性檢驗(yàn)。(一)雙向表χ2檢驗(yàn)的計(jì)算1.理論頻數(shù)的計(jì)算雙向表χ2檢驗(yàn)中,理論頻數(shù)的計(jì)算公式為(16.1)

公式中,fxi表示橫行各組實(shí)際頻數(shù)的總和

fyi表示縱列各組實(shí)際頻數(shù)的總和

N表示樣本容量的總和例1:家庭經(jīng)濟(jì)狀狀況屬于上上、中、下下的高三畢畢業(yè)生,對對于是否愿愿意報(bào)考師師范大學(xué)有有三種不同同的態(tài)度((愿意、不不愿意、未未定),其其人數(shù)分布布如表10-6。問學(xué)生是是否愿意報(bào)報(bào)考師范大大學(xué)與家庭庭經(jīng)濟(jì)狀況況是否有關(guān)關(guān)系?表10-6不同家庭經(jīng)經(jīng)濟(jì)狀況學(xué)學(xué)生報(bào)考師師范大學(xué)的的不同態(tài)度度家庭經(jīng)濟(jì)狀況對于報(bào)考師范大學(xué)的態(tài)度總和愿意不愿意未定上中下18201827197102011555936總和565341150解題過程解:1.提出假設(shè)H0:學(xué)生是否否愿意報(bào)考考師范大學(xué)學(xué)與家庭經(jīng)經(jīng)濟(jì)狀況無無關(guān)H1:學(xué)生是否否愿意報(bào)考考師范大學(xué)學(xué)與家庭經(jīng)經(jīng)濟(jì)狀況有有關(guān)2.選擇檢驗(yàn)統(tǒng)統(tǒng)計(jì)量并計(jì)計(jì)算對計(jì)數(shù)數(shù)據(jù)據(jù)進(jìn)行差異異檢驗(yàn),可選擇χ2檢驗(yàn)理論頻數(shù)計(jì)計(jì)算計(jì)算理論頻頻數(shù)允許有有小數(shù),因因?yàn)棣?分布已被作作為連續(xù)型型的分布看看待。表10-7不同家庭經(jīng)經(jīng)濟(jì)狀況學(xué)學(xué)生報(bào)考師師范大學(xué)的的不同態(tài)度度家庭經(jīng)濟(jì)狀況對于報(bào)考師范大學(xué)的態(tài)度總和愿意不愿意未定上中下1820182719710201155=fx159=fx236=fx3總和56=fy153=fy241=fy3150=N20.5312.7222.0313.4419.4320.8515.0316.139.84計(jì)算表10-8學(xué)生報(bào)考師師范大學(xué)的的態(tài)度與家家庭經(jīng)濟(jì)狀狀況的χ2檢驗(yàn)計(jì)算表表愿意-上1820.53-2.536.40090.3118愿意-中2022.03-2.034.12090.1871愿意-下1813.444.5620.79361.5471不愿意-上2719.437.5757.30492.9493不愿意-中1920.85-1.853.42250.1641不愿意-下712.72-5.7232.71842.5722未定-上1015.03-5.0325.30091.6834未定-中2016.133.8714.97690.9285未定-下119.841.161.34560.1367總和15015010.48023.統(tǒng)計(jì)決斷雙向表的自自由度:df=(R-1)(C-1)查χ2值表,當(dāng)df=(3-1)(3-1)=4時計(jì)算結(jié)果為為:χ2=10.48*9.49<χ2=10.48<13.3,則0.05>P>0.01結(jié)論:學(xué)生生是否愿意意報(bào)考師范范大學(xué)與家家庭經(jīng)濟(jì)狀狀況有顯著著關(guān)系。雙向表的χ2值除用理論論頻數(shù)方法法計(jì)算外,,還可以用用下式由實(shí)實(shí)際頻數(shù)直直接求得::公式中,foi表示雙向表表中每格的的實(shí)際頻數(shù)數(shù)(16.2)將例1數(shù)據(jù)用公式式(10.8)計(jì)算=10.48家庭經(jīng)濟(jì)狀況對于報(bào)考師范大學(xué)的態(tài)度總和愿意不愿意未定上中下18201827197102011555936總和565341150表10-8不同家庭經(jīng)經(jīng)濟(jì)狀況學(xué)學(xué)生報(bào)考師師范大學(xué)的的不同態(tài)度度雙向表的獨(dú)立性χ2檢驗(yàn)和同質(zhì)性χ2檢驗(yàn),只是是檢驗(yàn)的意義不同,而方法完全相相同。對于同一組組數(shù)據(jù)所進(jìn)進(jìn)行的χ2檢驗(yàn),有時時既可以理理解為獨(dú)立立性χ2檢驗(yàn),又可可以理解為為同質(zhì)性檢檢驗(yàn),兩者者無根本區(qū)區(qū)別。第十四章抽樣原理及及方法統(tǒng)計(jì)推斷的的可靠性與與下列因素素有關(guān)1.?dāng)?shù)據(jù)的質(zhì)量量樣本對總體體的代表性性,既涉及及到抽樣方法,又涉及到樣本的容量量。2.運(yùn)用統(tǒng)計(jì)方法及數(shù)據(jù)處理理的準(zhǔn)確性性3.樣本對總體體的代表性在收集數(shù)據(jù)據(jù)的過程中控制制選擇恰當(dāng)?shù)牡姆椒ㄍㄟ^抽樣設(shè)計(jì)控制抽樣設(shè)計(jì)的的原則抽樣設(shè)計(jì)的的要求是樣樣本對研究究總體有良良好的代表性,即即樣樣本本的的構(gòu)構(gòu)成成與與總總體體保保持持一一致致。。為為了了保保證證這這一一點(diǎn)點(diǎn),,抽抽樣樣時時必必須須遵遵循循隨機(jī)機(jī)化化(randomization)的的基基本本原原則則。。所謂謂隨隨機(jī)機(jī)化化原原則則,,是是指指在在抽抽樣樣時時,,樣樣本本中中的的每每一一個個體體都都是是按按照照隨隨機(jī)機(jī)的的原原理理被被抽抽取取的的,,總總體體中中每每一一個個體體被被抽抽到到的的可可能能性性是是相相等等的的。。一..幾幾種種重重要要的的隨隨機(jī)機(jī)抽抽樣樣方方法法1.簡單單隨隨機(jī)機(jī)抽抽樣樣(simplerandomsampling)簡單單隨隨機(jī)機(jī)抽抽樣樣就就是是按按照照隨隨機(jī)機(jī)原原則則直直接接從從總總體體中中抽抽取取出出若若干干個個單單位位作作為為樣樣本本。。簡單單隨隨機(jī)機(jī)抽抽樣樣法法能能保保證證總總體體中中的的每每一一個個對對象象都都有有同同等等的的被被抽抽取取到到的的可可能能性性,,并并且且個個體體之之間間都都相相互互獨(dú)獨(dú)立立。。這這是是在在總總體體異異質(zhì)質(zhì)性性不不是是很很大大而而且且所所抽抽取取的的樣樣本本較較小小時時經(jīng)經(jīng)常常采采用用的的一一種種形形式式。。簡單單隨隨機(jī)機(jī)抽抽樣樣法法的的局局限限是是::當(dāng)當(dāng)樣樣本本規(guī)規(guī)模模小小時時,,樣樣本本的的代代表表性性較較差差。。簡單單隨隨機(jī)機(jī)取取樣樣有有兩兩種種基基本本方方式式:抽簽簽法法(drawinglots)隨機(jī)機(jī)數(shù)數(shù)字字表表法法(randomnumbertable)2.等等距距抽抽樣樣等距距抽抽樣樣(intervalsampling)也稱稱為為機(jī)機(jī)械械抽抽樣樣或或系系統(tǒng)統(tǒng)抽抽樣樣。。實(shí)實(shí)施施時時,,先先把把總總體體中中的的所所有有個個體體按按一一定定順順序序編編號號,,然然后后依依固固定定的的間間隔隔取取樣樣。。等距距抽抽樣樣可可以以保保證證樣樣本本的的成成分分與與總總體體一一致致,,但但隨隨機(jī)機(jī)性性不不如如單單純純隨隨機(jī)機(jī)抽抽樣樣法法。。應(yīng)應(yīng)用用中中可可將將兩兩種種方方法法結(jié)結(jié)合合使使用用。。3.分層隨隨機(jī)抽樣樣分層隨機(jī)機(jī)取樣簡簡稱分層層抽樣((stratifiedsampling或hierarchicalsampling),是是進(jìn)行行大規(guī)規(guī)模研研究時時常常常使用用的抽抽樣方方法。。分層抽抽樣的的方法法:先將總總體按按照一一定標(biāo)標(biāo)準(zhǔn)分分為若若干類類型((統(tǒng)計(jì)計(jì)上稱稱為層層),,再根根據(jù)各各層對對象的的數(shù)量量在總總體數(shù)數(shù)量中中所占占的比比例,,確定定從每每一種種類型型(層層)中中抽取取樣本本的數(shù)數(shù)量,,然后后按隨隨機(jī)原原則和和所確確定的的各層層取樣樣的數(shù)數(shù)量,,從各各層中中取樣樣。做好分分層隨隨機(jī)取取樣的的關(guān)鍵鍵:分類的的標(biāo)準(zhǔn)準(zhǔn)要科科學(xué),,要符符合實(shí)實(shí)際情情況。。各層層內(nèi)的的差別別要小小,而而層與與層之之間的的差異異則越越大越越好。。計(jì)算各各層應(yīng)應(yīng)抽樣樣的個個體數(shù)數(shù)量的的計(jì)算算方法法:⑴.按按各層層比例例計(jì)算算公式中中,ni為第i層中被被抽取取的個個體數(shù)數(shù)量n為整個個研究究樣本本中個個體的的總數(shù)數(shù)量Ni為第i層中對對象的的數(shù)量量N為總體體內(nèi)個個體的的數(shù)量量(22.1)例1:為了調(diào)調(diào)查某某區(qū)重重點(diǎn)中中學(xué)720名高一一學(xué)生生的視視力,,首先先按視視力的的情況況將他他們分分成好(108人)、中(360人)、、差(252人)三三種水水平。。若用用分層層抽樣樣法抽抽取120人進(jìn)行行調(diào)查查,問問各層層應(yīng)抽抽多少少人??計(jì)算::⑵.最最佳配配置法法最佳配配置法法不僅僅考慮慮各層層的人人數(shù)比比例,,而且且考慮慮到了了各層層的標(biāo)標(biāo)準(zhǔn)差差。當(dāng)當(dāng)各層層內(nèi)的的標(biāo)準(zhǔn)準(zhǔn)差已已知,,應(yīng)該該在標(biāo)標(biāo)準(zhǔn)差差大的的層內(nèi)內(nèi)多分分配而而在標(biāo)標(biāo)準(zhǔn)差差小的的層內(nèi)內(nèi)少分分配抽抽樣數(shù)數(shù)量。。最佳配配置法法可以以使得得到的的樣本本具有有較好好的異質(zhì)性性。在各層層內(nèi)應(yīng)應(yīng)抽取取個體體數(shù)計(jì)計(jì)算公式中中,ni表示從從某一一層所所抽個個體數(shù)數(shù)n表示樣樣本容容量Ni表示某某層個個體總總數(shù)σi表示某某層標(biāo)標(biāo)準(zhǔn)差差(22.2)當(dāng)各個個σ沒有現(xiàn)現(xiàn)成資資料可可以應(yīng)應(yīng)用時時,可可以先先從該該層抽抽一個個小樣樣本,,由這這一小小樣本本計(jì)算算出的的樣本本標(biāo)準(zhǔn)準(zhǔn)差S對σ進(jìn)行估估計(jì)。。(22.3)分層隨隨機(jī)取取樣法法的優(yōu)點(diǎn)是代表表性和和推論論的精精確性性較好好。它它適用用于總總體單單位數(shù)數(shù)量較較多,,并且且內(nèi)部部差異異較大大的研研究對對象。。分層隨隨機(jī)取取樣法法的局限性是要要求對對總體體各單單位的的情況況有較較多的的了解解,否否則就就難以以作出出科學(xué)學(xué)的分分類。。4.兩階階段隨隨機(jī)抽抽樣當(dāng)總體體容量量很大大時,,直接接以總總體中中的所所有個個體為為對象象,從從中進(jìn)進(jìn)行抽抽樣,,在實(shí)實(shí)際調(diào)調(diào)查或或研究究中存存在很很大困困難。。采用分階段段的抽樣方方法,可以以縮小實(shí)際際抽樣的范范圍,使實(shí)實(shí)際抽樣工工作能夠按按研究設(shè)計(jì)計(jì)的要求順順利進(jìn)行。。兩階段隨機(jī)機(jī)抽樣(two-stagesrandomsampling)的一般過過程是:先先將總體分分成M個部分;第一階段從這M個部分中隨隨機(jī)抽取m個部分作為為第一階段段樣本;第二階段是分別從這這m個部分中抽抽取一定數(shù)數(shù)量(ni)的個體構(gòu)構(gòu)成第二階階段樣本。。5.整群抽樣樣整群隨機(jī)抽抽樣是先將將總體各單單位按一定定的標(biāo)準(zhǔn)分分成許多群群(小組)),然后按按隨機(jī)原則則從這些群群中抽取若若干群作為為樣本。整群隨機(jī)取取樣法的優(yōu)點(diǎn)是樣本比較較集中,適適宜于某些些特定的研研究,尤其其是在教育育實(shí)驗(yàn)中常常用此法。。此外,在在規(guī)模較大大的調(diào)查研研究中,整整群隨機(jī)取取樣易于組組織,可節(jié)節(jié)省人力、、物力和時時間。整群隨機(jī)抽抽樣法的缺點(diǎn)是樣本分布布不均勻,,代表性較較差。二.樣本本容量的確確定(自學(xué)學(xué))1.確定樣本本容量的意意義在應(yīng)用中應(yīng)應(yīng)根據(jù)研究究所要求的的精確度及及經(jīng)費(fèi)情況況確定樣本本容量。如如果樣本容容量過小,,會影響樣樣本對總體體的代表性性,增大抽抽樣誤差而而降低研究究推論的精精確性;樣樣本容量過過大,雖然然減小了抽抽樣誤差,,但可能增增大過失誤誤差,并且且增加不必必要的人力力物力資源源的浪費(fèi)。。樣本容量與與抽樣誤差差并不是直直線關(guān)系。。確定容量的的基本原則則是:在盡盡量節(jié)省人人力、經(jīng)費(fèi)費(fèi)和時間的的條件下,,確保用樣樣本推斷總總體達(dá)到預(yù)預(yù)定的可行行度及準(zhǔn)確確性。2.總體平均均數(shù)估計(jì)樣樣本容量的的確定⑴.總體σ已知其中,最大大允許誤差差為,可信度為為1-α。由有(22.4)可以看到,,當(dāng)α確定之后,,總體標(biāo)準(zhǔn)準(zhǔn)差和最大大允許誤差差d是決定樣本本容量的兩兩個因素。。⑵.總體σ未知由有當(dāng)樣本容量量n未確定時,,t值無法確定定,因此一一般采用嘗嘗試法。(22.5)嘗試法求樣樣本容量的的過程⑴.將df=∞的t值代入公式式求出n1,⑵.將n1的t值代入公式式求出n2,……⑶.直至前后兩兩次求出的的n相同為止。。也可據(jù)S/d查附表20求出樣本容容量例2:擬估計(jì)某市市高校四級級英語考試試成績的總總體平均分分?jǐn)?shù)。以往往考試成績績的標(biāo)準(zhǔn)差差為13,這次的估估計(jì)最大允允許誤差為為2分,可信度度為95%,問應(yīng)抽取取多大的樣樣本?例3:擬對某市初初中升入高高中入學(xué)考考試語文成成績的總體體平均數(shù)進(jìn)進(jìn)行估計(jì)。。根據(jù)以同同等難度的的試題對同同等教育水水平的另一一城市部分分初中升入入高中入學(xué)學(xué)考試語文文成績算出出的S=11.4。若要求估估計(jì)的最大大允許誤差差為d=3,可信度為為99%,問樣本容容量應(yīng)為多多少?計(jì)算1.由t分布表查得得自由度度df=∞時,t1=2.5762.由t分布表查得得自由度度df=96-1時,t2=2.6293.由t分布表查得得自由度度df=100-1時,t3=2.627前后兩次算算出的樣本本容量相等等,因此n=100當(dāng)估計(jì)出的的樣本容量量比較大時時,可以直直接按公式式(22.4)計(jì)算而不不必采用嘗嘗試法。2.平均數(shù)顯顯著性檢驗(yàn)驗(yàn)時

樣本本容量的確確定⑴.總體σ已知在假設(shè)檢驗(yàn)驗(yàn)中,要同同時考慮α錯誤和β錯誤,因此此將以上兩式式相加為::若令δ=μ-μ0,則單側(cè)檢驗(yàn):雙側(cè)檢驗(yàn):(22.6)(22.7)式中的α和β由研研究究者者預(yù)預(yù)先先確確定定,,α值要要比比β值小小。。一一般般α為0.05或0.01,而而β值一一般般確確定定為為0.10、0.20或0.30。對對同同一一個個α值,,單單側(cè)側(cè)和和雙雙側(cè)側(cè)時時的的Z臨界界值值是是不不一一樣樣的的。。當(dāng)樣本容量已已知,α值及其他條件件也已確定,,則β就是確定值。。這時可以利利用有關(guān)公式式計(jì)算β值,從而對檢檢驗(yàn)的統(tǒng)計(jì)力力作出評價。。可以看到,在在平均數(shù)的假假設(shè)檢驗(yàn)中,,當(dāng)確定了α和β之后,樣本的的容量n取決于總體標(biāo)標(biāo)準(zhǔn)差σ和假設(shè)的總體體差異δ。與參數(shù)估計(jì)計(jì)相比,多考考慮了一個β因子,并且δ與參數(shù)估計(jì)中中的具有不同同的涵義。例4:某市高中入

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論