石大教育科學研究方法課件06教育的量化研究-1假設(shè)檢驗_第1頁
石大教育科學研究方法課件06教育的量化研究-1假設(shè)檢驗_第2頁
石大教育科學研究方法課件06教育的量化研究-1假設(shè)檢驗_第3頁
石大教育科學研究方法課件06教育的量化研究-1假設(shè)檢驗_第4頁
石大教育科學研究方法課件06教育的量化研究-1假設(shè)檢驗_第5頁
已閱讀5頁,還剩69頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

假設(shè)檢驗第一部分抽樣分布1、總體分布:總體內(nèi)個體數(shù)值的頻數(shù)分布。例如:我們想研究去年全市中考語文的考試情況,把去年全市參加中考的所有考生的語文分數(shù)拿來制作一個頻數(shù)分數(shù),這個分布就是總體分布。一、抽樣分布的概念X頻數(shù)2、樣本分布:樣本內(nèi)個體數(shù)值的頻數(shù)分布。例如,從去年全市參加中考的考生中隨機抽出一個100人構(gòu)成一個樣本,這個樣本的語文分數(shù)的頻數(shù)分布就是樣本分布。X頻數(shù)3、抽樣分布:某一種統(tǒng)計量的概率分布。例如,為了考察平均數(shù)的概率分布,我們每次都抽取容量為100的樣本,計算一個平均數(shù),把樣本放回去后再抽取一個容量為100的樣本,計算一個平均數(shù)。假定我們就這樣反復地進行抽樣和計算,那么我們就獲得了許多有關(guān)樣本平均數(shù)的數(shù)據(jù)。由容量為100的一切可能樣本的平均數(shù)所形成的概率分布,就是平均數(shù)的抽樣分布。概率此外,還可以是標準差、方差、比率、相關(guān)系數(shù)等的概率分布。二、平均數(shù)抽樣分布的幾個定理1、從總體中隨機抽出容量為n的一切可能樣本的平均數(shù)之平均數(shù)等于總體的平均數(shù)。比如每次都抽200人,計算一個平均數(shù),然后把這個樣本放回去。再作第2次抽樣,再計算一個平均數(shù)。則平均數(shù)的平均數(shù)隨著抽樣次數(shù)的增加而逐漸靠近總體平均數(shù),所以2、容量為n的平均數(shù)在抽樣分布上的標準差,等于總體標準差除以n的方根。3.從正態(tài)總體中,隨機抽取的容量為n的一切可能樣本平均數(shù)的分布也呈正態(tài)分布。例如:以去年語文中考成績作為一個總體,假定這個總體的分布是正態(tài)的,那么從這個總體中抽取容量為n的一切可能樣本的平均數(shù)的分布也是正態(tài)的,樣本容量可以任意定。4.雖然總體不呈正態(tài)分布,如果樣本容量較大,反映總體μ和σ的樣本平均數(shù)的抽樣分布,也接近于正態(tài)分布。即當樣本足夠大時,我們可以不考慮總體是正態(tài)的還是非正態(tài)的,我們可以直接把樣本作為正態(tài)分布來推斷。第二部分假設(shè)檢驗的基本原理利用樣本信息,根據(jù)一定概率,對總體參數(shù)或分布的某一假設(shè)作出拒絕或保留的決斷,稱為假設(shè)檢驗。下面,以總體平均數(shù)的假設(shè)檢驗為例,簡要說明假設(shè)檢驗的基本原理。當對某一個總體平均數(shù)(μ)進行假設(shè)檢驗時,首先從這個總體中隨機抽取一個樣本,計算出樣本平均數(shù)的值。然后,假定樣本所屬總體的平均數(shù)(μ)等于某個假設(shè)的總體平均數(shù)(μ0),那么,這個樣本就來自這個假設(shè)總體,樣本統(tǒng)計量的值是這個假設(shè)總體平均數(shù)值的一個隨機樣本值,樣本平均數(shù)與總體平均數(shù)之間的差異是由抽樣誤差造成的。保留區(qū)間0.95μ0μ=μ0從假設(shè)總體中抽取的一切可能樣本統(tǒng)計量的值應當以假設(shè)的總體平均數(shù)為中心形成一個正態(tài)分布。這個分布可以分成兩個區(qū)域。如果這個樣本統(tǒng)計量的值落在了這個抽樣分布中出現(xiàn)概率比較大的區(qū)域里,這時只好保留零假設(shè),即研究者不得不承認這個樣本來自這個假設(shè)的總體,或者這個樣本所屬總體與假設(shè)總體沒有真正的差異。如果這個樣本統(tǒng)計量的值落在了抽樣分布中出現(xiàn)概率極小的區(qū)域里,根據(jù)小概率事件在一次隨機抽樣中幾乎不可能發(fā)生的原理,研究者不得不推翻這個樣本所屬總體等于假定的總體,或這個樣本來自這個假定總體的假設(shè),同時不得不承認樣本統(tǒng)計量與假設(shè)總體的平均數(shù)所存在的差異并非抽樣誤差造成的,而是存在著本質(zhì)的差異,在統(tǒng)計學中又叫做顯著性差異。一、假設(shè)1.假設(shè) 在研究之前不知其結(jié)果,可根據(jù)已有經(jīng)驗或理論對預期的結(jié)果做出假定性的說明,即假設(shè)。假設(shè)檢驗一般要提出兩個相互對立的假設(shè):一個叫零假設(shè),另一個叫備擇假設(shè)。2.零假設(shè)所謂零假設(shè),就是關(guān)于樣本所屬總體(指參數(shù)值)與假設(shè)總體(指參數(shù)值)之間無差異的假設(shè)也叫做原假設(shè)、虛無假設(shè)、解消假設(shè)。零假設(shè)是假設(shè)檢驗中希望拒絕的假設(shè)。3.備擇假設(shè)所謂備擇假設(shè)就是和零假設(shè)相反的假設(shè)。指的是關(guān)于當前樣本所屬的總體(指參數(shù)值)與假設(shè)總體(指參數(shù)值)有差異的假設(shè),是研究者根據(jù)樣本信息期待證實的假設(shè),是否定了零假設(shè)后應當采取的假設(shè),也叫做研究假設(shè)、對立假設(shè)。記為:假設(shè)檢驗總是從零假設(shè)開始的,然后,看有多大的把握拒絕零假設(shè)。如果拒絕零假設(shè)的把握非常大,則應該拒絕零假設(shè),接受備擇假設(shè),認為樣本所屬總體的參數(shù)與假設(shè)總體參數(shù)有顯著性差異,即本質(zhì)差異;如果拒絕零假設(shè)的把握不大,或者說,若拒絕零假設(shè)犯錯誤的概率太大,則只好保留零假設(shè),認為樣本所屬總體的參數(shù)與假設(shè)總體參數(shù)沒有顯著性差異,即本質(zhì)差異。假設(shè)檢驗的兩大特點:(1)根據(jù)一定的概率來下結(jié)論;(2)采用反證法。例如:根據(jù)經(jīng)驗我們可以說北京的6月天不會下雪,假如有一年的6月份下了一場雪,則原來的結(jié)論就被推翻。這樣的推理方法就是反證法。再如:天下烏鴉一般黑。如果能夠找到另外一種顏色的烏鴉,則原來的假設(shè)就被推翻。二、小概率事件樣本統(tǒng)計量的值(隨機事件)在其抽樣分布上出現(xiàn)的概率小于或等于事先規(guī)定的水平,這時,就認為小概率事件發(fā)生了。把出現(xiàn)小概率的隨機事件稱為小概率事件。例如,假設(shè)某個樣本所來自的總體等于假設(shè)的總體。于是,可以分析如果零假設(shè)是真實的,那么樣本統(tǒng)計量的分布如何。并且,可以按照事先規(guī)定的水平把抽樣分布分成兩個區(qū)域,一個屬于零假設(shè)的保留區(qū)域(出現(xiàn)的概率比較大),另一個為零假設(shè)的拒絕區(qū)域,出現(xiàn)的概率比較?。湓谶@個區(qū)域的事件都屬于小概率事件)。然后,實際分析所獲得的這個樣本統(tǒng)計量值,看它落入哪個區(qū)域。如果出現(xiàn)的概率足夠小,屬于小概率事件,就根據(jù)小概率事件在一次抽樣中幾乎不可能發(fā)生原理,從實際可能性上,推翻零假設(shè)。由此可見,小概率事件發(fā)沒發(fā)生,是拒絕或保留零假設(shè)的依據(jù)。三、顯著性水平統(tǒng)計學中把這種拒絕零假設(shè)的概率稱為顯著性水平,表示為:也可以說,顯著性水平是統(tǒng)計推斷時,可能犯錯誤的概率。值和可靠度之間的關(guān)系是:兩者之和為1。值越大,可靠度就越低;值越小,可靠度就越高。檢驗的形式:雙側(cè)檢驗只強調(diào)差異不強調(diào)方向的檢驗為雙側(cè)檢驗。所提出的假設(shè)檢驗的問題是否一樣、相同、有差異等等。單側(cè)檢驗既檢驗差異又考慮差異的方向的檢驗為單側(cè)檢驗。具體來說,又分為左側(cè)檢驗和右側(cè)檢驗。左側(cè)檢驗所提出的假設(shè)檢驗的問題是否低于、差于總體平均數(shù)等等。右側(cè)檢驗所提出的假設(shè)檢驗的問題是否高于、優(yōu)于、超過總體平均數(shù)等等。第三部分總體平均數(shù)的顯著性檢驗顯著性檢驗的一般步驟:(1)提出假設(shè)(2)選擇檢驗統(tǒng)計量并計算其值(3)確定檢驗形式(4)統(tǒng)計決斷一、σ已知條件下總體平均數(shù)的顯著性檢驗解:(1)提出假設(shè)(2)選擇檢驗的統(tǒng)計量并計算其值總體為正態(tài)分布,總體標準差已知時,式中為樣本平均數(shù),為原總體平均數(shù),為原總體標準差,n為樣本容量。(3)確定檢驗形式按研究需要來確定,采取單側(cè)檢驗,還是雙側(cè)檢驗。(4)統(tǒng)計決斷根據(jù)顯著性水平查相應的理論概率分布表,尋找相應的臨界值。在這個例子中,把顯著性水平定為0.05和0.01。如果進行單側(cè)檢驗,則把零假設(shè)的拒絕區(qū)域放到一側(cè),如果做雙側(cè)檢驗,則把零假設(shè)的拒絕區(qū)域放到兩側(cè)。因為這里做的雙側(cè)檢驗,所以,如果把顯著性水平定為0.05,則正態(tài)分布兩尾上的面積各為0.025,由正態(tài)分布表查得所對應的臨界值為1.96;如果把顯著性水平定為0.01,則正態(tài)分布兩尾上的面積各為0.005,由正態(tài)分布表查得所對應的臨界值為2.58。將實際計算得的Z值與從表上查得的臨界值相比較,如果小于0.05顯著性水平上的臨界值,就表明樣本檢驗統(tǒng)計量的值處于零假設(shè)的保留區(qū)域里,只好保留零假設(shè),拒絕備擇假設(shè)。這時,要在實際計算得的Z值旁邊標明P>0.05(在這里,P指等于或大于樣本統(tǒng)計量值的概率大于0.05)。結(jié)論:樣本所屬總體平均數(shù)與假設(shè)的總體平均數(shù)無顯著性差異。如果實際計算出來的Z值大于或等于0.05顯著性水平上的臨界值而小于0.01顯著性水平上的臨界值,就表明樣本統(tǒng)計量的值在0.05的顯著性水平上落入了零假設(shè)的拒絕區(qū)域里了,那么,就要在0.05的顯著性水平上拒絕零假設(shè),接受備擇假設(shè),這時,要在實際計算得的Z值的右上角畫一個星號,并在旁邊標明P0.05(表明小于或等于樣本統(tǒng)計量值的概率小于或等于0.05)。結(jié)論:有95%的把握說,樣本所屬總體平均數(shù)與假設(shè)的總體平均數(shù)有顯著性差異。如果實際計算出來的Z值大于或等于0.01顯著性水平上的臨界值,就表明樣本統(tǒng)計量的值在0.01的顯著性水平上落入了零假設(shè)的拒絕區(qū)域里了,那么,就要在0.01的顯著性水平上拒絕零假設(shè),接受備擇假設(shè)。這時,就在實際計算得的Z值的右上角畫兩個星號,并在旁邊標明P0.01(表明小于或等于樣本統(tǒng)計量值的概率小于或等于0.01),最后下結(jié)論:有99%的把握說,樣本所屬總體平均數(shù)與假設(shè)的總體平均數(shù)有極其顯著性差異。雙側(cè)Z檢驗統(tǒng)計決斷規(guī)則︱Z︱與臨界值的比較檢驗結(jié)果顯著性︱Z︱<1.96=Z0.051.96≤︱Z︱<2.58=Z0.01︱Z︱≥2.58=Z0.01保留H00.05顯著性水平上拒絕H00.01顯著性水平上拒絕H0不顯著顯著極其顯著二、σ未知條件下總體平均數(shù)的假設(shè)檢驗通常要做t檢驗;同時還要看樣本的大小,小樣本一定要做t檢驗,大樣本通常還可以轉(zhuǎn)換成Z檢驗作近似處理。小樣本,總體標準差σ未知時或者t分布與正態(tài)分布的相似之處t分布基線上的t值從從平均數(shù)等于0處,左側(cè)t值為正;曲線以平均數(shù)處為最高向兩側(cè)逐漸下降,尾部無限延伸,永不與基線相接,呈單峰對稱形。t分布與正態(tài)分布的區(qū)別之處t分布的形態(tài)隨自由度(df=n-1)變化呈一簇分布形態(tài)(即自由度不同的t分布形態(tài)也不同)。t分布的峰狹窄尖峭,尾長而翹得高,在基線上分布的范圍廣。自由度越小,分布范圍越廣。當自由度逐步增大時,t分布逐步接近正態(tài)分布,當自由度趨于無限大時,t分布與正態(tài)分布重合。自由度自由度是指總體參數(shù)估計量中變量值獨立自由變化的個數(shù)。用df表示。自由度的個數(shù)等于樣本容量n減去限制因子的個數(shù)。大樣本通常還可以轉(zhuǎn)換成Z檢驗作近似處理。例:假定某小學三年級(1)班與該年級其他各班情況基本相同。該班數(shù)學老師為了提高學生的口算能力,特制作了一套口算卡片,要求學生每天回家后練兩頁,家長檢查并簽字。學期結(jié)束時全年級進行了口算驗收測驗,全年級平均分為32.6,而該班51名學生的平均分為34,標準差為3.7,問該教師用這種方法訓練學生的口算能力是否見效?解:1、提出假設(shè)2、計算檢驗的統(tǒng)計量3、確定檢驗形式右側(cè)檢驗4、統(tǒng)計決斷因為當df=50時,t=2.68**>2.403,P<0.01所以,要在0.01的顯著性水平上拒絕零假設(shè),接受備擇假設(shè)。教師用這種方法訓練學生的口算能力是極為有效。Z檢驗解:1、提出假設(shè)2、計算檢驗的統(tǒng)計量3、確定檢驗形式右側(cè)檢驗4、統(tǒng)計決斷Z=2.68**>2.33=Z0.01,P<0.01 所以,要在0.01的顯著性水平上拒絕零假設(shè),接受備擇假設(shè)。教師用這種方法訓練學生的口算能力是極為有效。第四部分 平均數(shù)差異顯著性檢驗的基本原理一、基本原理兩個樣本平均數(shù)差異的顯著性檢驗與一個樣本平均數(shù)顯著性檢驗道理相同。步驟假設(shè)檢驗一般都要從提出零假設(shè)和備擇假設(shè)開始。然后,分析在零假設(shè)成立的情況下某個統(tǒng)計量的概率分布的形態(tài)。實驗從這樣的兩個總體中分別抽取一個樣本,計算完兩個樣本平均數(shù)的差之后,把樣本放回各自的總體,再分別抽取一個樣本,計算第二次抽樣的樣本平均數(shù)之差,然后放回各自的總體,再做第三次抽樣。這種抽樣可以一直進行下去。(第一次抽樣)(第二次抽樣)(第三次抽樣)數(shù)理統(tǒng)計學的研究表明,假若那么兩個樣本平均數(shù)之差的概率分布就以0為中心的正態(tài)分布:概率保留區(qū)間0.950臨界值臨界值要實際地判斷樣本平均數(shù)的差異是否落入了零假設(shè)的拒絕區(qū)域里,需要以該抽樣分布的標準差,即平均數(shù)之差的標準誤為依據(jù)。對兩個總體平均數(shù)差異的顯著性檢驗涉及到兩個總體,要考慮到如下五個因素:樣本是相關(guān)的還是獨立的;總體是正態(tài)分布還是非正態(tài)分布;總體方差是已知還是未知;總體方差是否齊性;樣本的大小。二、相關(guān)樣本平均數(shù)差異的顯著性檢驗定義:兩個樣本內(nèi)個體之間存在著一一對應的關(guān)系,這兩個樣本稱為相關(guān)樣本。相關(guān)樣本有以下兩種情況:(1)用同一測驗對同一組被試在試驗前后進行兩次測驗,所獲得的兩組測驗結(jié)果是相關(guān)樣本。 (2)根據(jù)某些條件基本相同的原則,把被試一一匹配成對,然后將每對被試隨機地分入實驗組和對照組,對兩組被試施行不同的實驗處理之后,用同一測驗所獲得的測驗結(jié)果,也是相關(guān)樣本。相關(guān)樣本平均數(shù)差異的顯著性檢驗方法和步驟:(一)提出假設(shè)(二)選擇檢驗統(tǒng)計量并計算其值在小樣本的情況,在大樣本的情況(三)確定檢驗形式包括雙側(cè)檢驗、左側(cè)檢驗和右側(cè)檢驗(四)統(tǒng)計決斷當進行t檢驗時,df=n-1。一、配對組的情況例如:有人做了一項分散識字教學法與集中識字教學法的比較實驗。根據(jù)研究的需要,實驗之前先將被試配成對。為了控制無關(guān)因素的干擾,配對時研究者考慮了被試以下幾方面的情況:智力水平、努力程度、識字量多少及家庭輔導力量等,然后按照各方面條件基本相同的原則,將學生配成了10對,再把每對學生中的一個隨機地指派到實驗組,另一個指派到對照組。兩組學生分別接受用不同的教學法進行的教學。經(jīng)過一段時間的學習之后,兩組學生接受統(tǒng)一的測試,結(jié)果如表7.1所示?,F(xiàn)在問,兩種識字教學法是否有顯著性差異?表7.1對學生在兩種識字教學法中的測驗分數(shù)和差數(shù)組別實驗組對照組差數(shù)值

12345678910937291658177898473707674805263628285647217-2111313157-19-22894121169324225401814總和795710851267解:1.提出假設(shè)2.計算檢驗的統(tǒng)計量3.確定檢驗形式雙側(cè)檢驗4.統(tǒng)計決斷因為是t檢驗,所以要根據(jù)自由度df=n-1=10-1=9查t值表(即附表2),找雙側(cè)檢驗的臨界值。p<0.01,所以,在0.01的顯著性水平上拒絕零假設(shè),接受備擇假設(shè)。即可得出小學分散識字教學法與集中識字教學法有極其顯著的差異的結(jié)論。第五部分 方差齊性檢驗定義:對兩個總體的方差是否有顯著性差異所進行的檢驗稱為方差齊性(相等)檢驗。一、F分布從方差相同的兩個正態(tài)總體中,各隨機抽取一個樣本,分別求出各自所屬總體方差的估計值,并計算這兩個總體方差估計值的比值,這個比值叫做F比值,用公式表示為:F分布的特點是:1.F分布是一簇分布,隨分子和分母的自由度不同而有不同的分布曲線。2.F分布是正偏態(tài)的,即一簇正偏態(tài)的曲線(不過,隨著分子和分母自由度的增大而逐漸趨于正態(tài))。3.F比值都是正的。4.由于計算F比值時總把大的方差估計值作為分子,小的作為分母,所以F比值≥1。F檢驗的基本步驟:第一步:提出假設(shè)第二步:選擇檢驗統(tǒng)計量并計算其值第三步:一般情況下,經(jīng)常應用的是右側(cè)F檢驗。第四步:統(tǒng)計決斷查附表——F值表兩個獨立樣本的方差齊性檢驗例:某市初中畢業(yè)班進行了一次數(shù)學考試,為了比較該市畢業(yè)班男女生成績的離散程度,從男生中抽出一個樣本,容量為31,從女考生中也抽出一個樣本,容量為21。男女生成績的方差分別為49和36,請問男女生成績的離散程度是否一致?解:1.提出假設(shè)2.選擇檢驗統(tǒng)計量并計算其值3.統(tǒng)計決斷查附表,得F(30,20)0.05=2.04F=1.34<F(30,20)0.05=2.04,p>0.05,即男女生成績的差異沒有達到顯著性差異。第六部分及其分布一、卡方檢驗的特點卡方檢驗是對樣本的頻數(shù)分布所來自的總體分布是否服從某種理論分布或某種假設(shè)分布所作的假設(shè)檢驗。即根據(jù)樣本的頻數(shù)分布來推斷總體的分布。它屬于自由分布的非參數(shù)檢驗。它可以處理一個因素分為多種類別,或多種因素各有多種類別的資料。χ2值有以下幾個特點:(1)χ2值具有可加性。(2)χ2值永遠是正值。 (3)χ2值的大小隨實際頻數(shù)與理論頻數(shù)差的大小而變化。三、χ2的抽樣分布χ2分布有以下幾個特點:(1)χ2分布呈正偏態(tài),右側(cè)無限延伸,但永不與基線相交。(2)χ

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論