下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、現(xiàn)代心理與教育統(tǒng)計學復習資料第一章1 、 數(shù)據(jù)類型稱名數(shù)據(jù)計數(shù)數(shù)據(jù)離散型數(shù)據(jù)順序數(shù)據(jù)等距數(shù)據(jù)測量數(shù)據(jù)連續(xù)型數(shù)據(jù)等比數(shù)據(jù)2 、變量 :是可以取不同值的量。統(tǒng)計觀察的指標都是具有變異的指標。當我們用一個量表示這個指標的觀察結(jié)果時,這個指標是一個變量。用來表示隨機現(xiàn)象的變量,稱為隨機變量。一般用大寫的或表示隨機變量。隨機變量所取得的值,稱為觀測值。一個隨機變量可以有許多個觀測值。、需要研究的同質(zhì)對象的全體,稱為總體。每一個具體研究對象,稱為一個個體。從總體中抽出的用以推測總體的部分對象的集合稱為樣本。樣本中包含的個體數(shù),稱為樣本的容量n 。一般把容量 n 30 的樣本稱為大樣本;而 n 30 的樣本
2、稱為小樣本。、統(tǒng)計量和參數(shù)統(tǒng)計統(tǒng)計量參數(shù)指標平均M數(shù)標準S差相關(guān)r系數(shù)回歸b系數(shù)5 、統(tǒng)計誤差誤差是測得值與真值之間的差值。測得值真值誤差統(tǒng)計誤差歸納起來可分為兩類: 測量誤差與抽樣誤差。由于使用的儀器、 測量方法、讀數(shù)方法等問題造成的測得值與真值之間的誤差,稱為測量誤差。由于隨機抽樣造成的樣本統(tǒng)計量與總體參數(shù)間的差別,稱為抽樣誤差第二章一、數(shù)據(jù)的整理在進行整理時,如果沒有充足的理由證明某數(shù)據(jù)是由實驗中的過失造成的,就不能輕易將其排除。對于個別極端數(shù)據(jù)是否該剔除,應(yīng)遵循三個標準差法則。二、 次數(shù)分布表(一)簡單次(頻)數(shù)分布表(二)相對次數(shù)分布表將次數(shù)分布表中各組的實際次數(shù)轉(zhuǎn)化為相對次f100
3、%N數(shù) ,即 用頻 數(shù) 比率 ( f N ) 或百 分比( )來表示次數(shù),就可以制成相對次數(shù)分布表(三)累加次數(shù)分布表(四)雙列次數(shù)分布表雙列次數(shù)分布表又稱相關(guān)次數(shù)分布表,是對有聯(lián)系的兩列變量用同一個表表示其次數(shù)分布。所謂有聯(lián)系的兩列變量, 一般是指同一組被試中每個被試兩種心理能力的分數(shù)或兩種心理特點的指標,或同一組被試在兩種實驗條件下獲得的結(jié)果。三、次數(shù)分布圖使一組數(shù)據(jù)特征更加直觀和概括 ,而且還可以對數(shù)據(jù)的分布情況和變動趨勢作粗略的分析。簡單次(頻)數(shù)分布圖直方圖、次數(shù)多邊形圖累加次數(shù)分布圖累加直方圖、累加曲線(一)簡單次數(shù)分布圖直方圖(二)簡單次數(shù)分布圖次數(shù)多邊圖次數(shù)分布多邊形圖是一種表
4、示連續(xù)性隨機變量次數(shù)分布的線形圖,屬于次數(shù)分布圖。凡是等距分組的可以用直方圖表示的數(shù)據(jù),都可用次數(shù)多邊圖來表示。繪制方法:以各分組區(qū)間的組中值為橫坐標,以各組的頻數(shù)為縱坐標,描點;將各點以直線連接即構(gòu)成多邊圖形。(三)累加次數(shù)分布圖累加直方圖(四)累加次數(shù)分布圖累加曲線四、其他統(tǒng)計圖表條形圖:用直條的長短來表示統(tǒng)計項目數(shù)值大小的圖形,主要是用來比較性質(zhì)相似的間斷型資料。圓形圖:是用于表示間斷型資料比例的圖形。圓形的面積表示一組數(shù)據(jù)的整體,圓中扇形的面積表示各組成部分所占的比例。各部分的比例一般用百分比表示。線形圖用來表示連續(xù)型資料。 它能表示兩個變量之間的函數(shù)關(guān)系;一種事物隨另一種事物變化的情
5、況;某種事物隨時間推移的發(fā)展趨勢等。基于線形圖,既可對有關(guān)統(tǒng)計變量進行數(shù)量比較,又可分析發(fā)展的趨勢。散點圖是用相同大小圓點的多少或梳密表示統(tǒng)計資料量大小以及變化趨勢的圖。第三章集中量數(shù)用來表現(xiàn)數(shù)據(jù)資料的典型水平或集中趨勢。常用的集中量包括算術(shù)平均數(shù)、加權(quán)平均數(shù)、中位數(shù)和眾數(shù)等等。一、算術(shù)平均數(shù)算術(shù)平均數(shù)一般簡稱為平均數(shù)或均數(shù)、均值 。X一般用,或者用表示。算術(shù)平均數(shù)是最常用的集中量(一)算術(shù)平均數(shù)的計算公式X1X2X n 1XnnnX ii1X 1 X n(二)算術(shù)平均數(shù)的意義算術(shù)平均數(shù)是應(yīng)用最普遍的一種集中量。它是“真值” (truescore )的最佳估計值。真值是反映某種現(xiàn)象的真實水平的
6、分數(shù)。由于測量過程中的各種偶然因素的影響,真值往往很難得到。在實際測量中,往往采用“多次測量,取平均數(shù)”的方法,用平均數(shù)去估計真值。(三)算術(shù)平均數(shù)的優(yōu)缺點優(yōu)點:反應(yīng)靈敏、有公式嚴密確定、簡明易懂、適合代數(shù)運算缺點:容易受兩極端數(shù)值的影響;一組數(shù)據(jù)中有模糊不清的數(shù)值時無法計算。(四)計算和應(yīng)用算術(shù)平均數(shù)的原則同質(zhì)性原則:算術(shù)平均數(shù)只能用于表示同類數(shù)據(jù)的集中趨勢。平均數(shù)與個體數(shù)值相結(jié)合的原則:在解釋個體特征時,既要看平均數(shù),也要結(jié)合個體的數(shù)據(jù)。平均數(shù)與標準差、 方差相結(jié)合原則:描述一組數(shù)據(jù)時既要分析其集中趨勢,也要分析離散程度。二、中位數(shù)中位數(shù) 又稱為中數(shù),是按順序排列的一組數(shù)據(jù)中位于中間位置的
7、數(shù)。中位數(shù)是常用集中量的一種。一般用 Md 或 Mdn 表示(一)中位數(shù)的計算方法1 、原始數(shù)據(jù)計算法一組數(shù)據(jù)中無重復數(shù)值的情況首先將一組數(shù)據(jù)按順序排列X nX n1若n為偶數(shù) ,則 Md22若n為奇數(shù) ,則Md 為第n 12個數(shù)22 、次數(shù)分布表計算法Md Lbnfbi2fMd公式中 :Lb 為中位數(shù)所在組的精確下限fb 為中位數(shù)所在組下限以下的累積頻數(shù)n 為數(shù)據(jù)總和fMd為中位數(shù)所在組的頻數(shù)i 為組距三眾數(shù)眾數(shù) 用 Mo 表示,有兩種定義:次數(shù)分布表中,頻數(shù)最多那一組數(shù)據(jù)的組中值,即為眾數(shù)。四、算術(shù)平均數(shù)、中位數(shù)、眾數(shù)三者的關(guān)系XMdM在正態(tài)分布中:OXMdM在正偏態(tài)分布中: OXMdM在
8、負偏態(tài)分布中O:五、其它集中量數(shù)(一)加權(quán)平均數(shù)X w加權(quán)平均數(shù)是不同比重數(shù)據(jù) (或平均數(shù))WiX iX wn XX 的平均數(shù)w,一般用表示。其計算公式有iWini兩種:(二)幾何平均數(shù)幾何平均數(shù)( geometric meanM g X g)是 nM g n X1X 2X n或個數(shù)值連乘積的n次方根,用表示。計算公式為:當數(shù)據(jù)的分布呈偏態(tài)時, 可用幾何平均數(shù)表示該M gX 2X3X nX nn 1X 2X n 1n 1X 1X1組數(shù)據(jù)的集中趨勢。幾何平均數(shù)的變式兩邊取對數(shù),得lg M g1lg X1lg X nn1注意:幾何平均數(shù)計算的是平均的變化情況,如果要計算平均增長率,需要從幾何平均數(shù)
9、中減去基數(shù) 1 。2. 應(yīng)用幾何平均數(shù)的變式計算按一定比例變化的一列數(shù)據(jù) ,一般用來求平均變化率如平均增長率 .(三)調(diào)和平均數(shù)NM H1調(diào)和平均數(shù) (harmonicmean), 用符號 MHX表i示公式為:調(diào)和平均數(shù)的應(yīng)用學習速度方面的問題.調(diào)和平均數(shù)在描述速度方面的集中趨勢時 ,優(yōu)于其他集中量第四章描述數(shù)據(jù)離散程度的統(tǒng)計量稱為差異量。差異量越大,表明數(shù)據(jù)越分散、不集中;差異量越小,表明數(shù)據(jù)越集中,變動范圍越小。一、全距、四分位距和百分位距(一)全距R全距是一組數(shù)據(jù)中的最大值與該組數(shù)據(jù)中最小值 之差,又稱極差。RXmax Xmin(二)百分位差(百分位距)百分位差是指兩個百分位數(shù)之差。(三
10、)四分位距Q3Q1Q2四分位距是第一個四分位數(shù)與第三個四分位數(shù)之差的一半 ,計算公式為(四)平均差平均差是指一組數(shù)據(jù)中,每一個數(shù)據(jù)與該組數(shù)XX據(jù)的平均數(shù)離AD差的絕對值的算術(shù)平均數(shù),通n常用 AD 或 MD 表示。原始數(shù)據(jù)計算公式(五)方差和標準差方差(又稱為變異數(shù)、 均方)。是表示一S22組數(shù)據(jù)離散程度的統(tǒng)計指標。一般樣本的方差用表示,總體的方差用表示。標準差是方差的算術(shù)平方根。一般樣本的標準差用S 表示,總體的標準差用表示。標準差和方差是描述數(shù)據(jù)離散程度的最常用的差異量。1 、樣本方差及標準差定義公式22S 2XXSXXnn2 、總體方差及標準差的定義公式22XX2NNX X2Sn 1是總
11、體的無偏估計3 、原始數(shù)據(jù)的方差與標準差計算2222XXS 2XXSnnnn4 、總標準差的合成方差具有可加性的特點。 當已知幾個小組數(shù)據(jù)的方差或標準差時,可以計算幾個小組聯(lián)合在一起的總的方差或標準差。計算公式ST2ST為總方差 ,為總標準差公式中 :Si 為各小組標準差222n iS in i X TX iS Tn ini 為各小組數(shù)據(jù)個數(shù)di XT X i2ni Si2ni X TX iSTni5 、方差和標準差的性質(zhì)方差是對一組數(shù)據(jù)中各種變異的總和的測量 ,具有可加性和可分解性特點。標準差是一組數(shù)據(jù)方差的算術(shù)平方根,它不可以進行代數(shù)計算,但有以下特性:YXCSYSX如果YCXSY CSX
12、如果則則7 、標準差的應(yīng)用差異系數(shù)差異系數(shù)是指標準差與其算術(shù)平均數(shù)SCV100%X的百分比,它是沒有單位的相對數(shù)。 常以 CV表示 ,其計算公式為:差異系數(shù)的作用:比較不同單位資料的差異程度比較單位相同而平均數(shù)相差較大的兩組資料的差異程度可判斷特殊差異情況8 、標準差的應(yīng)用標準分數(shù)Z 分數(shù),是以標準差為單位表示一個原始分數(shù)在ZXX團體中所處位置的相對位置量s數(shù)。( 1)標準分數(shù)的計算公式及其性質(zhì)沒有實際單位;可正可負,可為零;一組原始數(shù)據(jù)中,各個 Z 分數(shù)的標準差為 1;正態(tài)分布的原始數(shù)據(jù), 轉(zhuǎn)換得到的 Z 分數(shù)是標準的正態(tài)分布( 0,1 )。( 2)Z 分數(shù)的作用分數(shù)可以表明原始分數(shù)在團體中
13、的相對位置,因此稱為相對位置量數(shù)。把原始分數(shù)轉(zhuǎn)換成分數(shù),就把單位不等距的和缺乏明確參照點的分數(shù)轉(zhuǎn)換成以標準差為單位、以平均數(shù)為參照點的分數(shù)。( 3)標準分數(shù)的優(yōu)點可比性:標準分數(shù)以團體的平均數(shù)為基準,以標準差為單位,因而具有可比性??杉有裕簶藴史謹?shù)使不同的原始分數(shù)具有相同的參照點,因而具有可加性。明確性:標準分數(shù)較原始分數(shù)的意義更為明確。合理性:標準分數(shù)保證了不同性質(zhì)的分數(shù)在總分數(shù)中的權(quán)重相同,使分數(shù)更合理地反映事實。第五章一、 相關(guān)系數(shù)用來描述兩個變量相互之間變化方向及密切程度的統(tǒng)計指標稱為相關(guān)系數(shù),一般樣本的相關(guān)系數(shù)用 r 表示,總體的相關(guān)系數(shù)用表示。相關(guān)系數(shù)的取值: -1 r +1 0
14、r 1相關(guān)系數(shù)的符號:“”表示正相關(guān),“”表示負相關(guān)。相關(guān)系數(shù)不是由相等單位度量而來的,因此只能比較大小,不能做任何加、 減、乘、除運算。二、積差相關(guān)(一)積差相關(guān)及其適用條件皮爾遜積差相關(guān) 積差相關(guān)適用于: 1、兩個變量都是連續(xù)數(shù)據(jù);兩變量總體都為正態(tài)分布;兩變量之間為線性關(guān)系。 2 、成對數(shù)據(jù),樣本容量要大。積差相關(guān)條件的判斷方法:連續(xù)變量:根據(jù)得到數(shù)據(jù)的方式判斷, 測量數(shù)據(jù)。正態(tài)分布:一般情況下,正常人群的身高、 體重、智力水平、心理與教育測驗的結(jié)果,都可按總體正態(tài)分布對待;如果要求比較高,則需要對數(shù)據(jù)進行正態(tài)性檢驗。線性關(guān)系:根據(jù)相關(guān)散布圖可判斷兩個變量之間是否線性關(guān)系。(二)相關(guān)系數(shù)
15、的等距轉(zhuǎn)換及其合并相關(guān)系數(shù)不是等距數(shù)據(jù),更不是比率數(shù)據(jù),它只能比較相對大小,不能進行加減乘除運算。但我們常會遇到需要將取自同一總體的幾個樣本的相關(guān)系數(shù)合成、求平均的相關(guān)系數(shù)這一問題。這時,可以先將相關(guān)系數(shù) r 轉(zhuǎn)換成具有等距單位的 Zr 值。三、斯皮爾曼等級相關(guān)等級相關(guān)是指以等級次序排列或以等級次序表示的變量之間的相關(guān)。(一)斯皮爾曼等級相關(guān)的概念及適用條件斯皮爾曼等級相關(guān)是等級相關(guān)的一種。它適用于兩個以等級次序表示的變量,并不要求兩個變量總體呈正態(tài)分布,也不要求樣本的容量必須大于 30 。當連續(xù)數(shù)據(jù)不能滿足計算積差相關(guān)的條件時,可以轉(zhuǎn)換成等級數(shù)據(jù)從而計算斯皮爾曼等級相關(guān)系數(shù)。五、質(zhì)與量的相關(guān)
16、(一)點二列相關(guān)適用條件一個變量為正態(tài)、 連續(xù)變量,另一個變量為真正的二分名義變量,這兩個變量之間的相關(guān),稱為點二列相關(guān)。有時一個變量并非真正的二分變量,而是雙峰分布的變量,也可以用點二列相關(guān)來表示。多用于評價是非類測驗題目組成的測驗內(nèi)部一致性。(二)二列相關(guān)兩個變量都是正態(tài)連續(xù)變量, 其中一個變量被人為地劃分成二分變量,表示這兩個變量之間的相關(guān),稱為二列相關(guān)。將連續(xù)變量人為劃分為二分變量時,應(yīng)注意盡量使分界點接近平均數(shù)。教育或心理測驗中問答題的區(qū)分度指標。六、品質(zhì)相關(guān)兩個變量都是按性質(zhì)劃分成幾種類別,表示這兩個變量之間的相關(guān)稱為品質(zhì)相關(guān)。品質(zhì)相關(guān)處理的一般是計數(shù)數(shù)據(jù)而不是連續(xù)數(shù)據(jù),變量劃分為
17、不同的品質(zhì)類別,主要用于雙向表或稱為列聯(lián)表( R×C 表)。品質(zhì)相關(guān)的方法有多種,最常用的是四分相關(guān)、相關(guān)和列聯(lián)表相關(guān)。第六章一、概率的定義概率:表明隨機事件可能性大小的客觀指標。概率的兩種定義 :后驗概率和先驗概率。mW(A)n后驗概率(或統(tǒng)計概率):隨機事件的頻率:當 n 無限增大時,隨機事件A 的頻率會穩(wěn)定在一個常數(shù) P,這個常數(shù)就是隨機事件A 的m概P(A)n率。先驗概率(古典概率) :古典概率模型要求滿足兩個條件:試驗的所有可能結(jié)果是有限的;每一種可能結(jié)果出現(xiàn)的可能性相等。(二)概率的公理系統(tǒng)1 任何隨機事件的概率都是在0 與 1 之間的正數(shù),即0 P(A )12 不可能事
18、件的概率等于零,即P(A )= 03 必然事件的概率等于1,即P(A )= 1(三)概率分布類型概率分布是指對隨機變量取不同值時的概率的描述,一般用概率分布函數(shù)進行描述。依不同的標準,對概率分布可作不同的分類。、離散型分布與連續(xù)型分布依隨機變量的類型,可將概率分布分為離散型概率分布與連續(xù)型概率分布。心理與教育統(tǒng)計學中最常用的離散型分布是二項分布,最常用的連續(xù)型分布是正態(tài)分布。、經(jīng)驗分布與理論分布依分布函數(shù)的來源, 可將概率分布分為經(jīng)驗分布與理論分布。經(jīng)驗分布:是指根據(jù)觀察或?qū)嶒炈@得的數(shù)據(jù)而編制的次數(shù)分布或相對頻率分布。理論分布:是按某種數(shù)學模型計算出的概率分布。、基本隨機變量分布與抽樣分布依
19、所描述的數(shù)據(jù)的樣本特性, 可將概率分布分為基本隨機變量分布與抽樣分布?;倦S機變量分布是隨機變量各種不同取值情況的概率分布,抽樣分布是從同一總體內(nèi)抽取的不同樣本的統(tǒng)計量的概率分布。二、概率分布正態(tài)分布(一)正態(tài)分布特征正態(tài)分布,是連續(xù)型隨機變量概率分布的一種1 正態(tài)分布曲線函數(shù)NX2Ye 22正態(tài)分布曲線函數(shù)又稱概率密度函數(shù),2 其一般公式為:公式所描述的正態(tài)曲線,由和兩個參數(shù)決定。2 、正態(tài)分布的性質(zhì)正態(tài)分布是以為中心的對稱分配。正態(tài)分布有2 個參數(shù): M ( 平均數(shù) )以及 s(標準差 ) ,其決定了分配的位置及形狀。正態(tài)分布曲線下面的面積總和等于1 。f ( x)X在時有一正態(tài)分布轉(zhuǎn)折點
20、。正態(tài)分布曲線的兩尾無限延伸。正態(tài)分布是一族曲線,標準正態(tài)分布是一條曲線。3 、標準正態(tài)分布曲線將標準分數(shù)代入正態(tài)曲線函數(shù),并且,令1 ,1X21Z22e2e2YY22則公式變換為標準正態(tài)分布函數(shù):標準正態(tài)分布曲線的特點曲線在處達到最高點曲線以處為中心,雙側(cè)對稱曲線從最高點向左右緩慢下降,向兩側(cè)無限延伸,但永不與基線相交。標準正態(tài)分布曲線的平均數(shù)為,標準差為。從 3 至 3 之間幾乎分布著全部數(shù)據(jù)。曲線的拐點為正負一個標準差處。4 、正態(tài)分布表的使用已知 Z 值求概率求 0 至某一值之間的概率:直接查表求兩個值之間的概率兩值符號相同: PZ1 Z2 PZ2 PZ1兩值符號相反: PZ1 Z2
21、PZ2 PZ1求某一 Z 值以上的概率Z0 時, PZ0.5 PZZ0 時, PZ0.5 PZ求某一 Z 值以下的概率Z0 時, PZ0.5 PZZ0 時, PZ0.5 PZ已知面積(概率)求Z 值求 Z 0 以上或以下某一面積對應(yīng)的Z 值:直接查表求與正態(tài)曲線上端或下端某一面積P 相對應(yīng)的 Z 值:先用 0.5 PZ ,再查表求與正態(tài)曲線下中央部位某一面積相對應(yīng)的Z 值:先計算 P2 ,再查表已知概率或 Z 值,求概率密度 Y 直接查正態(tài)分布表就能得到相應(yīng)的概率密度值。如果由概率求值, 要注意區(qū)分已知概率是位于正態(tài)曲線的中間部分,還是兩尾端部分,才能通過查表求得正確的概率密度。三、概率分布二
22、項分布(一)二項試驗與二項分布 二項分布是一種具有廣泛用途的離散型隨機變量的概率分布1 二項試驗 滿足以下條件的試驗稱為二項試驗:一次試驗只有兩種可能的結(jié)果,即成功和失??;共有 n 次試驗,并且 n 是預先給定的任一正整數(shù);各次試驗相互獨立,即各次試驗之間互不影響;各次試驗中成功的概率相等,失敗的概率也相等。2 二項分布函數(shù)二項分布是一種離散型隨機變量的概率分布。用 n 次方的二項展開式來表達在n 次二項試XXnX驗中成功事件出現(xiàn)的b不(x,同n,次p)數(shù)Cn(pXq0 ,1 )的概率分布,叫做二項分布函數(shù)。二項展開式的通式(即二項分布函數(shù)) :3 、二項分布的平均數(shù)和標準差如果二項分布滿足p
23、 q 且 nq 5(或者 p q 且 np 5 時,二項分布接近于正態(tài)分布??捎孟旅娴姆椒ㄓ嬎愣椃植嫉钠骄鶖?shù)和標準差。np二項分布的平均數(shù)為:二項分布的標準差為:npq四、概率分布樣本分布(一)、抽樣分布區(qū)分三種不同性質(zhì)的分布:總體分布:總體內(nèi)個體數(shù)值的頻數(shù)分布樣本分布:樣本內(nèi)個體數(shù)值的頻數(shù)分布抽樣分布:某一種統(tǒng)計量的概率分布1. 抽樣分布的概念抽樣分布是從同一總體內(nèi)抽取的不同樣本的統(tǒng)計量的概率分布。抽樣分布是一個理論的概率分布,是統(tǒng)計推斷的依據(jù)。2 平均數(shù)抽樣分布的幾個定理從總體中隨機抽出容量為n 的一切可能樣本E(X)的平均數(shù)之平均數(shù)等于總體的平均數(shù)。容量為n 的平均數(shù)在抽樣分布上的標準
24、差Xn(即平均數(shù)的標準誤) ,等于總體標準差除以 n 的平方根。從正態(tài)總體中, 隨機抽取的容量為n 的一切可能樣本平均數(shù)的分布也呈正態(tài)分布。雖然總體不呈正態(tài)分布, 如果樣本容量較大,反映總體和的樣本平均數(shù)的抽樣分布,也接近于正態(tài)分布。(二)標準誤某種統(tǒng)計量在抽樣分布上的標準差,稱為標準誤。標準誤用來衡量抽樣誤差。 標準誤越小,表明樣本統(tǒng)計量與總體參數(shù)的值越接近,樣本對總體越有代表性,用樣本統(tǒng)計量推斷總體參數(shù)的可靠度越大。因此,標準誤是統(tǒng)計推斷可靠性的指標。平均數(shù)標準誤的計算1 總體正態(tài),已知(不管樣本容量大小) ,或Xn總體非正態(tài),已知,大樣本平均數(shù)的標準誤為:2 總體正態(tài),未知(不管樣本容量
25、大?。?,或SXn 1總體非正態(tài),未知,大樣本平均數(shù)標準誤的估計值為:(三)平均數(shù)離差統(tǒng)計量的分布1 總體正態(tài),已知(不管樣本容量大?。?,或XXZX總體非正態(tài),已知,大樣本n平均數(shù)離差的的抽樣分布呈正態(tài)分布正態(tài)總體,樣本平均數(shù)的抽樣分布22XXn2 總體正態(tài),未知(不管樣本容量大?。?,或tXX總體非正態(tài),未知,大樣X本Sn1平均數(shù)離差的的抽樣分布呈t 分布t 分布的特點形狀與正態(tài)分布曲線相似 t 分布曲線隨自由度不同而有一簇曲線自由度的計算:自由度是指能夠獨立變化的數(shù)據(jù)個數(shù)。查 t 分布表時,需根據(jù)自由度及相應(yīng)的顯著性水平,并要注意是單側(cè)數(shù)據(jù)還是雙側(cè)。3 總體未知,大樣本時的近似處理樣本容
26、量增大后,平均數(shù)的抽樣分布接ZXXXS近于正態(tài)分布,可n用正態(tài)分布近似處理:第七章一、點估計、區(qū)間估計與標準誤(一)總體參數(shù)估計的基本原理根據(jù)樣本統(tǒng)計量對相應(yīng)總體參數(shù)所作的估計叫做總體參數(shù)估計??傮w參數(shù)估計分為點估計和區(qū)間估計。由樣本的標準差估計總體的標準差即為點估計;而由樣本的平均數(shù)估計總體平均數(shù)的取值范圍則為區(qū)間估計。(二)點估計1 、良好的點估計量應(yīng)具備的條件無偏性:如果一切可能個樣本統(tǒng)計量的值與總體參數(shù)值偏差的平均值為 0 ,這種統(tǒng)計量就是總體參數(shù)的無偏估計量。有效性: 當總體參數(shù)不止有一種無偏估計量時,某一種估計量的一切可能樣本值的方差小者為有效性高,方差大者為有效性低。一致性: 當
27、樣本容量無限增大時,估計量的值能越來越接近它所估計的總體參數(shù)值,這種估計是總體參數(shù)一致性估計量。充分性 :一個容量為 n 的樣本統(tǒng)計量 ,應(yīng)能充分地反映全部 n 個數(shù)據(jù)所反映的總體的信息。2 、點估計量的缺點:有偏差,沒有提供正確估計的概率 ,即不能提供估計值與參數(shù)真值的接近程度和可靠程度(三)區(qū)間估計區(qū)間估計得出的不是一個單一數(shù)值,而是一個數(shù)值區(qū)間。它既可以告訴我們參數(shù)的真值在什么范圍內(nèi),又能告訴我們參數(shù)的真值落在這個范圍的概率有多大。區(qū)間估計的基礎(chǔ)抽樣分布根據(jù)抽樣分布的特點及原理,不同總體條件下,可能會有不同的抽樣分布,則可得到不同條件下總體參數(shù)的區(qū)間估計的計算方法。區(qū)間估計涉及和置信區(qū)間
28、和顯著性水平。區(qū)間估計以樣本統(tǒng)計量的抽樣分布 (概率分布) 為理論依據(jù),按一定概率的要求,由樣本統(tǒng)計量的值估計總體參數(shù)值的所在范圍,稱為總體參數(shù)的區(qū)間估計。對總體參數(shù)值進行區(qū)間估計, 就是要在一定可靠度上求出總體參數(shù)的置信區(qū)間的上下限。要知道與所要估計的參數(shù)相對應(yīng)的樣本統(tǒng)計量的值,以及樣本統(tǒng)計量的理論分布;要求出該種統(tǒng)計量的標準誤;要確定在多大的可靠度上對總體參數(shù)作估計,再通過某種理論概率分布表,找出與某種可靠度相對應(yīng)的該分布橫軸上記分的臨界值,才能計算出總體參數(shù)的置信區(qū)間的上下限。置信區(qū)間置信度,即置信概率, 是作出某種推斷時正確的可能性(概率)。置 信 區(qū) 間 , 也 稱 置 信 間 距
29、( confidenceinterval,CI)是指在某一置信度時,總體參數(shù)所在的區(qū)域距離或區(qū)域長度。置信區(qū)間是帶有置信概率的取值區(qū)間。顯著性水平對總體平均數(shù)進行區(qū)間估計時,置信概率表示做出正確推斷的可能性,但這種估計還是會有犯錯誤的可能。顯著性水平(significancelevel) 就是指估計總體參數(shù)落在某一區(qū)間時,可能犯錯誤的概率, 用符號表示。P -2 、平均數(shù)區(qū)間估計的基本原理通過樣本的平均數(shù)估計總體的平均數(shù) ,首先假定該樣本是隨機取自一個正態(tài)分布的母總體(或非正態(tài)總體中的 n 30 的樣本 ),而計算出來的實際平均數(shù)是無數(shù)容量為 n 的樣本平均數(shù)中的一個。根據(jù)樣本平均數(shù)的分布理論
30、, 可以對總體平均數(shù)進行估計,并以概率說明其正確的可能性。三、總體平均數(shù)的估計(一)總體平均數(shù)的區(qū)間估計1 總體平均數(shù)區(qū)間估計的基本步驟根據(jù)樣本的數(shù)據(jù),計算樣本的平均數(shù)和標準差;計算平均數(shù)抽樣分布的標準誤;確定置信概率或顯著性水平;根據(jù)樣本平均數(shù)的抽樣分布確定查何種統(tǒng)計表;計算置信區(qū)間;解釋總體平均數(shù)的置信區(qū)間。2 平均數(shù)區(qū)間估計的計算總體正態(tài), 已知(不管樣本容量大?。蚩俋ZXZ2n2n體非正態(tài),已知,大樣本樣本平均數(shù)的分布呈正態(tài),平均數(shù)的置信區(qū)間為:總體正態(tài), 未知(不管樣本容量大?。?,或總SX t dfSXt df2n 12n 1體非正態(tài),未知,大樣本樣本平均數(shù)的分布為t 分布,平均
31、數(shù)的置信區(qū)間為:總體正態(tài),未知,大樣本平均數(shù)的抽樣分布接近于正態(tài)分布, 用正態(tài)分布SX ZX Z代替 t 分布近似處理:2n2 總體非正態(tài),小樣本不能進行參數(shù)估計,即不能根據(jù)樣本分布對總體平均數(shù)進行估計。Sn第八章一、假設(shè)檢驗的原理利用樣本信息,根據(jù)一定概率,對總體參數(shù)或分布的某一假設(shè)作出拒絕或保留的決斷,稱為假設(shè)檢驗。1 、假設(shè)檢驗一般有兩互相對立的假設(shè)。H0 :零假設(shè),或稱原假設(shè)、虛無假設(shè);是要檢驗的對象之間沒有差異的假設(shè)。H1 :備擇假設(shè) ,或稱研究假設(shè)、對立假設(shè);是與零假設(shè)相對立的假設(shè),即存在差異的假設(shè)。進行假設(shè)檢驗時, 一般是從零假設(shè)出發(fā), 以樣本與總體無差異的條件計算統(tǒng)計量的值,并
32、分析計算結(jié)果在抽樣分布上的概率,根據(jù)相應(yīng)的概率判斷應(yīng)接受零假設(shè)、拒絕研究假設(shè)還是拒絕零假設(shè)、接受研究假設(shè)。2 、小概率事件:樣本統(tǒng)計量的值在其抽樣分布上出現(xiàn)的概率小于或等于事先規(guī)定的水平,這時就認為小概率事件發(fā)生了。把出現(xiàn)概率很小的隨機事件稱為小概率事件。當概率足夠小時, 可以作為從實際可能性上,把零假設(shè)加以否定的理由。因為根據(jù)這個原理認為:在隨機抽樣的條件下,一次實驗竟然抽到與總體參數(shù)值有這么大差異的樣本,可能性是極小的,實際中是罕見的,幾乎是不可能的。3 、顯著性水平統(tǒng)計學中把拒絕零假設(shè)的概率稱為顯著性水平,用表示。顯著性水平也是進行統(tǒng)計推斷時, 可能犯錯誤的概率。常用的顯著性水平有兩個:
33、 0.05和 0.01 。4 假設(shè)檢驗中的兩類錯誤及其控制對于總體參數(shù)的假設(shè)檢驗, 有可能犯兩種類型的錯誤,即錯誤和錯誤。假設(shè)檢驗中的兩類錯誤H0 為H0 為真假拒絕錯誤正確H0接受正確錯誤H0兩類錯誤實際情況H0 正確 H0 錯誤拒絕 H0 型錯誤 正確研究結(jié)論接受 H0 正確型錯誤結(jié)論(1)兩類錯誤既有聯(lián)系又有區(qū)別錯誤只在否定 H0 時發(fā)生錯誤增加錯誤減小錯誤只在接受H0 時發(fā)生錯誤增加錯誤減?。?)n ,2 可使兩類錯誤的概率都減小.為了將兩種錯誤同時控制在相對最小的程度, 研 究者往往通過選擇適當?shù)娘@著性水平而對錯誤進行控制,如 0.05 或0.01 。對錯誤,則一方面使樣本容量增大,
34、另一方面采用合理的檢驗形式(即單側(cè)檢驗或雙側(cè)檢驗)來使誤差得到控制。在確定檢驗形式時, 凡是檢驗是否與假設(shè)的總體一致的假設(shè)檢驗,被分散在概率分布曲線的兩端,因此稱為雙側(cè)檢驗。雙側(cè)檢驗的假設(shè)形式為: H0 :0,H1 :0凡是檢驗大于或小于某一特定條件的假設(shè)檢驗,是在概率分布曲線的一端,因此稱為單側(cè)檢驗。單側(cè)檢驗的假設(shè)形式為:H0 :0,H1 :0或者H0 :0,H1 :05 假設(shè)檢驗的基本步驟提出假設(shè)選擇檢驗統(tǒng)計量并計算統(tǒng)計量的值確定顯著性水平做出統(tǒng)計結(jié)論二、平均數(shù)的顯著性檢驗(一)總體平均數(shù)的顯著性檢驗總體平均數(shù)的顯著性檢驗是指對樣本平均數(shù)與總體平均數(shù)之間的差異進行的顯著性檢驗。若檢驗的結(jié)果差異顯著,可以認為該樣本不是來自當前的總體,而來自另一個、與當前總體存在顯著差異的總體。即,該樣本與當前的總體不一致。1 總體平均數(shù)顯著性檢驗的原理檢驗的思路是:假定研究樣本是從平均數(shù)為的總體隨機抽取的,而目標總體
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 網(wǎng)店美工試題庫及參考答案
- 吉林省長春市寬城區(qū)2023-2024學年七年級上學期期末考試數(shù)學試卷(含答案)
- 養(yǎng)老院老人心理咨詢師激勵制度
- 養(yǎng)老院老人康復理療服務(wù)質(zhì)量管理制度
- 《付出總有收獲》課件
- 《VFP系統(tǒng)準備》課件
- 房屋預售合同(2篇)
- 2024年特色農(nóng)產(chǎn)品種植配套農(nóng)機采購合同2篇
- 《生命的延續(xù)》課件
- 2025年黃山b2貨運資格證多少道題
- 誤差累積效應(yīng)及應(yīng)對機制
- 國家開放大學《建筑工程計量與計價》期末考試題庫參考答案
- 薪酬管理體系的內(nèi)外部公平性
- 山東省青島市市北區(qū)2023-2024學年四年級上學期期末科學試卷
- 運動員年終總結(jié)-汗水鑄就榮耀之路
- illustrator練習試題附答案
- 《SolidWorks建模實例教程》第6章 工程圖及實例
- 華為公司管理決策流程
- 《水力學》簡答題和名詞解釋題總結(jié)
- 會議服務(wù)策劃方案(12篇)
- 車輛理賠權(quán)益轉(zhuǎn)讓協(xié)議
評論
0/150
提交評論