版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、計量資料的統(tǒng)計推斷1實例為研究女大學生的身體發(fā)育狀況,某醫(yī)生隨機抽取某校女大學生100人,算得身高均數(shù)163.74cm,標準差3.80cm,試估計該地女大學生的身高在何范圍?已知中學一般男生的心率平均為74次/分鐘。若想了解常參加體育鍛煉的中學生心臟功能與一般的中學生是否相同?某研究者在某地區(qū)中學生中隨機抽取常年參加體育鍛煉的男生16名,測量他們的心率,結果見數(shù)據(jù)“男生心率.SAV”。2樣本(一勺)總體(一鍋)統(tǒng)計推斷隨機抽樣參數(shù)?統(tǒng)計量( 、)(X、s、p)上述2個實例的問題用什么方法解決呢?這就要用到以下要學習的統(tǒng)計推斷3統(tǒng)計推斷(Statistical inference):用樣本信息推
2、論總體特征的過程。內(nèi)容包括:參數(shù)估計 假設檢驗4參數(shù)估計: 運用統(tǒng)計學原理,用從樣本資料計算的統(tǒng)計量,對總體指標(參數(shù))進行估計。假設檢驗:又稱顯著性檢驗,是指由樣本間存在的差別對樣本所代表的總體間是否存在著差別做出判斷。5假設檢驗參數(shù)假設檢驗非參數(shù)假設檢驗總體分布已知,檢驗關于未知參數(shù)的某個假設總體分布未知時的假設檢驗問題6第一節(jié) 均數(shù)的抽樣誤差和標準誤一、概念抽樣誤差:由于抽樣引起的樣本統(tǒng)計量與總體參數(shù)之間的差異。標準誤 (Standard error) (x Sx) :是指樣本均數(shù)的標準差,表示抽樣誤差大小的指標。SPSS結果中用std. error of mean 表示 7X1S1X2
3、 S2 XiSiXnSnx標準誤示意圖X服從什么分布?請大家看下面的抽樣實驗8抽樣試驗 從正態(tài)分布總體N(5.00,0.502)中,每次隨機抽取樣本含量n5,并計算其均數(shù)與標準差;重復抽取1000次,獲得1000份樣本;計算1000份樣本的均數(shù)與標準差,并對1000份樣本的均數(shù)作直方圖。 按上述方法再做樣本含量n10、樣本含量n30的抽樣實驗;比較計算結果。抽樣試驗(n=5)抽樣試驗(n=10)抽樣試驗(n=30)1000份樣本抽樣計算結果總體的均數(shù)總體標準差s均數(shù)的均數(shù)均數(shù)標準差n=55.000.504.990.22120.2236n=105.000.505.000.15800.1581n=
4、305.000.505.000.09200.09133個抽樣實驗結果圖示抽樣實驗小結 均數(shù)的均數(shù)圍繞總體均數(shù)上下波動。 均數(shù)的標準差即標準誤 與總體標準差 相差一個常數(shù)的倍數(shù),即 樣本均數(shù)的標準誤(Standard Error)=樣本標準差/ 從正態(tài)總體N(m,s2)中抽取樣本,獲得均數(shù)的分布仍近似呈正態(tài)分布N(m,s2/n) 。XX隨機抽取的樣本均數(shù)服從正態(tài)分布16中心極限定理 central limit theorem即使從非正態(tài)總體中抽取樣本,所得均數(shù)分布仍近似呈正態(tài)。隨著樣本量的增大, 樣本均數(shù)的變異范圍也逐漸變窄。意義:反映抽樣誤差的大小。標準誤越小,抽樣誤差越小,用樣本均數(shù)估計總體
5、均數(shù)的可靠性越大。與樣本量的關系:S 一定,n,標準誤二、均數(shù)標準誤的計算18SPSS計算標準誤Analyze-Descriptive Statistics-Frequencies-Statistics-Dispersion-S.E. mean-Continue-OK19t 分布哥塞特(W.S. Gosset,18761937)1908年,哥塞特首次以“學生”(Student)為筆名,在生物計量學雜志上發(fā)表了“平均數(shù)的概率誤差”。由于這篇文章提供了“學生t檢驗”的基礎,為此,許多統(tǒng)計學家把1908年看作是統(tǒng)計推斷理論發(fā)展史上的里程碑。 20戈塞特:t分布與小樣本由于“有些實驗不能多次地進行”,
6、從而“必須根據(jù)少數(shù)的事例(小樣本)來判斷實驗結果的正確性”與正態(tài)分布的關系 小樣本思想21t分布隨機變量XN(m,s2)標準正態(tài)分布N(0,12)u變換均數(shù)標準正態(tài)分布N(0,12)均數(shù)標準正態(tài)分布N(0,12)Student t分布自由度:n-1t 分布的圖形(u分布 是t 分布的特殊形式)24t分布曲線 t 分布有如下性質:單峰分布,曲線在t0 處最高,并以t0為中心左右對稱與正態(tài)分布相比,曲線最高處較矮,兩尾部翹得高(見綠線) 隨自由度增大,曲線逐漸接近正態(tài)分布;分布的極限為標準正態(tài)分布。曲線下面積分布規(guī)律:t 值表(附表2 ) 左側列:自由度 上兩行:概率p, 即曲線下陰影部分的面積;
7、 表中的數(shù)字:相應的 |t | 界值。26t分布曲線下面積(附表2)雙側t0.05/2,92.262 單側t0.025,9單側t0.05,91.833雙側t0.01/2,93.250 單側t0.005,9單側t0.01,92.821雙側t0.05/2,1.96 單側t0.025,單側t0.05, 1.64-tt028t 值表規(guī)律:(1) 自由度()一定時,p 與 t 成反比;(2) 概率(p) 一定時, 與 t 成反比;29第二節(jié) 總體均數(shù)的估計參數(shù)估計: 用樣本均數(shù)估計總體均數(shù) 1、 點(值)估計(近似值) 2、 區(qū)間估計(近似范圍)301、點(值)估計(point estimation):
8、用樣本均數(shù)直接作為總體均數(shù)的估計值但未考慮抽樣誤差,對估計的可靠程度無法評價。312、區(qū)間估計(interval estimation) 概念:根據(jù)樣本均數(shù),按一定的可信度計算出總體均數(shù)很可能在的一個數(shù)值范圍,這個范圍稱為總體均數(shù)的可信區(qū)間(confidence interval, CI)。32(x1.96S x,x1.96 S x) 即(x1.96S x)33 95%的可信區(qū)間的理解:從正態(tài)總體中隨機抽取100個樣本,可算得100個樣本均數(shù)和標準差,也可算得100個均數(shù)的可信區(qū)間,平均約有95個可信區(qū)間包含了總體均數(shù) 。但在實際工作中,只能根據(jù)一次試驗結果估計可信區(qū)間,我們就認為該區(qū)間包含了
9、總體均數(shù)。 34公式意義:與正常值范圍進行比較(x1.96S x,x1.96 S x) 即(x1.96S x)(x1.96 S,x1.96 S )35SPSS求可信區(qū)間Analyze-Descriptive Statistics-Explore-身高Statistics-Descriptives-Continue-OK36可信區(qū)間3795(個體)的正常值范圍:156.0170.995的(總體均數(shù))可信區(qū)間:163.0164.538 換句話說,做出該校全體女大學生身高均數(shù)為163.0 - 164.5cm的結論,說對的概率是95%,說錯的概率是5%;做出該校全體女大學生身高均數(shù)為162.7 164
10、.7cm的結論,說對的概率是99%,說錯的概率是1%。(可信區(qū)間)意義:雖然不能知道某校全體女大學生身高均數(shù)的確切數(shù)值,全體女大學生身高均數(shù)在163.0 - 164.5cm之間的可能性是95%,在 162.7 164.7cm之間的可能性是99%。39準確度:說對的可能性大小, 用 (1-) 來衡量。99%的可信區(qū)間好于95%的可信區(qū)間。精密度:指區(qū)間范圍的寬窄,范圍越寬精確度越差。99%的可信區(qū)間差于95%的可信區(qū)間。 準確度與精密度的關系:(例如預測孩子的身高)40正常值范圍與可信區(qū)間的區(qū)別41 參考值范圍與可信區(qū)間的區(qū)別 已知中學一般男生的心率平均為74次/分鐘。為了研究常參加體育鍛煉的中
11、學生心臟功能是否與一般的中學生相同,在某地區(qū)中學生中隨機抽取常年參加體育鍛煉的男生16名,測量他們的心率,結果見數(shù)據(jù)“男生心率.SAV”。43第三節(jié) 假設檢驗也叫顯著性檢驗科研數(shù)據(jù)處理的重要工具某事發(fā)生了: 是由于碰巧?還是由于必然的原因?統(tǒng)計學家運用顯著性檢驗來處理這類問題。44假設檢驗:1、原因2、目的3、原理4、過程(步驟)5、結果45 舉例:通過以往大規(guī)模調查,已知某地一般新生兒的頭圍均數(shù)為34.50cm,標準差為1.99cm。為研究某礦區(qū)新生兒的發(fā)育狀況,現(xiàn)從該地某礦區(qū)隨機抽取新生兒55人,測得其頭圍均數(shù)為33.89cm,問該礦區(qū)新生兒的頭圍總體均數(shù)與一般新生兒頭圍總體均數(shù)是否不同?
12、 461、假設檢驗的原因 從兩個總體中進行隨機抽樣,得到兩個樣本均數(shù)X1、X2。 X1、X2不同。不同的原因是什么? X1、X2 不同有兩種(而且只有兩種)可能:(1)分別所代表的總體均數(shù)相同,由于抽樣誤差造成了樣本均數(shù)的差別。差別無顯著性 。(2)分別所代表的總體均數(shù)不同。差別有顯著性。47 假設檢驗的目的就是判斷差別是由哪種原因造成的。 抽樣誤差造成的; 本質差異造成的。48一般新生兒頭圍 34.50cm 33.89cn礦區(qū)新生兒頭圍 34.50cm一種假設H0另一種假設H1抽樣誤差總體不同492、假設檢驗的目的判斷是由于何種原因造成的不同,以做出決策。50概率論(小概率):小概率事件在一
13、次試驗中基本上不會發(fā)生 。反證法:假設檢驗是利用小概率反證法思想,從問題的對立面(H0)出發(fā)間接判斷要解決的問題(H1)是否成立。然后在H0成立的條件下計算檢驗統(tǒng)計量,最后獲得P值來判斷。 3、假設檢驗的原理/思想51假設檢驗的一般步驟 建立假設: 確定顯著性水平( ): 計算統(tǒng)計量:z, t,F(xiàn),2 確定概率值: 做出推論5253H1的內(nèi)容直接反映了檢驗單雙側。若H1中只是 0 或 0,則此檢驗為單側檢驗。它不僅考慮有無差異,而且還考慮差異的方向。單雙側檢驗的確定,首先根據(jù)專業(yè)知識,其次根據(jù)所要解決的問題來確定。若從專業(yè)上看一種方法結果不可能低于或高于另一種方法結果,此時應該用單側檢驗。一般認為雙側檢驗較保守和穩(wěn)妥。54 (3) 檢驗水準,過去稱顯著性水準,是預先規(guī)定的概率值,它確定了小概率事件的標準。在實際工作中常取 = 0.05??筛鶕?jù)不同研究目的給予不同設置。55 根據(jù)變量和資料類型、設計方案、統(tǒng)計推斷的目的、是否滿足特定條件等(如數(shù)據(jù)的分布類型)選擇相應的檢驗統(tǒng)計量。 2. 計算檢驗統(tǒng)計量56 3. 確定P值,下結論如本例已得到P0.05, 按所取檢驗水準0.05, 則拒絕H0,接受H1,差異有統(tǒng)計學意義(統(tǒng)計結論),可以認為礦區(qū)新生兒的頭圍均數(shù)與一般新生兒不同,礦區(qū)新生兒的頭圍小于一般新生兒(專業(yè)結論)。57確定概率值(P,在spss程序上用S
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 廣西部分市2024屆高考聯(lián)合模擬考試
- 2023-2028年中國甲苯磺丁脲片行業(yè)市場調查研究及發(fā)展戰(zhàn)略規(guī)劃報告
- 三年級數(shù)學計算題專項練習匯編及答案集錦
- 玻璃鋼接閃桿避雷針 6米玻璃纖維路燈桿 絕緣輕質天線桿
- 存貨知識管理培訓課件
- 二零二五年度個體工商戶與兼職人員勞動合同3篇
- 銀行年終總結
- 房地產(chǎn)外墻知識培訓課件
- 社區(qū)網(wǎng)格化管理困境及提升路徑
- 二零二五年度建筑工程自流平混凝土材料供應合同
- 江西省萍鄉(xiāng)市2022-2023學年高一年級上冊期末考試數(shù)學試題
- 第二單元自測卷(試題)2023-2024學年統(tǒng)編版語文四年級下冊
- 山西省呂梁市2023-2024學年高二上學期期末數(shù)學試題
- 如何訓練寶寶獨立就寢
- 血常規(guī)報告單
- 設備部年度工作總結和來年計劃
- 藥品的收貨與驗收培訓課件
- 寶寶大便觀察及護理課件
- 公司月度安全生產(chǎn)綜合檢查表
- 開題報告會記錄單
- 對話的力量:焦點解決取向在青少年輔導中的應用
評論
0/150
提交評論