試驗(yàn)基本統(tǒng)計(jì)_第1頁
試驗(yàn)基本統(tǒng)計(jì)_第2頁
試驗(yàn)基本統(tǒng)計(jì)_第3頁
試驗(yàn)基本統(tǒng)計(jì)_第4頁
試驗(yàn)基本統(tǒng)計(jì)_第5頁
已閱讀5頁,還剩64頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

試驗(yàn)基本統(tǒng)計(jì)第一頁,共六十九頁,編輯于2023年,星期一SPSS基本統(tǒng)計(jì)分析頻數(shù)分析計(jì)算基本描述統(tǒng)計(jì)量探索性數(shù)據(jù)分析第二頁,共六十九頁,編輯于2023年,星期一概率分布密度函數(shù)第三頁,共六十九頁,編輯于2023年,星期一常見的概率分布曲線第四頁,共六十九頁,編輯于2023年,星期一描述數(shù)據(jù)分布形狀的特征量偏度g1:分布形狀的左右對稱性。g1>0,正偏態(tài);g1<0,負(fù)偏態(tài)峰度g2:以正態(tài)分布為標(biāo)準(zhǔn),描述分布峰態(tài)的指標(biāo)。g2>0,尖峭峰;g2<0,平闊峰正態(tài)性檢驗(yàn)第五頁,共六十九頁,編輯于2023年,星期一一、頻數(shù)分析目的:粗略把握數(shù)據(jù)的分布特征功能:編制頻數(shù)分布表:頻數(shù)、百分比、累計(jì)百分比繪制頻數(shù)分析中常用統(tǒng)計(jì)圖:條圖、餅圖、直方圖計(jì)算基本描述統(tǒng)計(jì)量第六頁,共六十九頁,編輯于2023年,星期一例:數(shù)據(jù)為<住房狀況調(diào)查.sav>,對分析被調(diào)查家庭中戶主的從業(yè)狀況和目前所住房屋的產(chǎn)權(quán)情況。第七頁,共六十九頁,編輯于2023年,星期一基本操作:Analyze-DescriptiveStatistics-Frequencies選項(xiàng)按鈕:Statistics:選擇輸出統(tǒng)計(jì)量:集中、離散趨勢、分布特征、百分位數(shù)。Charts:選擇繪制的圖形:條圖、餅圖、直方圖(僅用于定量變量)。Format:定義頻數(shù)表輸出格式第八頁,共六十九頁,編輯于2023年,星期一二、計(jì)算基本描述統(tǒng)計(jì)量目的:精確把握變量的總體分布狀況。用途:計(jì)算變量的集中趨勢、離散趨勢、偏度、峰度等指標(biāo),繪制統(tǒng)計(jì)圖。第九頁,共六十九頁,編輯于2023年,星期一例:數(shù)據(jù)為住<房狀況調(diào)查.sav>,對人均住房面積計(jì)算基本描述統(tǒng)計(jì)量,并對本市戶口和外地戶口家庭進(jìn)行比較。注:先對數(shù)據(jù)按照戶口狀況進(jìn)行拆分。第十頁,共六十九頁,編輯于2023年,星期一步驟:分析描述統(tǒng)計(jì)描述按【選項(xiàng)】第十一頁,共六十九頁,編輯于2023年,星期一按【繼續(xù)】按【確定】。第十二頁,共六十九頁,編輯于2023年,星期一Explore過程可計(jì)算分組或不分組的描述性統(tǒng)計(jì)量第十三頁,共六十九頁,編輯于2023年,星期一幾個(gè)過程的其他功能第十四頁,共六十九頁,編輯于2023年,星期一DescriptiveStatistics-Descriptives過程的獨(dú)有功能例:你能很快找到取款數(shù)目異常(>3σ)的儲(chǔ)戶嗎?標(biāo)準(zhǔn)化變換第十五頁,共六十九頁,編輯于2023年,星期一CompareMeans-Means過程的獨(dú)有功能分組輸出統(tǒng)計(jì)量分層輸出統(tǒng)計(jì)量第十六頁,共六十九頁,編輯于2023年,星期一方差分析和eta統(tǒng)計(jì)量線性趨勢檢驗(yàn)統(tǒng)計(jì)量第十七頁,共六十九頁,編輯于2023年,星期一三、探索性數(shù)據(jù)分析(Explore)基本操作:DescriptiveStatistics-Explore過程目的:對數(shù)據(jù)進(jìn)行初步考察用途:計(jì)算整體或分組數(shù)據(jù)的描述性統(tǒng)計(jì)指標(biāo)輸出描述性統(tǒng)計(jì)圖:莖葉圖、直方圖、箱式圖正態(tài)性檢驗(yàn)、方差齊性檢驗(yàn)檢查數(shù)據(jù)的錯(cuò)誤,辨認(rèn)奇異值第十八頁,共六十九頁,編輯于2023年,星期一第十九頁,共六十九頁,編輯于2023年,星期一

Options:缺失值處理

1、某觀測在所選擇的變量中有缺失值時(shí),該觀測不參與全部分析

2、僅在與該變量有關(guān)的分析中視為缺失值

3、缺失值做為一個(gè)組別輸出第二十頁,共六十九頁,編輯于2023年,星期一Plots:1、輸出圖形:箱式圖、莖葉圖、直方圖

2、正態(tài)性檢驗(yàn)及圖示

3、Levene方差齊性檢驗(yàn)第二十一頁,共六十九頁,編輯于2023年,星期一例:居民儲(chǔ)蓄調(diào)查描述城鄉(xiāng)居民存取款金額的差別檢查存取款金額的離群點(diǎn)(Outliers)和極端值(Extremevalues)對存取款金額進(jìn)行正態(tài)性檢驗(yàn)和方差齊性檢驗(yàn),以便進(jìn)一步選擇分析方法。第二十二頁,共六十九頁,編輯于2023年,星期一第二十三頁,共六十九頁,編輯于2023年,星期一第二十四頁,共六十九頁,編輯于2023年,星期一第二十五頁,共六十九頁,編輯于2023年,星期一第二十六頁,共六十九頁,編輯于2023年,星期一樣本量n<=50時(shí),第二十七頁,共六十九頁,編輯于2023年,星期一存(取)款金額Stem-and-LeafPlotforA13=城鎮(zhèn)戶口

FrequencyStem&Leaf77.000.00111122222233334555555555555666778&34.001.0000000000003455&12.002.00000&12.003.00000&5.004.0&13.005.0000004.006.5&8.007.000&4.008.0&4.009.0&11.0010.0000016.00Extremes(>=15000)Stemwidth:1000Eachleaf:2case(s)

&denotesfractionalleaves.第二十八頁,共六十九頁,編輯于2023年,星期一箱式圖是在剔除了變量的極端值、離群點(diǎn)后計(jì)算統(tǒng)計(jì)量并繪制的。中間的黑粗線為中位數(shù),紅框?yàn)樗姆治婚g距的范圍,上下兩個(gè)細(xì)線為最大、最小值。

第二十九頁,共六十九頁,編輯于2023年,星期一總體和樣本樣本的基本描述由樣本推斷整體基本概念統(tǒng)計(jì)推斷第三十頁,共六十九頁,編輯于2023年,星期一總體和樣本第三十一頁,共六十九頁,編輯于2023年,星期一樣本的描述第三十二頁,共六十九頁,編輯于2023年,星期一由樣本推斷整體——抽樣第三十三頁,共六十九頁,編輯于2023年,星期一由樣本推斷整體——估計(jì)第三十四頁,共六十九頁,編輯于2023年,星期一由樣本推斷整體——參數(shù)估計(jì)參數(shù)估計(jì)的方法有點(diǎn)估計(jì)和區(qū)間估計(jì)二種.區(qū)間估計(jì)給出總體未知參數(shù)所在的可能區(qū)間即置信區(qū)間,它會(huì)隨樣本的不同而不同,可以解決參數(shù)估計(jì)的精確度與可靠性問題,它能夠以一定的置信度保證估計(jì)的正確性.置信度與精確度關(guān)系:一般情況下,置信度越高,允許誤差越大,精確度越低.在樣本容量一定時(shí),通常是在確保一定置信度的前提下提高精確度.掌握的樣本不同所用區(qū)間估計(jì)的公式不同.第三十五頁,共六十九頁,編輯于2023年,星期一是否為大樣本n≥30σ值是否已知σ值是否已知總體是否近似正態(tài)分布用樣本標(biāo)準(zhǔn)差s估計(jì)δ用樣本標(biāo)準(zhǔn)差s估計(jì)δ將樣本容量增加到n≥30以便進(jìn)行區(qū)間估計(jì)是是是是否否否否總體均值區(qū)間估計(jì)程序總體均值的區(qū)間估計(jì)第三十六頁,共六十九頁,編輯于2023年,星期一簡單隨機(jī)抽樣待估計(jì)參數(shù)已知條件置信區(qū)間正態(tài)總體,σ2已知正態(tài)總體,σ2未知n<30非正態(tài)總體,n≥30σ未知時(shí),用S有限總體,n≥30(不重復(fù))總體均值(μ)σ未知時(shí),用S(一)一個(gè)總體均值的區(qū)間估計(jì)第三十七頁,共六十九頁,編輯于2023年,星期一檢驗(yàn)值欄選擇置信度和控制缺失值處理檢驗(yàn)變量欄第三十八頁,共六十九頁,編輯于2023年,星期一(三)兩個(gè)總體均值之差的區(qū)間估計(jì)待估計(jì)參數(shù)已知條件置信區(qū)間兩個(gè)正態(tài)總體已知兩個(gè)正態(tài)總體未知但相等兩個(gè)非正態(tài)總體n1,n2≥30兩個(gè)總體均值之差μ1-μ2第三十九頁,共六十九頁,編輯于2023年,星期一打開Independent-SamplesTTest對話框,檢驗(yàn)變量欄分組變量欄,只能有一個(gè)分組變量定義分組按鈕第四十頁,共六十九頁,編輯于2023年,星期一案例11、學(xué)生對教學(xué)改革態(tài)度的分析(onesample)

某校在對實(shí)行掛牌上課教學(xué)改革措施的效果評價(jià)中,隨機(jī)抽選了60位學(xué)生進(jìn)行態(tài)度調(diào)查,他們的10項(xiàng)態(tài)度量表的態(tài)度反映資料如下:掛牌上課態(tài)度反映得分(X)人數(shù)(f)10—2020—3030—4040—5050—6060—702610122010合計(jì)60第四十一頁,共六十九頁,編輯于2023年,星期一案例1

(1分表示“很不同意”,7分表示“很同意”,將10項(xiàng)態(tài)度分累加后得一總態(tài)度分,這種量叫7級(jí)李克累加量表):試計(jì)算:(1)學(xué)生態(tài)度得分的平均值和標(biāo)準(zhǔn)差;(2)構(gòu)造學(xué)生態(tài)度得分平均值的98%置信區(qū)間。第四十二頁,共六十九頁,編輯于2023年,星期一操作步驟:(1)定義變量X和f,X為組中值,輸入數(shù)據(jù)資料;(2)選擇AnalyzeComparemeansone-sampleTTest(3)將變量X放入Test欄中(4)激活子對話框,置信度為98%,單擊按鈕,返回one-sampleTTest主對話框;(5)單擊按鈕執(zhí)行。Options…ContinueOK第四十三頁,共六十九頁,編輯于2023年,星期一T-Test

第四十四頁,共六十九頁,編輯于2023年,星期一結(jié)論:表1:學(xué)生態(tài)度得分的平均值為47分,標(biāo)準(zhǔn)差為13.6295分.表2:以98%的置信區(qū)間估計(jì)學(xué)生總體態(tài)度得分平均值的置信區(qū)間為(42.7925,51.2075)從中可以反映出學(xué)生對掛牌上課這一教改措施普遍贊成,但并不十分擁護(hù),可見還需進(jìn)一步改進(jìn)和完善.第四十五頁,共六十九頁,編輯于2023年,星期一案例2___電視廣告平均受益量的估計(jì)2、某電視臺(tái)廣告部想要估計(jì)一下各企業(yè)在該電臺(tái)的黃金時(shí)間播放電視廣告后的一個(gè)月內(nèi)的平均受益量.為此他們抽取了33家播放廣告的同類企業(yè)的隨機(jī)樣本,資料如下:

該電視臺(tái)想以95%的置信度宣布平均受益量(平均利潤增長量),試構(gòu)造適當(dāng)?shù)闹眯艆^(qū)間.第四十六頁,共六十九頁,編輯于2023年,星期一案例2企業(yè)序號(hào)1234567891011利潤增量(萬元)7.38.67.76.59.48.37.110.25.49.28.8企業(yè)序號(hào)1213131415161718192021利潤增量(萬元)9.76.94.311.28.28.77.69.16.68.58.9企業(yè)序號(hào)2324252627282930313233利潤增量(萬元)10.412.814.67.511.76.013.213.69.05.99.6第四十七頁,共六十九頁,編輯于2023年,星期一解:該電視臺(tái)宣布的平均受益量應(yīng)該是最小受益量,故構(gòu)造置信下限.設(shè)X為企業(yè)利潤增量.操作步驟:

(1)定義變量X輸入數(shù)據(jù)資料;(2)選擇AnalyzeComparemeansone-sampleTTest(3)將變量X放入Test欄中(4)激活

子對話框,置信度改為90%,單擊按鈕,返回one-sampleTTest主對話框;(5)單擊OK按鈕執(zhí)行Options…Continue第四十八頁,共六十九頁,編輯于2023年,星期一T-Test第四十九頁,共六十九頁,編輯于2023年,星期一結(jié)論:表1:33家平均受益量為8.8636萬元,標(biāo)準(zhǔn)差為2.4027萬元.表2:該項(xiàng)電視臺(tái)可以95%的置信度宣布在該電臺(tái)黃金時(shí)間做廣告給企業(yè)帶來的平均受益量至少在8.012萬元以上.第五十頁,共六十九頁,編輯于2023年,星期一2、Paired-SamplesTTest過程配對變量欄當(dāng)前選擇欄選擇項(xiàng)按鈕第五十一頁,共六十九頁,編輯于2023年,星期一實(shí)例分析4___吸煙有害廣告作用的分析(Paired)

形形色色的廣告已深入到社會(huì)各個(gè)方面,與人民生活密不可分.成功的廣告將留給人們較深的印象,并帶給企業(yè)豐厚的回報(bào),如何鑒定廣告的效果,如何選擇最佳的廣告制作,對此西方國家更多地采用統(tǒng)計(jì)方法來判斷,舉例如下:

為了研究吸煙有害廣告對吸煙者減少吸煙量甚至戒煙是否有作用,從某吸煙者中隨機(jī)抽取33位吸煙者,調(diào)查他們在觀看廣告前后的每天吸煙量(支)數(shù)據(jù)如下表.試問影片對他們的吸煙量有無產(chǎn)生作用?為了支持你的答案,請構(gòu)造一個(gè)99%的置信區(qū)間.第五十二頁,共六十九頁,編輯于2023年,星期一吸煙者編號(hào)1234567891011看前X1(支)看后X2(支)20181515141011101213161219152620221716799吸煙者編號(hào)1213141516171819202122看前X1(支)看后X2(支)1710333425208441401910263016163120271862吸煙者編號(hào)2324252627282930313233看前X1(支)看后X2(支)13112422222548504134669133827251129102821第五十三頁,共六十九頁,編輯于2023年,星期一解:配對樣本的試驗(yàn),比較觀看前后平均數(shù)的大小可解決第一個(gè)問題,求出兩平均數(shù)之差的99%的雙側(cè)置信區(qū)間可解答第二個(gè)問題.操作步驟:1)定義變量X1和X2,輸入數(shù)據(jù);(2)選擇AnalyzeComparemeansPaired-samplesTTest(3)將變量X1和X2放入Test欄中(4)激活Options…

子對話框,置信度改為99%,單擊Continue按鈕,返回Paired-samplesTTest主對話框;(5)單擊OK按鈕執(zhí)行第五十四頁,共六十九頁,編輯于2023年,星期一結(jié)論:表1:顯示觀看影片前的平均每日吸煙量約為21.5758支.觀看影片后的平均每日吸煙量約為17.5758支,說明該影片發(fā)生了作用.表2:反映了影片觀看前與后存在著顯著相關(guān)關(guān)系,相關(guān)系數(shù)為0.878.表3:顯示了前后兩個(gè)總體平均每日吸煙量之差的99%置信區(qū)間為(1.4888,6.5112),這意味著不管隨機(jī)抽到哪幾對樣本單位做調(diào)查,均有99%的把握保證,觀看影片前的平均每日吸煙量大于觀看影片后的平均每日吸煙量之差在(1.4888支至6.5112支之間,即大約在2—7支之間.第五十五頁,共六十九頁,編輯于2023年,星期一假設(shè)檢驗(yàn)—基本概念原假設(shè)(nullhypothesis)H0:在統(tǒng)計(jì)學(xué)中,把需要通過樣本去推斷正確與否的命題,稱為原假設(shè),又稱虛無假設(shè)或零假設(shè).它常常是根據(jù)已有資料或經(jīng)過周密考慮后確定的.備擇假設(shè)(alternativehypothesis)H1:也叫擇一假設(shè),原假設(shè)被否定之后應(yīng)選擇的與原假設(shè)邏輯對立的假設(shè).顯著性水平(significantlevel)α:確定一個(gè)事件為小概率事件的標(biāo)準(zhǔn),稱為檢驗(yàn)水平.亦稱為顯著性水平.通常取α=0.05,0.01,0.1)第五十六頁,共六十九頁,編輯于2023年,星期一H0——原假設(shè)(nullhypothesis),

H1——備擇假設(shè)(alternativehypothesis)

雙尾檢驗(yàn)(twotailedtset):H0:μ=μ0

,H1:μ≠μ0單尾檢驗(yàn)(onetailedtset)

:H0:μ≥μ0

,H1:μ<μ0H0:μ≤μ0

,H1:μ>μ0

假設(shè)檢驗(yàn)就是根據(jù)樣本觀察結(jié)果對原假設(shè)(H0)進(jìn)行檢驗(yàn),接受H0,就否定H1;拒絕H0,就接受H1。假設(shè)及檢驗(yàn)的形式:第五十七頁,共六十九頁,編輯于2023年,星期一假設(shè)檢驗(yàn)問題的基本步驟:(1)提出假設(shè):原假設(shè)H0及備擇假設(shè)H1(2)選擇適當(dāng)?shù)臋z驗(yàn)統(tǒng)計(jì)量,并指出H0成立時(shí)該檢驗(yàn)統(tǒng)計(jì)量所服從的抽樣分布

(3)根據(jù)給定的顯著性水平,查表確定相應(yīng)的臨界值,并建立相應(yīng)的小概率事件,

(4)根據(jù)樣本觀察值計(jì)算檢驗(yàn)統(tǒng)計(jì)量的值H0(5)將檢驗(yàn)統(tǒng)計(jì)量的值與臨界值比較,當(dāng)檢驗(yàn)統(tǒng)計(jì)量的值落入拒絕域時(shí)拒絕H0而接受H1;否則不能拒絕H0,可接受H0。第五十八頁,共六十九頁,編輯于2023年,星期一§4.2假設(shè)檢驗(yàn)的方法假設(shè)檢驗(yàn)的方法有三種:置信區(qū)間法\接受域法\P值法.置信區(qū)間法即是根據(jù)樣本資料求出在一定把握程度下的總體參數(shù)的置信區(qū)間,若該區(qū)間包括了則不能拒絕H0,否則拒絕H0接受域法則是先根據(jù)顯著性水平確定相應(yīng)的側(cè)分點(diǎn)即接受域如,然后計(jì)算在H0

成立下的檢驗(yàn)統(tǒng)計(jì)量的值Z,若其落在接受域內(nèi)則不能拒絕H0,否則拒絕H0第五十九頁,共六十九頁,編輯于2023年,星期一P值說明(α=0.05)小于0.010.01~0.05大于0.05具有高度統(tǒng)計(jì)顯著性,非常強(qiáng)的證據(jù)拒絕原假設(shè)具有統(tǒng)計(jì)顯著性,適當(dāng)?shù)淖C據(jù)可拒絕原假設(shè)較不充分的證據(jù)拒絕原假設(shè)—接受第六十頁,共六十九頁,編輯于2023年,星期一已知原始數(shù)據(jù)資料的假設(shè)檢驗(yàn)(CompareMeans)OneSampleTTest過程主要用于單個(gè)總體均值的假設(shè)檢驗(yàn).例1:某廠用自動(dòng)包裝機(jī)裝箱,在正常情況下,每箱重量服從正態(tài)分布(100,1.22),某日開工后,隨機(jī)抽測12箱,重量如下(單位:公斤)99.2\98.8\100.3\100.6\99.0\99.5\100.7\100.9\99.1\99.3\100.1\98.6問包裝機(jī)工作是否正常?(α=0.05方差不變)第六十一頁,共六十九頁,編輯于2023年,星期一操作步驟:這是已知原始數(shù)據(jù)的單個(gè)總體均值雙尾檢驗(yàn)問題.依題意,設(shè)H0:μ=100,H1:μ≠100(1)定義變量X,輸入數(shù)據(jù);(2)選擇Analyze

CompareMeans

One–SampleTTest(3)將變量X放置Test欄中,并在Test框中輸入數(shù)據(jù)100(4)單擊OK按鈕執(zhí)行.第六十二頁,共六十九頁,編輯于2023年,星期一One-SampleTTest第六十三頁,共六十九頁,編輯于2023年,星期一T-Test第六十四頁,共六十九頁,編輯于2023年,星期一結(jié)果說明:從表中可以看出,樣本單位的平均重量為99.675公斤檢驗(yàn)統(tǒng)計(jì)量t=-1.403自由度df=11雙尾P=0.188因?yàn)椋兄荡笥讦粒越邮蹾

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論