第二講樣本描述性統(tǒng)計與假設(shè)檢驗演示文稿_第1頁
第二講樣本描述性統(tǒng)計與假設(shè)檢驗演示文稿_第2頁
第二講樣本描述性統(tǒng)計與假設(shè)檢驗演示文稿_第3頁
第二講樣本描述性統(tǒng)計與假設(shè)檢驗演示文稿_第4頁
第二講樣本描述性統(tǒng)計與假設(shè)檢驗演示文稿_第5頁
已閱讀5頁,還剩50頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第二講樣本描述性統(tǒng)計與假設(shè)檢驗演示文稿當前第1頁\共有55頁\編于星期三\10點(優(yōu)選)第二講樣本描述性統(tǒng)計與假設(shè)檢驗當前第2頁\共有55頁\編于星期三\10點數(shù)據(jù)分析-何帆基本數(shù)學模型-集中趨勢統(tǒng)計量算術(shù)平均數(shù)樣本數(shù)據(jù)的總和除以樣本個數(shù)是樣本數(shù)據(jù)集中趨勢中最常用的統(tǒng)計量公式在不分組的情況下f都為1當前第3頁\共有55頁\編于星期三\10點數(shù)據(jù)分析-何帆基本數(shù)學模型-集中趨勢統(tǒng)計量中位數(shù)(Median)先將樣本按升序或降序排列樣本數(shù)為奇,中間的數(shù),樣本為偶,取中間兩個的平均例如:下列兩組樣本的中位數(shù)為___?112495232012542236當前第4頁\共有55頁\編于星期三\10點數(shù)據(jù)分析-何帆基本數(shù)學模型-集中趨勢統(tǒng)計量眾數(shù)(Mode)樣本數(shù)據(jù)出現(xiàn)頻數(shù)最多的那個數(shù)不受極值影響,可能有多個例如,下面一組樣本的眾數(shù)為_____? 123219463218當前第5頁\共有55頁\編于星期三\10點數(shù)據(jù)分析-何帆基本數(shù)學模型-集中趨勢統(tǒng)計量調(diào)整平均數(shù)(TrimmedMean)將樣本數(shù)據(jù)排序后,按照一定的比率去掉兩端最大值,最小值,對剩下的數(shù)據(jù)求平均Explore功能中的調(diào)整平均數(shù)默認兩端各去掉2.5%后,對剩下的95%的數(shù)據(jù)求平均當前第6頁\共有55頁\編于星期三\10點數(shù)據(jù)分析-何帆基本數(shù)學模型-集中趨勢統(tǒng)計量幾何平均數(shù)(GeometricMean)加權(quán)幾何平均數(shù)簡單幾何平均數(shù)

f=1當前第7頁\共有55頁\編于星期三\10點數(shù)據(jù)分析-何帆基本數(shù)學模型-集中趨勢統(tǒng)計量調(diào)和平均數(shù)(Harmonic)是n個數(shù)的倒數(shù)平均數(shù)的倒數(shù)適用于平均價格、平均速度方面的計算和分析公式當前第8頁\共有55頁\編于星期三\10點數(shù)據(jù)分析-何帆基本數(shù)學模型-集中趨勢統(tǒng)計量四分位數(shù)(Quartiles)25分位數(shù):最低數(shù)和中位數(shù)之間的中位數(shù)75分位數(shù):最高數(shù)和中位數(shù)之間的中位數(shù)其他分位數(shù)當前第9頁\共有55頁\編于星期三\10點數(shù)據(jù)分析-何帆基本數(shù)學模型-離散趨勢統(tǒng)計量極差(Range)

最大值-最小值 穩(wěn)定性差平均差(AverageDifference)

各樣本數(shù)據(jù)與均值間差異的絕對值的均值方差(Variance)標準差(StandardDeviation,StdDev)

方差的算術(shù)方根當前第10頁\共有55頁\編于星期三\10點數(shù)據(jù)分析-何帆基本數(shù)學模型-離散趨勢統(tǒng)計量標準誤(StandardError,S.D.Mean)

是樣本平均數(shù)的標準差 由于樣本抽取的隨機性,每次抽取的樣本不一,樣本均值不一??紤]所有被抽取的樣本均值,他們的標準差就是標準誤。當前第11頁\共有55頁\編于星期三\10點數(shù)據(jù)分析-何帆基本數(shù)學模型偏度(Skewness)

反映數(shù)據(jù)分布不對稱的一個數(shù)字特征 當數(shù)據(jù)為正態(tài)分布時,偏度為零Ⅰ(α=0)II(α>0)Ⅲ(α<0)當前第12頁\共有55頁\編于星期三\10點數(shù)據(jù)分析-何帆基本數(shù)學模型峰度(Kurtosis)

是以正態(tài)分布為標準描述該分布的密度的形狀是陡峭還是平坦的一個數(shù)字特征。當數(shù)據(jù)為正態(tài)分布時峰度為零Ⅱ(β>0)Ⅰ(β=0)Ⅲ(β<0)當前第13頁\共有55頁\編于星期三\10點數(shù)據(jù)分析-何帆頻數(shù)分析過程功能菜單:Analyze->DescriptiveStatistics->Frequencies對話框:當前第14頁\共有55頁\編于星期三\10點數(shù)據(jù)分析-何帆Statistics對話框分位數(shù)集中趨勢統(tǒng)計量偏度和峰度離散趨勢統(tǒng)計量當前第15頁\共有55頁\編于星期三\10點數(shù)據(jù)分析-何帆Chart按鈕選擇圖形定義是按照頻數(shù)還是按百分比作圖當前第16頁\共有55頁\編于星期三\10點數(shù)據(jù)分析-何帆應(yīng)用實例例1對統(tǒng)計出來的紅球和值,進行繪制頻數(shù)表、直方圖;計算最大最小值,均數(shù)、標準差、中位數(shù)M、p2.5和p97.5,并考察偏度和峰度。當前第17頁\共有55頁\編于星期三\10點數(shù)據(jù)分析-何帆數(shù)據(jù)描述過程是否保存變量的標準化數(shù)據(jù)當前第18頁\共有55頁\編于星期三\10點數(shù)據(jù)分析-何帆Option按鈕選擇顯示的次序選擇統(tǒng)計量當前第19頁\共有55頁\編于星期三\10點數(shù)據(jù)分析-何帆數(shù)據(jù)探察過程功能菜單ExploreExplore過程主要用于對資料的性質(zhì)、分布特點等完全不清楚時,故又稱之為探索性分析。在一般描述性統(tǒng)計指標的基礎(chǔ)上,增加有關(guān)數(shù)據(jù)其他特征的文字與圖形描述,如莖葉圖、箱圖等,顯得更加詳細、全面,有助于用戶制定繼續(xù)分析的方案當前第20頁\共有55頁\編于星期三\10點數(shù)據(jù)分析-何帆數(shù)據(jù)探察過程對話框因變量分組變量樣本標簽當前第21頁\共有55頁\編于星期三\10點數(shù)據(jù)分析-何帆Statistics按鈕描述性統(tǒng)計反映集中趨勢的穩(wěn)健估計量樣本異常嫌疑值,最大最小5個四分數(shù)當前第22頁\共有55頁\編于星期三\10點數(shù)據(jù)分析-何帆Statistics按鈕Descriptives復(fù)選框:輸出均數(shù)、中位數(shù)、眾數(shù)、5%修正均數(shù)、標準誤、方差、標準差、最小值、最大值、全距、四分位全距、峰度系數(shù)、峰度系數(shù)的標準誤、偏度系數(shù)、偏度系數(shù)的標準誤及指定的均數(shù)可信區(qū)間。M-estimators復(fù)選框:作中心趨勢的最大似然化的穩(wěn)健估計量,輸出四個不同權(quán)重的最大似然確定數(shù)。Outliers復(fù)選框:輸出五個最大值與五個最小值。Percentiles復(fù)選框:輸出第5%、10%、25%、50%、75%、90%、95%位數(shù)當前第23頁\共有55頁\編于星期三\10點數(shù)據(jù)分析-何帆Plots按鈕設(shè)置多個變量時箱型圖的形式當前第24頁\共有55頁\編于星期三\10點數(shù)據(jù)分析-何帆Option按鈕剔除缺失值成對剔除缺失值單獨分組,用頻數(shù)表標出當前第25頁\共有55頁\編于星期三\10點數(shù)據(jù)分析-何帆實例應(yīng)用例2以例1數(shù)據(jù)為例,做Explore過程統(tǒng)計,畫出莖葉圖,和箱形圖。當前第26頁\共有55頁\編于星期三\10點假設(shè)檢驗

--平均數(shù)比較與T檢驗當前第27頁\共有55頁\編于星期三\10點數(shù)據(jù)分析-何帆主要內(nèi)容假設(shè)檢驗一般理論分組平均數(shù)比較單一樣本T檢驗配對樣本T檢驗當前第28頁\共有55頁\編于星期三\10點數(shù)據(jù)分析-何帆問題的提出例3某工廠用包裝機包裝奶粉,額定標準為每袋凈重0.5kg.設(shè)包裝機稱得奶粉重量X服從正態(tài)分布,據(jù)經(jīng)驗知其標準差σ=0.015(kg).為檢驗包裝機的工作是否正常,隨機抽取包裝的奶粉9袋,稱得重量為

0.4990.5150.5080.5120.4980.5150.5160.5130.524

問該包裝機工作是否正常?當前第29頁\共有55頁\編于星期三\10點數(shù)據(jù)分析-何帆假設(shè)檢驗一般理論基本任務(wù):根據(jù)樣本信息對未知總體或其數(shù)字特征的假設(shè)作出合理的判斷基本原理:小概率事件在一次試驗中幾乎不可能發(fā)生

H0

—原假設(shè)H1

—備擇假設(shè)(對立假設(shè))

對于例1可提出如下統(tǒng)計假設(shè):

H0:μ=μ0

=0.5H1:μ≠

μ0=0.5當前第30頁\共有55頁\編于星期三\10點數(shù)據(jù)分析-何帆假設(shè)檢驗一般理論對H0

進行檢驗:(1)尋找檢驗統(tǒng)計量(2)對給定小概率,尋找拒絕域0

P{(x1,x2,…,xn)0|H0

為真時}=接受域1

:1∪0=(樣本空間)當樣本觀測值:

(x1,x2,…,xn)0

時,拒絕H0

(x1,x2,…,xn)1

時,接受H1

當前第31頁\共有55頁\編于星期三\10點數(shù)據(jù)分析-何帆假設(shè)檢驗一般理論什么是顯著性水平是一個概率值 原假設(shè)為真時,拒絕原假設(shè)的概率 被稱為抽樣分布的拒絕域 表示為α(alpha)

常用的α值有0.01,0.05,0.10由研究者事先確定當前第32頁\共有55頁\編于星期三\10點數(shù)據(jù)分析-何帆假設(shè)檢驗一般理論什么是P值?是一個概率值如果原假設(shè)為真,P-值是抽樣分布中大于或小于樣本統(tǒng)計量的概率左側(cè)檢驗時,P-值為曲線下方小于等于檢驗統(tǒng)計量部分的面積右側(cè)檢驗時,P-值為曲線下方大于等于檢驗統(tǒng)計量部分的面積被稱為觀察到的(或?qū)崪y的)顯著性水平當前第33頁\共有55頁\編于星期三\10點數(shù)據(jù)分析-何帆雙側(cè)檢驗的P值當前第34頁\共有55頁\編于星期三\10點數(shù)據(jù)分析-何帆左側(cè)檢驗的P值當前第35頁\共有55頁\編于星期三\10點數(shù)據(jù)分析-何帆右側(cè)檢驗的P值當前第36頁\共有55頁\編于星期三\10點數(shù)據(jù)分析-何帆假設(shè)檢驗一般理論如何利用P值進行決策判斷?單側(cè)檢驗若p-值>α,不能拒絕H0若p-值≤α,拒絕H0

雙側(cè)檢驗若p-值>

α/2,不能拒絕H0若p-值≤α/2,拒絕H0當前第37頁\共有55頁\編于星期三\10點數(shù)據(jù)分析-何帆假設(shè)檢驗一般理論檢驗分類樣本平均數(shù)與總體平均數(shù)的比較檢驗(單個樣本)兩獨立樣本平均數(shù)的比較兩個配對樣本平均數(shù)的比較檢驗多個平均數(shù)的樣本檢驗成數(shù)假設(shè)檢驗,方差或標準差假設(shè)檢驗分布檢驗:正態(tài)分布檢驗、均勻分布檢驗非參數(shù)檢驗:χ2檢驗法、F—檢驗法等。

當前第38頁\共有55頁\編于星期三\10點數(shù)據(jù)分析-何帆分組平均數(shù)比較問題描述 某醫(yī)師測得40人的血紅蛋白值(g%),試比較男性和女性的血紅蛋白值是否有差異?

(數(shù)據(jù)見血紅蛋白值.sav)

分組平均數(shù)比較是為了比較同一個總體抽樣中不同類別的均數(shù)的差異性當前第39頁\共有55頁\編于星期三\10點數(shù)據(jù)分析-何帆分組平均數(shù)比較菜單Analyze->CompareMeans->Means點擊彈出如下對話框主要功能分組計算均值對均值進行差異比較當前第40頁\共有55頁\編于星期三\10點數(shù)據(jù)分析-何帆分組平均數(shù)比較對分組變量進行單因素方差分析,并計算用于度量變量相關(guān)程度的eta值檢驗線性相關(guān)性,實際上就是上面的單因素方差分析當前第41頁\共有55頁\編于星期三\10點數(shù)據(jù)分析-何帆分組平均數(shù)比較-結(jié)果分析F:統(tǒng)計量的值Sig.觀測顯著性水平即P值當前第42頁\共有55頁\編于星期三\10點數(shù)據(jù)分析-何帆單一樣本T檢驗用于檢驗樣本平均與總體平均數(shù)的差異統(tǒng)計量:T統(tǒng)計量 其中S是修正的樣本標準差主要檢驗?zāi)骋粋€均值是否和某一固定值相符合。當前第43頁\共有55頁\編于星期三\10點數(shù)據(jù)分析-何帆單一樣本T檢驗例4

前面給出的血紅蛋白值的均值是否等于11,12,13當前第44頁\共有55頁\編于星期三\10點數(shù)據(jù)分析-何帆單一樣本T檢驗當前第45頁\共有55頁\編于星期三\10點數(shù)據(jù)分析-何帆單一樣本T檢驗結(jié)果分析t統(tǒng)計量值自由度P值置信區(qū)間的上下限當前第46頁\共有55頁\編于星期三\10點數(shù)據(jù)分析-何帆練習1有一種新型農(nóng)藥防治柑桔紅蜘蛛,進行了9個小組的實驗,其防治效果為:

95%,92%,88%,92%,93%,95%,89%,98%,92%與原用農(nóng)藥的防治效果90%比較,分析其效果是否高于原用農(nóng)藥。當前第47頁\共有55頁\編于星期三\10點數(shù)據(jù)分析-何帆練習2在有小麥叢矮病的麥田里,調(diào)查了13株病株和11株健株的植株高度,分析健株高度是否高于病株?其調(diào)查數(shù)據(jù)如下:健株26.032.437.337.343.247.351.855.857.864.065.3

病株16.719.819.823.323.425.036.037.341.441.745.748.257.8該數(shù)據(jù)保存在“叢矮病的麥田.SAV”文件中當前第48頁\共有55頁\編于星期三\10點數(shù)據(jù)分析-何帆配對樣本T檢驗配對樣本 是相對獨立樣本而言的,指一個樣本在不同時間做了兩次試驗,或者有兩個類似的記錄,從而比較其差異。例如:下列哪個屬于配對樣本?一班和二班的數(shù)學分析成績一班的期中和期末成績當前第49頁\共有55頁\編于星期三\10點數(shù)據(jù)分析-何帆配對樣本T檢驗問題陳述 例1某制鞋廠為比較用來做鞋后跟的兩種材料的質(zhì)量,隨機選取了15名男子,讓他們每人穿一雙新鞋,每雙鞋中有一只是用材料A作后跟的,另外一只是用材料B作后跟的,其厚度均為10cm,一個月以后再次測量其厚度,數(shù)據(jù)如下:當前第50頁\共有55頁\編于星期三\10點數(shù)據(jù)分析-何帆配對樣本T檢驗序號123456789101112131415材料A6.

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論