![醫(yī)學(xué)統(tǒng)計學(xué)基礎(chǔ) 第一講 緒論_第1頁](http://file4.renrendoc.com/view/5d097bc0975c90d25cabb6421fc7df2b/5d097bc0975c90d25cabb6421fc7df2b1.gif)
![醫(yī)學(xué)統(tǒng)計學(xué)基礎(chǔ) 第一講 緒論_第2頁](http://file4.renrendoc.com/view/5d097bc0975c90d25cabb6421fc7df2b/5d097bc0975c90d25cabb6421fc7df2b2.gif)
![醫(yī)學(xué)統(tǒng)計學(xué)基礎(chǔ) 第一講 緒論_第3頁](http://file4.renrendoc.com/view/5d097bc0975c90d25cabb6421fc7df2b/5d097bc0975c90d25cabb6421fc7df2b3.gif)
![醫(yī)學(xué)統(tǒng)計學(xué)基礎(chǔ) 第一講 緒論_第4頁](http://file4.renrendoc.com/view/5d097bc0975c90d25cabb6421fc7df2b/5d097bc0975c90d25cabb6421fc7df2b4.gif)
![醫(yī)學(xué)統(tǒng)計學(xué)基礎(chǔ) 第一講 緒論_第5頁](http://file4.renrendoc.com/view/5d097bc0975c90d25cabb6421fc7df2b/5d097bc0975c90d25cabb6421fc7df2b5.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
第一講緒論2015
1
醫(yī)學(xué)統(tǒng)計學(xué)基礎(chǔ)張敬旭周虹公共衛(wèi)生學(xué)院
聯(lián)系方式:82801222序號講課內(nèi)容SPSS演示及實習(xí)內(nèi)容1緒論、統(tǒng)計學(xué)中的基本概念數(shù)值變量的統(tǒng)計描述軟件簡介SPSS數(shù)據(jù)庫的編輯和使用用SPSS判斷頻數(shù)分布的類型計算均數(shù)、標準差等描述指標2參數(shù)估計和醫(yī)學(xué)參考值范圍兩組均數(shù)比較的假設(shè)檢驗:t檢驗方差分析計算總體均數(shù)的置信區(qū)間SPSS應(yīng)用實例:
t檢驗的操作及SPSS應(yīng)用實例方差分析的操作及結(jié)果34分類變量的統(tǒng)計描述兩組或多組率比較:卡方檢驗和趨勢分析非參數(shù)檢驗:兩組或多組比較的秩和檢驗直線相關(guān)與回歸率的計算,加權(quán)數(shù)據(jù)庫SPSS應(yīng)用實例:卡方檢驗的操作及結(jié)果SPSS應(yīng)用實例:非參數(shù)檢驗的操作及結(jié)果SPSS應(yīng)用實例:直線相關(guān)與回歸的操作及結(jié)果56考試醫(yī)學(xué)統(tǒng)計學(xué)基礎(chǔ)課程安排第一講緒論3基本內(nèi)容
統(tǒng)計描述統(tǒng)計推斷(1)統(tǒng)計推斷(2)數(shù)值變量頻數(shù)分布集中趨勢離散趨勢統(tǒng)計圖表抽樣誤差標準誤
tuF檢驗非參檢驗可信區(qū)間直線相關(guān)與回歸偏相關(guān)多元線性回歸分類變量相對數(shù)統(tǒng)計圖表u、
2檢驗非參檢驗可信區(qū)間Logistic回歸第一講緒論
4考核與成績平時成績30-40%:出勤,作業(yè),課堂討論與發(fā)言期終考試60-70%:開卷,計算機操作,上述6次課的內(nèi)容第一講緒論5參考書:1.王燕,安琳主編.衛(wèi)生統(tǒng)計學(xué).北京大學(xué)醫(yī)學(xué)出版社.2.魏宗舒、施錫銓等主譯.統(tǒng)計學(xué).中國統(tǒng)計出版社3.方積乾主編.衛(wèi)生統(tǒng)計學(xué).人民衛(wèi)生出版社,第五版,2003.84.余松林主編.醫(yī)學(xué)統(tǒng)計學(xué).人民衛(wèi)生出版社.2003.35.盧紋岱、朱一力等主編.SPSSFORWINDOWS從入門到精通.電子工業(yè)出版社6.王燕,康曉平主編.衛(wèi)生統(tǒng)計學(xué)教程.北京大學(xué)醫(yī)學(xué)出版社.2006年7月實習(xí)指導(dǎo):《醫(yī)學(xué)統(tǒng)計學(xué)實習(xí)指導(dǎo)》
第一講緒論一、研究工作的基本過程(步驟)
二、幾個重要的統(tǒng)計學(xué)概念
三、數(shù)值變量的統(tǒng)計描述第一講緒論7來自臨床研究的實例…人民醫(yī)院一位同學(xué),想做妊娠糖尿病的研究…問題:1.可能是哪個科的同學(xué)?
2.可能的研究題目有哪些?
例如:妊娠期糖代謝異常對妊娠結(jié)局的影響
第一講緒論8一、研究工作的基本步驟第一步研究設(shè)計(Design)第二步收集資料(Collectionofdata)第三步整理資料(Sortingdata)第四步分析資料(Analysisofdata)這四個步驟包括了一個研究的全部過程。第一講緒論9第一步:研究設(shè)計(design,開題報告)
意義:影響與危害,重要性目的:本研究的目的調(diào)查方法:橫斷面、病例對照、群組研究對象:納入和排除標準,樣本量計算研究內(nèi)容/指標:血糖值、巨大兒、早產(chǎn)兒、妊高癥
資料收集手段:問卷,測量(現(xiàn)場,實驗室),觀察進度:時間安排預(yù)期結(jié)果等:與目的相呼應(yīng)第一講緒論10設(shè)計時考慮以下因素(自學(xué)):基本要素:處理因素和非處理因素、受試對象、指標的選擇和觀察(準確性、靈敏性、穩(wěn)定性)基本原則:對照的原則(空白、安慰劑、自身)重復(fù)原則(樣本量)隨機化原則(隨機抽樣,隨機分配,隨機接受處理因素)樣本量估計(由指標和設(shè)計確定,計算公式不同)第一講緒論11第二步收集資料(collectionofdata)
是計劃的實施和執(zhí)行過程,常常需要漫長的時間,關(guān)鍵是保證前后的一致性和資料的完整性。注意:資料的真實性!問題:上述研究案例資料收集手段是什么?第一講緒論12問題:資料收集完成后,需要如何處理?第一講緒論13第三步整理資料(sortingdata)建立數(shù)據(jù)庫、過錄、錄入、邏輯檢錯等。SPSS數(shù)據(jù)庫的編輯和應(yīng)用SPSS編輯窗口,dataview,variableview添加刪除變量數(shù)據(jù)整理第一講緒論14建庫前準備1.變量清單變量清單應(yīng)包括全部要用到的問卷、檢查項目,對每個問卷或檢查項目要確立一個變量名,并定義變量類型、寬度、小數(shù)位數(shù)、缺省值等。2.選擇數(shù)據(jù)庫軟件若問卷的結(jié)構(gòu)簡單,要分析的變量不多時,可在spss或excel中直接建庫。否則建議使用epidata、access、foxpro等專門數(shù)據(jù)庫軟件錄入數(shù)據(jù)再用spss讀取。姓名性別血糖值出生體重出生身長是否妊高癥第一講緒論15SPSS操作窗口常用的主要操作窗口有三個數(shù)據(jù)編輯窗口語句編輯窗口結(jié)果輸出窗口第一講緒論201216數(shù)據(jù)編輯窗口數(shù)據(jù)視圖變量視圖第一講緒論17語句編輯窗口第一講緒論18結(jié)果輸出窗口第一講緒論19一、定義變量第一講緒論20變量的基本屬性:變量名稱變量類型標簽說明
…SPSSVariableView中的變量屬性編輯窗口10個方面第一講緒論21數(shù)據(jù)編輯窗口Name:變量名。允許用中文,但習(xí)慣上采用英文變量名。第一講緒論22定義變量名(Name):如果使用的是英文版SPSSForWindows,取變量名最好用英文或漢語拼音,而避免用中文,另外還要遵循以下原則:變量名的首字符應(yīng)該是英文字母,其后可以是任意字母、數(shù)字或一些諸如“@,1,_,$”的特殊字符,但不可以是空格或“!,?,',*”等。變量名的長度不能超過64字符,這意味著如果用中文取名,最多可以有32個字。變量名不允許重名,不能使用SPSS的保留字(Reservedkeywords),比如ALL,AND,BY,EQ,GE,GT,LE,LT,NE,NOT,OR,TO,WITH。變量名是不區(qū)分大小寫的。第一講緒論23變量名DataView:VariableView:變量名24數(shù)據(jù)編輯窗口Type:變量類型,常用數(shù)值型(Numeric)、字符型(String)、日期型(Date)。25定義變量類型(Type):圖1定義變量類型的對話框26各種變量類型的含義類型含義Numeric數(shù)值型Comma數(shù)值型,用逗點分隔Dot數(shù)值型,用小數(shù)點分隔ScientificNotation科學(xué)計數(shù)法Date日期型Dollar帶美元符號的數(shù)值型CustomCurrency用戶自定義型String字符串型27-數(shù)值型的變量值只能是數(shù)字,可以進行數(shù)學(xué)運算;-字符型的變量值可以是數(shù)字或字母、文字等,不能進行數(shù)學(xué)運算,可以進行邏輯運算;-為了進行統(tǒng)計分析,在大部分情況下變量類型為數(shù)值型,因此SPSS新建變量默認類型是數(shù)值型。28當統(tǒng)計資料是分類或等級資料時,一般進行編碼,錄入簡單,便于分析。例如:病人、對照(計數(shù))輕度、中度、重度(等級)編碼1、0病人=1對照=0編碼1、2、3輕度=1中度=2重度=329數(shù)據(jù)編輯窗口Width:變量寬度,默認為8。Decimals:小數(shù)位數(shù),默認為2。30注意:變量名一旦輸入,后面的變量屬性均顯示為系統(tǒng)默認值。選擇該框右側(cè)調(diào)整31標簽標簽是對變量的性質(zhì)或變量中各種數(shù)值的說明a.變量標簽Labelb.數(shù)值標簽Values(ValueLabels)變量標簽數(shù)值標簽32變量標簽(Label):Label:變量編碼,又稱為變量標簽,用于注釋變量名的含義。33變量標簽可以用中文,最多允許128個字,它不受SPSS保留字的限制。數(shù)據(jù)視圖下,將鼠標停留在有變量標簽的變量名字上,該標簽會自動彈出。34變量值標簽(Values):Label:變量編碼,又稱為變量標簽,用于注釋變量名的含義。Values:變量值編碼,又稱為變量值標簽,用于注釋變量值的含義。例如:變量gender,變量標簽為“性別”;變量值為1與2,變量值編碼:1為“男性”,2為“女性”。35單擊Value框右半部的省略號,會彈出下面對話框。變量值標簽最多允許60個字符。36Missing:缺失值。默認為系統(tǒng)缺失值,用“.”表示。定義變量缺省值(Missing):37定義變量缺失值(Missing):SPSS的缺失值分為兩類,即系統(tǒng)缺失值和用戶失省值。系統(tǒng)缺省值不需定義,系統(tǒng)自動生成,用”.”表示;用戶缺失值需定義,定義的缺失值將不被納入統(tǒng)計分析中或進行特殊處理。38數(shù)據(jù)編輯窗口Align:對齊方式。數(shù)值型變量默認右對齊(Right),字符型變量默認左對齊(Left)
。Measure:測度,包括三類:數(shù)值變量(Scale),名義變量或無序分類變量(Nominal),有序分類變量或等級變量(Ordinal)。Columns:列寬,默認為8。39二、錄入數(shù)據(jù)
各變量定義完畢后,將主界面切換回數(shù)據(jù)視圖,就可以看到一個數(shù)據(jù)文件的二維表格。表格的列為變量(variables),行為觀察單位(cases)。-在每個單元格中逐一錄入數(shù)據(jù)-切換單元格可用:回車、方向鍵、tab鍵40文件操作保存文件打開文件關(guān)閉文件SPSS文件類型41三、保存數(shù)據(jù)文件
點工具欄的磁盤圖標或在File菜單下選save或saveas可以保存數(shù)據(jù)文件。在彈出的對話框里,點variables可選擇只保存一部分變量,點“保存類型”的下拉菜單可選擇所存數(shù)據(jù)文件的類型。SPSS的默認數(shù)據(jù)格式是“.sav”。42SPSS主要文件類型SPSS數(shù)據(jù)文件:*.savSPSS結(jié)果輸出文件:*.spoSPSS語句文件:*.sps將錄入的文件存為文件名:表1.sav43增減變量和觀察單位
1.刪除一個變量列,另存為表1-1.sav2.刪除一個行,另存為表1-2.sav3.增加一個新的觀察單位(即增加一個新的行),另存為表1-3.sav。4.增加一個新的變量列,另存為表1-4.sav44練習(xí)1(實習(xí)一)建立數(shù)據(jù)庫并錄入數(shù)據(jù)(2人一組)練習(xí)1.2:添加、刪除變量(Variable)練習(xí)1.2:添加、刪除觀測量(Case)練習(xí)1.3:改變變量的屬性練習(xí)1.4:保存數(shù)據(jù)文件45問題:建立好變量和數(shù)據(jù)庫,數(shù)據(jù)輸入完成后,需要如何處理?46第四步分析資料(analysisofdata)
各種描述、統(tǒng)計檢驗方法、多元回歸等注意:選擇正確的分析方法
47二、幾個重要的統(tǒng)計概念總體與樣本變量與變量值同質(zhì)與變異誤差概率與頻率
48
前面案例中:
從2014年1~12月,人民醫(yī)院共收治了2,825例診斷并分娩的孕婦:
其中糖代謝異常215例
糖代謝正常的2,610例思考:1.其中總體是?2.其中樣本是?49問題:1.調(diào)查目的是什么?2.其中的調(diào)查對象是什么?3.調(diào)查例數(shù)是多少?妊娠期糖代謝異常對妊娠結(jié)局的影響501.總體與樣本(population&sample)總體:根據(jù)研究目的確定的同質(zhì)的觀察單位的全體。
問題:1.上述案例中的總體是?
糖代謝異常孕婦;糖代謝正常的孕婦
2.研究某地2012年活產(chǎn)嬰兒的出生體重
3.研究某藥治療慢性前列腺增生的療效
51分類:
有限總體:理論上說,觀察單位的數(shù)量是可知的、有限的。
無限總體:沒有時間和地點的限制,觀察單位總數(shù)量是不可知的。52鑒于總體的巨大或不可知性
能否研究其中的一部分?不可能或沒有必要對全體中的每一個進行研究53樣本(sample)概念:總體中有代表性的一部分。問題:上述案例中的樣本是?如何從中得到有代表性的一部分?得到多少合適呢?54設(shè)計:隨機原則保證樣本的代表性隨機應(yīng)體現(xiàn)在以下幾方面分組隨機:每個研究對象分配到不同處理組的機會相同,保證組間的可比性。實驗順序的隨機:其目的是平衡實驗順序?qū)Y(jié)果的可能影響。55隨機抽樣-樣本樣本量的計算公式-樣本量56其中的總體和樣本:
糖代謝異常中的孕婦215例,糖代謝正常的孕婦中2610例。從該地2012年出生嬰兒中隨機抽取200名,測量其出生體重。
對其中這些樣本進行研究即可!
5758
各組孕婦并發(fā)癥的發(fā)生率(%)組別巨大兒發(fā)生率妊高癥發(fā)生率妊娠糖尿?。℅DM)13.8
14.7
妊娠糖代謝異常(GIGT)9.48.5對照組7.57.9
與對照組比較P<0.05,13.8%是如何得到的?GDM109例,GIGT106例,糖代謝正常的孕婦2610例59問題:
1.請問研究者的目的是什么?是得到樣本的信息嗎?
2.如何從樣本的信息得到總體的信息?60從樣本“推回”到總體的方法:統(tǒng)計推斷(假設(shè)檢驗等),是統(tǒng)計分析的主要內(nèi)容。樣本總體統(tǒng)計推斷隨機抽樣從特殊到一般62
2.變量與變量值63
上面案例中:調(diào)查記錄了孕產(chǎn)婦和新生兒的基本情況:
孕期血糖
是否患病分娩方式
新生兒是否死亡
新生兒體重、身長
是否有出生缺陷
新生兒膽紅素值等的情況。問題:這些觀察指標是怎么得到的?變量:在確定了研究總體之后,研究者要對每個觀察單位的某項特征進行測量和觀測,這種特征稱為變量。變量值:變量的測得值或觀察值叫變量值,也叫做資料。資料分類:數(shù)值變量(計量資料)、分類變量(計數(shù)資料)、等級資料
變量和變量值(一個變量和多個變量值)65問題:上述案例中1.哪些是計量資料(數(shù)值變量)?2.哪些是計數(shù)資料(分類變量)?3.有什么不同?數(shù)值變量(Numericalvariable)也叫計量資料定義:通過度量衡的方法,測量每一個觀察單位的某項研究指標的量的大小,得到的一系列數(shù)據(jù)資料。特點:有度量衡單位多為連續(xù)性資料分類變量(Categoricalvariable)也叫計數(shù)資料定義:將全體觀測單位按照某種性質(zhì)或特征分組,然后再分別清點各組觀察單位的個數(shù)。特點:沒有度量衡單位多為間斷性資料68基本內(nèi)容問題:請大家看看兩類資料的處理有何不同?
統(tǒng)計描述統(tǒng)計推斷(1)統(tǒng)計推斷(2)數(shù)值變量頻數(shù)分布集中趨勢離散趨勢統(tǒng)計圖表抽樣誤差標準誤
tuF檢驗非參檢驗可信區(qū)間直線相關(guān)與回歸偏相關(guān)多元線性回歸分類變量相對數(shù)統(tǒng)計圖表u、
2檢驗非參檢驗可信區(qū)間Logistic回歸69
上述案例中,其中一個孕婦通過剖腹產(chǎn)生了一對男孩,體重分別是2800g和2585g
問題:為何兩個新生兒的體重不同?703.同質(zhì)與變異(variation)
概念:研究對象具有的相同的狀況或?qū)傩缘裙残苑Q同質(zhì)性;對于同質(zhì)的各觀察單位,其某變量值之間的差異,稱為變異。71
同質(zhì)事物個體間的差異。來源于一些未加控制或無法控制的甚至不明原因的因素。問題:1.如果沒有變異,上述案例中新生兒的體重會怎么樣?
2.沒有變異世界會怎么樣?72統(tǒng)計學(xué)就是研究變異的科學(xué)。透過偶然,發(fā)現(xiàn)必然!如何處理變異?734.誤差(Error)
統(tǒng)計上所說的誤差泛指測量值與真值之差,樣本指標與總體指標之差。主要有以下二種:系統(tǒng)誤差隨機誤差:隨機測量誤差、抽樣誤差
74系統(tǒng)誤差
概念:指數(shù)據(jù)搜集和測量過程中由于儀器不準確、標準不規(guī)范等原因,造成觀察結(jié)果呈傾向性的偏大或偏小,這種誤差稱為系統(tǒng)誤差。特點:具有累加性。問題:上述案例中,什么環(huán)節(jié)會出現(xiàn)系統(tǒng)誤差?一旦產(chǎn)生能否消除?75隨機測量誤差
概念:由于非人為的偶然因素,對于同一樣本多次測定結(jié)果不完全一樣,結(jié)果有時偏大有時偏小,無法預(yù)測,這種誤差叫隨機測量誤差。特點:沒有傾向性,在大量重復(fù)測量中,具有統(tǒng)計規(guī)律。問題:如何減少隨機測量誤差?(增加測量次數(shù),增加測量儀器的精度等)76
抽樣誤差
概念:樣本指標與總體指標之間的差別。特點:有抽樣,抽樣誤差就不可避免。統(tǒng)計上可以計算并在一定范圍內(nèi)控制抽樣誤差。問題:如何減少抽樣誤差?
減少抽樣誤差的方法:(1)改進抽樣方法(增加樣本的代表性)誤差從大到?。赫撼闃訂渭冸S機抽樣系統(tǒng)抽樣分層抽樣(2)增加樣本量;(3)選擇變異程度較小的研究指標。78問題:
哪類誤差用統(tǒng)計學(xué)方法可以控制?7980
5、頻率(frequency)與概率
(probability)
81隨機事件:在相同的條件下可以重復(fù)進行;所有試驗結(jié)果是明確可知的,并且不止一個;每次試驗總是出現(xiàn)若干結(jié)果中的一個,試驗前卻不可知。82頻率:一個隨機事件重復(fù)多次后,某一現(xiàn)象出現(xiàn)的結(jié)果的比例。(發(fā)生某現(xiàn)象的觀察單位數(shù)占可能發(fā)生該現(xiàn)象的觀察單位總數(shù)的比值)用(?。﹑表示(樣本的)。概率:描述隨機事件發(fā)生可能性大小的數(shù)值,常用(大)P來表示(總體的)。P大?。篜的大小在0和1之間。越接近1…,越接近0…83
從一袋瓜子里任意(別挑,或者閉上眼睛)拿了一粒,可它是壞的。這就是一個隨機事件,根據(jù)這個偶然事件如何估計這袋瓜子中壞瓜子占多少(百分比,大還是?。?/p>
隨便拿一個瓜子就是個壞的,說明壞瓜子容易被選中。84概率公理
在一次隨機抽樣中,容易出現(xiàn)的事件是高概率事件。
85
(假設(shè))一個袋子里有壞瓜子,也有好瓜子
(現(xiàn)象)從袋子里任意拿了一粒,可它是壞的。
(推論)隨便拿一個瓜子就是個壞的,說明壞瓜子容易被選中。
(結(jié)論)根據(jù)概率公理,壞瓜子被選中的概率不是低概率事件而是高概率事件,說明袋子里的瓜子中“壞瓜子占的比例最高”。86小概率:通常一個事件發(fā)生的可能性小于0.05就叫小概率事件。小概率原理:當一件事發(fā)生的概率很小時(小概率),那么只進行一次實驗中,一般不(大)可能發(fā)生。但是,根據(jù)常識,概率再小的事也是可能發(fā)生的。
統(tǒng)計學(xué)推斷的基本思想之一!
87思考:
1.對已經(jīng)發(fā)生的事件是否有意義?
2.概率對沒有發(fā)生的事件有意義嗎?88
各組孕婦并發(fā)癥的發(fā)生率(%)
組別巨大兒發(fā)生率妊高癥發(fā)生率GDM13.8
(可能性大)14.7
GIGT9.48.5對照組7.57.9
與對照組比較P<0.05問題:1.什么是已經(jīng)發(fā)生的事件(樣本信息)?什么是沒有發(fā)生的事件(總體信息)?
2.P<0.05說明了什么?
3.在這里,什么是一個小概率事件?89
2檢驗;t檢驗;方差分析;多元回歸;可信區(qū)間等結(jié)果的描述。P
α;P>α
α=0.05;P
0.05;P>0.05;(P
0.01;P>0.01;)問題:這些符號后面的結(jié)論是什么?與P有關(guān)的常見術(shù)語90主要內(nèi)容一、研究工作的基本過程(步驟)
二、幾個重要的統(tǒng)計學(xué)概念
三、數(shù)值變量的統(tǒng)計描述91基本內(nèi)容
統(tǒng)計描述統(tǒng)計推斷(1)統(tǒng)計推斷(2)數(shù)值變量頻數(shù)分布集中趨勢離散趨勢統(tǒng)計圖表抽樣誤差標準誤
tuF檢驗非參檢驗可信區(qū)間直線相關(guān)與回歸偏相關(guān)多元線性回歸分類變量相對數(shù)統(tǒng)計圖表u、
2檢驗非參檢驗可信區(qū)間Logistic回歸921.數(shù)值資料的頻數(shù)分布2.集中趨勢3.離散趨勢三、數(shù)值變量的統(tǒng)計描述931.頻數(shù)分布什么是頻數(shù)頻數(shù)分布的特點頻數(shù)分布的類型94問題:這些學(xué)生的身高分布規(guī)律是什么?實習(xí)指導(dǎo):實習(xí)一,表1.1某中學(xué)學(xué)生身高(cm),請繪制頻數(shù)表。95
頻數(shù):當匯總大量的原始數(shù)據(jù)時,把數(shù)據(jù)按類型分組,其中每個組的數(shù)據(jù)個數(shù),稱為該組的頻數(shù)。頻數(shù)表(頻數(shù)分布):表示各組及它們對應(yīng)的組頻數(shù)的表格稱為頻數(shù)表或頻數(shù)分布。96頻數(shù)表的編制編制步驟:
1.求極差(又稱全距)R:即最大值與最小值之差;
2.根據(jù)極差確定組數(shù)n、組距i,并寫出組段;
3.列表劃記。97本例資料,最小值為144cm,最大值為176cm,故極差(全距)R=176-144=32cm組數(shù)不宜太多,也不宜太少。一般根據(jù)樣本量的多少分成8-15組。理論上組距等于極差除以組數(shù)。但不拘泥于計算結(jié)果,而常常取一個比較好處理的數(shù)。本例,組距=32/10=3.2,我們?nèi)?cm。組段:上限、下限列表劃記第一講緒論201298某中學(xué)30名學(xué)生身高的頻數(shù)分布身高組段(1)劃記頻數(shù)f(2)144~11147~11150~11153~11114156~111115159~111111118162~1113165~112168~1113171~11174~17711合計3099
頻數(shù)表的主要用途:
1.揭示分布類型
2.發(fā)現(xiàn)特大值和特小值
3.計算集中趨勢指標與離散趨勢指標
頻數(shù)分布的類型:對稱分布與偏態(tài)分布(集中位置偏向小的一側(cè)叫正偏態(tài),反之叫負偏態(tài))
頻數(shù)分布的兩個特征:
集中趨勢與離散趨勢100練習(xí):用SPSS繪制頻數(shù)表SPSS直接輸出的是精確頻數(shù)表傳統(tǒng)意義頻數(shù)表(分布表)的作用:了解計量資料的分布規(guī)律。制作傳統(tǒng)意義上的頻數(shù)表需要利用Record過程對相應(yīng)變量進行重新賦值即可。101SPSS繪制頻數(shù)表的具體步驟將繪制頻數(shù)表的變量按從大到小的順序排列,(使用排序方法或Frequency過程)求出變量的最大值、最小值,計算全距(極差)。根據(jù)樣本量和極差確定組段數(shù),計算組距,寫出組段。使用Record過程建立一個新變量用于記錄組段號,列表劃記。使用組段號變量對原變量進行統(tǒng)計描述、繪圖等,即可得到需要的頻數(shù)表。102找出最大值、最小值(數(shù)據(jù)排序、描述性統(tǒng)計)
--data→sortcasessortby-身高
sortorder-ascending/decending--Analysze→DescriptiveStatistics →frequencies103重新賦值(重新編碼新變量組段)RecodeIntodifferentvariables104105舊及新的變量值106107108109分析組段頻數(shù)表,結(jié)果輸出窗口顯示結(jié)果(統(tǒng)計描述)110第一講緒論2012111注意:SPSS的輸出結(jié)果文件為*.spo請大家說明每一列的涵義能看出什么規(guī)律?112組段應(yīng)該寫成區(qū)間,而且含下限不含上限如果數(shù)據(jù)有最大值,最大組應(yīng)該寫出上限組段生成方法:a.為變量中表示各組的值加數(shù)值標簽b.在結(jié)果輸出表格中修改c.在transform-recode中使用outputvariablesarestrings選項11330名兒童身高的頻數(shù)分布身高組段(cm)頻數(shù)頻率(%)累計頻率(%)144~13.33.3147~13.36.7150~13.310.0153~413.323.3156~516.740.0159~826.766.7162~310.076.6165~26.783.3168~310.093.3171~13.396.7174~17713.3100.0合計30100.0-114分布特點問題:所有的分布都這樣嗎?還有什么樣的分布?身高115練習(xí)2(實習(xí)二內(nèi)容)打開“表1.sav”,產(chǎn)生新變量BMI將“表1.sav”所有觀測對象按”BMI”從小到大排列繪制“身高”變量頻數(shù)表116二、集中趨勢對于多個同質(zhì)數(shù)據(jù),往往要找一個代表值,以反映它們的整體水平,即大多數(shù)數(shù)值落在什么位置上。常用平均數(shù)(average)。描述集中趨勢的幾種平均數(shù)指標:(用不同的方法將不同類型數(shù)值的集中位置表示出來)1.算術(shù)均數(shù)(均數(shù))2.幾何均數(shù)3.中位數(shù)1171.算術(shù)均數(shù)(均數(shù))應(yīng)用:正態(tài)分布或近似正態(tài)分布意義:一組性質(zhì)相同的觀察值在數(shù)量上的平均水平。表示
(總體)
X(樣本)(spss:“mean”)注意:合理分組,才能求均數(shù),否則沒有意義。計算方法:
1.公式法(或稱直接法)X=∑x/n2.加權(quán)法118某地1995年某地110名7歲男童身高均數(shù)計算表身高組段(1)頻數(shù)f(2)組中值X(3)f*X(4)=(2)*(3)108~1109109110~3111333112~91131017114~91151035116~151171755118~181192142120~211212541122~141231722124~101251250126~4127508128~3129387130~2131262134~1361135133合計110(∑f)——13194(∑fX)119120均數(shù)的重要特性:
1.各離均差之和等于零?!疲╔-X)=02.離均差的平方和不大
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 供排水合同范本
- 別墅出租居間合同范本
- 養(yǎng)殖山羊合作合同范本
- 三間住房合同范本
- 買礦山合同范本
- 判決終止服務(wù)合同范本
- 2025年度國際貨物鐵路運輸與全面保險服務(wù)合同
- 三人合伙開店分紅合同范本
- 勞動合同個人申請書
- 會務(wù)會展合同范例
- 2025年初中語文:春晚觀后感三篇
- 《教育強國建設(shè)規(guī)劃綱要(2024-2035年)》解讀講座
- 預(yù)算績效評價管理機構(gòu)入圍投標文件(技術(shù)方案)
- 耳鼻咽喉科臨床診療指南
- 第二部分-3 植物纖維化學(xué)部分-纖維素
- 民法原理與實務(wù)課程教學(xué)大綱
- 2019北師大版高中英語選擇性必修四單詞表
- 園藝產(chǎn)品的品質(zhì)講義
- 鋼筋混凝土框架結(jié)構(gòu)工程監(jiān)理的質(zhì)量控制
- 桃花節(jié)活動方案
- 社區(qū)醫(yī)院建設(shè)標準
評論
0/150
提交評論