數(shù)據(jù)統(tǒng)計SPSS教程完整版_第1頁
數(shù)據(jù)統(tǒng)計SPSS教程完整版_第2頁
數(shù)據(jù)統(tǒng)計SPSS教程完整版_第3頁
數(shù)據(jù)統(tǒng)計SPSS教程完整版_第4頁
數(shù)據(jù)統(tǒng)計SPSS教程完整版_第5頁
已閱讀5頁,還剩425頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、統(tǒng)計學(xué)實踐主講:李曉軍E-mail:第1 1章 數(shù)據(jù)分析概述與軟件入門1.1 SPSS軟件概述1.1.1 SPSS簡介 SPSS(Statistics Package for Social Science )for Windows是一種運行在Windows系統(tǒng)下的社會科學(xué)統(tǒng)計軟件軟件包。SPSS的基本功能包括數(shù)據(jù)管理、統(tǒng)計分析、圖表分析、輸出管理等,具體內(nèi)容包括描述統(tǒng)計、列聯(lián)分析,總體的均值比較、相關(guān)分析、回歸模型分析、聚類分析、主成份分析、時間序列分析、非參數(shù)檢驗等多個大類,每個類中還有多個專項統(tǒng)計方法。 一、功能強大(1)囊括了各種成熟的統(tǒng)計方法與模型,為統(tǒng)計分析用戶提供了全方位的統(tǒng)計學(xué)算

2、法,為各種研究提供了相應(yīng)的統(tǒng)計學(xué)方法。(2)提供了各種數(shù)據(jù)準(zhǔn)備與數(shù)據(jù)整理技術(shù)。(3)自由靈活的表格功能。(4)各種常用的統(tǒng)計學(xué)圖形。二、SPSS的實驗環(huán)境要求(1)系統(tǒng)運行環(huán)境SPSS10.0以上版本軟件包可以工作在兩種模式下,單機模式和作為網(wǎng)絡(luò)系統(tǒng)的用戶界面模式。(2)輔助軟件環(huán)境三、SPSS的主要界面SPSS的主要界面有數(shù)據(jù)編輯窗口和結(jié)果輸出窗口。 四、SPSS的幫助系統(tǒng)SPSS對一些基本模塊中的統(tǒng)計提供了幫助,可以通過單擊Help菜單中的Statistics Coach命令,選擇所需要的統(tǒng)計指導(dǎo)。 SPSS附加模塊功能SPSS Advanced一般線性模型、混合線性模型、對數(shù)線性模型、生

3、存分析等SPSS Categories對應(yīng)分析、感知圖、Proxscal等SPSS Complex Sample多階段復(fù)雜抽樣技術(shù)等SPSS Conjoint正交設(shè)計、聯(lián)合分析等,適用于市場研究SPSS Exact Test精確P值計算、隨機抽樣P值計算等SPSS Maps在地圖上展示數(shù)據(jù)等SPSS Missing Value Analysis缺失數(shù)據(jù)的報告與填補等SPSS RegressionLogistic回歸、非線性回歸、Probit回歸等SPSS Tables交互式創(chuàng)建各種表格(如堆積表、嵌套表、分層表等)SPSS TrendsArima模型、指數(shù)平滑、自回歸等五、五、SPSS的運行方

4、式的運行方式SPSS提供了3種基本運行方式:完全窗口菜單方式,程序運行方式、混合運行方式。程序運行方式和混合運行方式是使用者從特殊的分析需要出發(fā),編寫自己的SPSS命令程序,通過語句直接運行。 SPSS中使用的對話框主要有兩類,一類是文件操作對話框,文件操作對話窗口操作與Windows應(yīng)用軟件操作風(fēng)格一致。另一類是統(tǒng)計分析對話框,統(tǒng)計分析對話框可以分為主窗口和下級窗口,在該類對話框中,選擇參與分析的各類變量及統(tǒng)計方法是對話框的主要任務(wù)。 1.1.2 spss的安裝一、啟動Windows 后,把SPSS 系統(tǒng)安裝軟盤(或光盤)插入軟驅(qū)(或光驅(qū)),并找到SPSS的安裝程序的可執(zhí)行文件Setup.e

5、xe。二、雙擊 Setup.exe 文件,安裝程序向?qū)⒔o出每一步操作的提示。在出現(xiàn)Welcome(歡迎)窗口后,選擇Next進(jìn)入下一步。三、安裝程序顯示Software License Agreement對話框時,選擇Yes接受顯示的協(xié)議條款。1.2 spss操作入門1.2.1 spss軟件的啟動與退出單擊Windows 的開始按鈕,在程序菜單項SPSS for Windows中找到SPSS 10.0 for Windows并單擊。1.2.2 SPSS的5個窗口(1)數(shù)據(jù)編輯窗口(SPSS Data Editor)Spss處理數(shù)據(jù)的工作全在此窗口進(jìn)行。(2)結(jié)果管理窗口(SPSS Outpu

6、t viewer)此窗口用于存放分析結(jié)果。左邊是目錄區(qū),右邊是內(nèi)容區(qū)。(3)草稿結(jié)果窗口(SPSS Draft Viewer)草稿結(jié)果是結(jié)果的一種簡化文本格式。實際上就是WORD所兼容的rtf超文本格式,因此可以在沒有安裝SPSS的PC機上使用文字編輯軟件打開。(4)語法編輯窗口(SPSS Syntax Editor)(5)腳本窗口(SPSS Script Editor)1.2.3 SPSS的四種運行方式一、菜單對話方式首先打開SPSS軟件,然后選擇菜單File Open file。然后,利用菜單Analyze Descriptive Statistics Frequencies, Emplo

7、yment CategoryEmployment Category36376.676.676.6275.75.782.38417.717.7100.0474100.0100.0ClericalCustodialManagerTotalValidFrequencyPercentValid PercentCumulativePercent二、程序方式在Syntax編輯窗口中鍵入以下程序:Get file=c:program filesspssemployee data.sav.Frequencies variables = jobcat/order = analysis。只需要選擇菜單Run Al

8、l,運行該程序也一樣會出現(xiàn)相同的分析結(jié)果。三、Include命令方式當(dāng)編寫Syntax程序時,如果發(fā)現(xiàn)將要編寫的程序語句正好是另一個Syntax文件的內(nèi)容;或者發(fā)現(xiàn)所需要的程序語句其實是幾個Syntax文件的總和是,除了可以通過“Copy”、“Paste”的方法利用資源,生產(chǎn)一個新的Syntax文件外,還可以利用Include命令。Include c:sytaxsample.sps.四、spss Production Faccility 方式在Windows的程序菜單中,spss菜單組除了有“spss for windows”項之外,還有一個“spss production facility”

9、。(1)單擊Syntax框下的“Add”按鈕,到C盤根目錄下打開“syntaxsample”。(2)單擊Syntax框下的“Edit”按鈕,對程序進(jìn)行編輯。(3)單擊右下角的“uesr prompts”按鈕,添加對程序的交互分析界面。(4)單擊“Browse”按鈕制定結(jié)果保存路徑,單擊“export options”按鈕還可以制定結(jié)果保存格式。1.2.4 spss的四種輸出結(jié)果1、表格格式2、文本格式3、標(biāo)準(zhǔn)圖與交互圖4、結(jié)果的保存和導(dǎo)出第2章 數(shù)據(jù)錄入與數(shù)據(jù)獲取本章主要解決兩個問題:第一個問題,根據(jù)問題類型的不同,將會從開放題、單選題和多選題的錄入方式為例進(jìn)行介紹。第二個問題,重點介紹如何用

10、SPSS直接讀取Excel類型和文本格式的數(shù)據(jù),以及如何用ODBC接口讀取數(shù)據(jù)庫文件。2.1.1 統(tǒng)計軟件中數(shù)據(jù)的錄入格式(1)不同觀測對象的數(shù)據(jù)不能在同一記錄中出現(xiàn),即同一觀測數(shù)據(jù)應(yīng)當(dāng)獨占一行。(2)每一個觀測量指標(biāo)或影響因素只能占據(jù)一列的位置,即同一指標(biāo)的數(shù)量觀測值都應(yīng)當(dāng)錄入到同一個變量中去。2.1 數(shù)據(jù)格式概述數(shù)據(jù)格式概述即:一個觀測占一行,一個變量占一列在錄入數(shù)據(jù)時,歸納為以下三步:第一步:定義變量名;第一步:指定每個變量的各種屬性;第一步:錄入數(shù)據(jù)。變量名不能與spss保留字相同,spss的保留字有ALL、END、BY、EQ、GE、GT、LE、LT、NE、NOT、OR、TO、WITH

11、。2.1.2 變量屬性介紹變量屬性介紹一、變量的儲存類型SPSS中,變量有三種的基本類型:數(shù)值型、字符型和日期型。標(biāo)準(zhǔn)數(shù)值型逗號數(shù)值型圓點數(shù)值型科學(xué)技術(shù)法數(shù)值型美元數(shù)值型用戶自定義型數(shù)值型:數(shù)值型的數(shù)據(jù)是0-9的阿拉伯?dāng)?shù)字和其他符號,如美元符號、逗號或圓點組成的。字符型:字符型數(shù)據(jù)的默認(rèn)顯示寬度為8個字符位,系統(tǒng)不區(qū)分變量名中的大小寫字母,并且不能進(jìn)行數(shù)學(xué)運算。注意:在輸入數(shù)據(jù)時不應(yīng)輸入引號,否則雙引號將會作為字符型數(shù)據(jù)的一部分。日期型:日期型數(shù)據(jù)是用來表示日期或時間的。日期型數(shù)據(jù)的顯示格式有很多,SPSS以菜單方式列出日期型數(shù)據(jù)的顯示格式以供用戶選擇。事實上,SPSS存儲中的日期型變量是該實

12、踐與1582年10月14日零點相差的秒數(shù)。關(guān)于日期型格式的幾點說明:“m”在年與日(字母y與d)之間表示月份;在時與秒(字母h與s)之間表示“分”鐘?!癿mm”表示要求書寫英文月份單詞的前三個字母組成的縮寫?!癲dd”三個字母d表示要求用從元月一日算起的日數(shù)表示日期。指定了日期變量的格式,不一定在輸入時就使用指定的格式??梢暂斎胗谩?”或“”作分隔符的具體日期,回車后,系統(tǒng)將自動將輸入的格式轉(zhuǎn)化為指定的格式,顯示在單元各種。二、變量的測量尺度在SPSS中使用Measure屬性對變量的測量尺度進(jìn)行定義。(1)定類尺度(Nominal Measurement):定類尺度是對事物的類別或?qū)傩缘囊环N測

13、度,按照事物的某種屬性對其進(jìn)行分類或分組。特點:其值僅代表了事物的類別和屬性,即能測度類別差異,不能比較各類之間的大小,所以各類之間沒有順序和等級。對定類尺度的變量只能計算頻數(shù)和頻率。在spss中,能適用定類尺度的數(shù)據(jù)可以是數(shù)值型,也可以是字符型變量。使用定類變量對事物進(jìn)行分類時,必須符合窮盡原則和互斥原則。(2)定序尺度(Ordinal Measurement):定序尺度是對事物之間的等級或順序差別的一種測度,可比較優(yōu)劣或排序。特點:由于定序變量只能側(cè)度類別之間的順序,無法測出類別之間的準(zhǔn)確差值,即測量數(shù)值不代表絕對的數(shù)量大小,所以其測量結(jié)果只能排序,不能進(jìn)行運算。(3)定矩尺度(Inter

14、val Measurement):定矩尺度是對事物類別或次序之間間距的測度。特點:不僅能將事物區(qū)分為不同類型并進(jìn)行排序,而且可能準(zhǔn)確指出類別之間的差距是多少;定居變量通常以自然或物理單位為計量尺度,因此測量結(jié)果往往表現(xiàn)為數(shù)值,所以計量結(jié)果可以進(jìn)行加減運算。(4)定比尺度(Scale Measurement):定比尺度是能夠測算兩個測度值之間比值的一種計量尺度,它的測量結(jié)果同定距變量一樣表現(xiàn)為數(shù)值。特點:定必變量是測量尺度的最高水平,它除了具有其他三種測量尺度的全部特點外,還具有可計算兩個側(cè)度至之間筆直的特點,因此它可以進(jìn)行加、減、乘、除運算,而定居變量值可進(jìn)行加減運算。三、變量名與變量標(biāo)簽值L

15、abel:定義變量名標(biāo)簽Value:定義變量值標(biāo)簽四、缺失值四、缺失值Spss中缺失值有用戶自定義缺失值和系統(tǒng)缺失值兩大類。在SPSS中,對字符型變量,默認(rèn)的缺失值為空格;對數(shù)值型變量,默認(rèn)的缺失值為零。2.2 數(shù)據(jù)的直接錄入2.1.1 操作界面說明標(biāo)尺欄菜單欄工具欄數(shù)據(jù)輸入?yún)^(qū)數(shù)據(jù)編輯區(qū)窗口標(biāo)簽標(biāo)題欄狀態(tài)欄當(dāng)前數(shù)據(jù)欄顯示區(qū)滾動條Data View表可以直接輸入觀測數(shù)據(jù)值或存放數(shù)據(jù),表的左端列邊框顯示觀測個體的序號,最上端行邊框顯示變量名。 Variable View表用來定義和修改變量的名稱、類型及其他屬性,如圖所示。如果輸入變量名后回車,將給出變量的默認(rèn)屬性。如果不定義變量的屬性,直接輸入數(shù)

16、據(jù),系統(tǒng)將默認(rèn)變量Var00001,Var00002等。在Variable View表中,每一行描述一個變量,依次是:Name:變量名。變量名必須以字母、漢字及開頭,總長度不超過8個字符,共容納4個漢字或8個英文字母,英文字母不區(qū)別大小寫,最后一個字符不能是句號。Type:變量類型。變量類型有8 種,最常用的是Numeric數(shù)值型變量。其它常用的類型有:String字符型,Date日期型,Comma逗號型(隔3位數(shù)加一個逗號)等。Width:變量所占的寬度。Decimals:小數(shù)點后位數(shù)。Label:變量標(biāo)簽。關(guān)于變量涵義的詳細(xì)說明。Values:變量值標(biāo)簽。關(guān)于變量各個取值的涵義說明。Mis

17、sing:缺失值的處理方式。Columns:變量在Date View 中所顯示的列寬(默認(rèn)列寬為8)。Align:數(shù)據(jù)對齊格式(默認(rèn)為右對齊)。Measure:數(shù)據(jù)的測度方式。系統(tǒng)給出名義尺度、定序尺度和等間距尺度三種(默認(rèn)為等間距尺度)。為了在統(tǒng)計分析過程中能有效的利用其它軟件產(chǎn)生的數(shù)據(jù),SPSS軟件編輯窗口除可以使用*.sav擴展名數(shù)據(jù)文件,還可以直接打開和保存下述類型的文件:SPSS DOS版本產(chǎn)生的數(shù)據(jù)文件*.sys;Excel 報表程序產(chǎn)生的數(shù)據(jù)文件*.xls;DBASE 數(shù)據(jù)庫格式文件*.dbf;SAS統(tǒng)計軟件產(chǎn)生的數(shù)據(jù)文件。2.2.2 開放題和簡單單選題的錄入開放題和簡單單選題的

18、錄入一、在一、在spss中定義變量中定義變量錄入數(shù)據(jù)的第一步是定義變量屬性,隨后才能進(jìn)行數(shù)據(jù)錄入。二、開放題的錄入二、開放題的錄入三、單選題的錄入三、單選題的錄入單選題的錄入可以采用字符直接錄入、字符代碼+值標(biāo)簽、數(shù)值代碼+值標(biāo)簽三種方式。2.2.3多選題的錄入一、多重二分法(Multiple Dichotomy Method)所謂多重二分法,是在編碼的時候,對應(yīng)每一個選項都要定義一個變量,有幾個選項就有幾個變量,這些變量均為二分類,他們各自代表對一個選項的選擇結(jié)果。二、多重分類法(Multiple Category Method)多重分類法,也是利用多個變量對一個多選題的答案進(jìn)行定義,應(yīng)該用

19、多少個變量,由被訪者實際可能給出的最多答案數(shù)而定。三、多選題錄入在三、多選題錄入在spss中的實現(xiàn)中的實現(xiàn)2.3 外部數(shù)據(jù)的獲取SPSS讀入非SPSS類型的文件數(shù)據(jù),有三種主要方式:直接打開,利用文本導(dǎo)向讀入文本數(shù)據(jù)以及利用數(shù)據(jù)庫OBDC接口讀入數(shù)據(jù)。2.3.1 電子表格數(shù)據(jù)如何導(dǎo)入電子表格數(shù)據(jù)如何導(dǎo)入spss中中SPSS中可以直接讀入許多常用格式的數(shù)據(jù)文件,選擇菜單File Open Data或直接單擊快捷鍵工具欄上的 快捷按鈕,系統(tǒng)就會彈出Open File 對話框,單擊“文件類型”列表框,在里面能夠看到可以直接打開的數(shù)據(jù)文件格式。2.3.2 文本數(shù)據(jù)如何導(dǎo)入文本數(shù)據(jù)如何導(dǎo)入spss中中第

20、一步:首先,在Open File 文件框中選中文件,單擊“打開”,系統(tǒng)會自動啟動文本倒入向?qū)υ捒颉5诙剑哼x擇“NO”并單擊“下一步”按鈕。用某種字符區(qū)分固定寬度第三步:分別選擇“Delimited”和“yes”,然后單擊“下一步”按鈕。第四步第四步第五步第五步第六步第七步2.4 數(shù)據(jù)的保存2.4.1 存為spss格式2.4.2 存為其他數(shù)據(jù)格式第3章 數(shù)據(jù)管理3.1 變量級別的數(shù)據(jù)管理對變量進(jìn)行操作的內(nèi)容主要集中于Transform菜單中,包括新變量的生成、記錄的排序、對變量進(jìn)行計數(shù)等。計算新變量:就是用Compute過程。變量轉(zhuǎn)換:包括Recode、Visual Bander、Count

21、、Rank Case、Automatic Recode這五個過程。專用過程:包括建立時間序列、缺失值代替和設(shè)定隨機種子三個過程。Run Pending Transforming:用于執(zhí)行編程中被掛起的數(shù)據(jù)整理操作。計算產(chǎn)生新變量變量值自動編碼設(shè)定隨機數(shù)種子創(chuàng)建代替缺失值變量創(chuàng)建時間序列變量運行其它轉(zhuǎn)換程序變量值重新編碼創(chuàng)建計數(shù)變量觀測量排秩連續(xù)變量進(jìn)行分段3.1.1 計算新變量計算新變量的功能就是在原有spss數(shù)據(jù)文件的基礎(chǔ)上,根據(jù)用戶的要求,使用spss算術(shù)表達(dá)式及函數(shù),對所有記錄或滿足SPSS條件表達(dá)式的記錄,計算出一個新結(jié)果,并將結(jié)果存入一個用戶指定的變量中。一、常用基本概念 (1)sp

22、ss算術(shù)表達(dá)式 spss算術(shù)表達(dá)式是由常量、spss變量名、spss的算術(shù)運算符、圓括號等組成的式子。(2)spss函數(shù) spss提供了多達(dá)70多種函數(shù),分為八大類:算術(shù)函數(shù)、統(tǒng)計函數(shù)、分布函數(shù)、邏輯函數(shù)、字符串函數(shù)、日期時間函數(shù)、缺失值函數(shù)和其它函數(shù)。(3)spss條件表達(dá)式 通過spss的算術(shù)表達(dá)式和函數(shù)可以對所有記錄計算一個結(jié)果,如果僅希望對部分記錄進(jìn)行計算,則應(yīng)當(dāng)利用spss的條件表達(dá)式指定對那些記錄進(jìn)行計算。二、compute過程的分析實例例3.1 統(tǒng)計英語成績在60分以上的學(xué)生的數(shù)學(xué)和語文的平均成績。例3.2 計算工人工資的所得稅。學(xué)生自己練習(xí)。3.1.2 對變量值進(jìn)行分組合并對變

23、量值進(jìn)行分組合并一、對連續(xù)變量進(jìn)行分組一、對連續(xù)變量進(jìn)行分組在SPSS中可以將連續(xù)變量轉(zhuǎn)換為離散(等級或定序)變量,按照某種一一對應(yīng)的關(guān)系生成新變量值,可以將新值賦給原變量。Recode過程和Visual Bander過程都可以完成這一任務(wù),但前者給為簡單和常用。例3.3 當(dāng)學(xué)生英語成績小于60時取值為“不及格”,大于等于60且小于70為“及格”,大于等于70且小于80為“較好”,大于等于80為“優(yōu)秀”。二、分類變量類別的合并二、分類變量類別的合并Recode過程也常用于合并某個分類變量的幾個水平為一個水平。將上例grade中優(yōu)秀、良好和及格三個等級合并為一個等級“PASS”,將grade的等

24、級“不及格”轉(zhuǎn)換為“NOPASS”。3.1.3 連續(xù)變量的可視化分段VISUAL Bander 用于將連續(xù)變量進(jìn)行分段,該過程使用百分位數(shù)、標(biāo)準(zhǔn)差范圍或者等間距方式將連續(xù)變量劃分為若干組段,并采用圖形化操作的方式。例3.4 對數(shù)學(xué)成績進(jìn)行分段,假設(shè)現(xiàn)在希望按變量math將學(xué)生分為5組,60分以下為第一組,60分以上的按照等間距的方式分為4組。3.1.4 將字符變量轉(zhuǎn)換為數(shù)值變量用automatic recode將字符變量轉(zhuǎn)換為數(shù)值變量。3.1.5 變量的編秩所謂編秩,就是對記錄按照某個變量值大小來排序。Rank case過程就是用來排序的一個專用過程。例:根據(jù)性別分組計算數(shù)學(xué)成績的秩次。3.1

25、.6 Transform菜單中的其它功能(1)count過程 如果用戶需要對滿足某項條件的數(shù)據(jù)進(jìn)行計數(shù),可以使用Count命令。 先在Target Variable中指定一個變量(可以是已經(jīng)存在的變量或新變量),并定義變量標(biāo)簽,然后指定要統(tǒng)計的變量加到Numeric Variables框中,再單擊Define Values按紐,打開Value to Count對話框。 Value:輸入某個值為清點對象;System-missing:以系統(tǒng)的缺失值為清點對象;System-or user missing:以系統(tǒng)或用戶指定的缺失值為清點對象;Range:指定數(shù)值的計數(shù)區(qū)域:其中包括: ( )thr

26、ough( )在框內(nèi)指定下限和上限lowest through( ): 在框內(nèi)只指定上限;( )highest through: 在框內(nèi)只指定下限。(2)random Number Seed過程:過程: 用于設(shè)定偽隨機函數(shù)的隨機種子。用于設(shè)定偽隨機函數(shù)的隨機種子。3.2 文件級別的數(shù)據(jù)管理(一)文件級別的數(shù)據(jù)管理(一)數(shù)據(jù)編輯窗口的Data菜單為用戶創(chuàng)建和定義數(shù)據(jù)提供了方便的功能。這個菜單是SPSS統(tǒng)計軟件數(shù)據(jù)整理的特有功能菜單。它的功能包括:對變量、觀測量的編輯處理;對變量數(shù)據(jù)的變換;對觀察量數(shù)據(jù)整理。(1)簡單命令:包括插入變量、插入記錄和到達(dá)某條記錄,他們的功能實際上都可以用鼠標(biāo)在數(shù)據(jù)表

27、界面上直接完成,很少會使用菜單來調(diào)用。(2)常用的簡單過程:包括排序、拆分文件、選擇記錄和加權(quán)記錄。(3)變量與數(shù)據(jù)文件屬性導(dǎo)向:用于定義數(shù)據(jù)字典,或者將于定義的數(shù)據(jù)字典直接引入當(dāng)前數(shù)據(jù)文件。 (4)數(shù)重構(gòu)過導(dǎo)向:用于進(jìn)行數(shù)據(jù)轉(zhuǎn)置,或者對重復(fù)測量數(shù)據(jù)表進(jìn)行長型、寬型記錄間的轉(zhuǎn)換。(5)文件合并過程:將幾個數(shù)據(jù)文件合并為一個大的spss數(shù)據(jù)文件,含橫向合并和縱向合并兩種情況。(6)正交設(shè)計過程:實際上是聯(lián)合分析模塊的一部分,用于生成實施聯(lián)合分析所需要的設(shè)計。(7)其他過程:包括定義日期變量過程、數(shù)據(jù)匯總過程和查找重復(fù)記錄導(dǎo)向。定義變量屬性定義變量日期插入觀測量拷貝數(shù)據(jù)屬性插入一個變量定位觀測量觀

28、測量排序重構(gòu)數(shù)據(jù)結(jié)構(gòu)分類或不分類匯總正交設(shè)計數(shù)據(jù)文件轉(zhuǎn)置合并數(shù)據(jù)文件標(biāo)識重復(fù)觀測量拆分?jǐn)?shù)據(jù)文件選擇觀測量觀測量加權(quán)3.2.1 記錄排序記錄排序一、排序的兩種方法:(1)在數(shù)據(jù)表格的變量名處單擊右鍵,彈出的右鍵菜單最后兩項就是“sort Ascending”和“Sort Descending”。(2)對于多變量排序,則需要使用Sort Cases過程來進(jìn)行。二、多變量排序需要注意的三點:(1)在多重排序中,制定排序變量名是很關(guān)鍵的,先指定的變量在排序時必然優(yōu)先于后制訂的變量。(2)可以指定按某變量值升序排序的同時按另一變量值降序排序,或相反。(3)排序以后,原來記錄數(shù)據(jù)的排列次序?qū)⒈淮騺y。3.2

29、.2 記錄拆分記錄拆分Split File 分割文件的功能是把當(dāng)前工作分割成兩個或兩個以上的組,隨后的分析將對每個組進(jìn)行。3.2.3 記錄篩選Select Cases:當(dāng)用戶不需要分析全部的數(shù)據(jù),而是按要求分析其中的一部分,使用該選擇。All case:選擇所有數(shù)據(jù);If condition is satisfied: 按指定條件選擇數(shù)據(jù)。Random Sample of cases:對觀察值進(jìn)行隨機抽樣。 Use filter variable:用指定變量作過濾。先選擇一個變量,系統(tǒng)自動在數(shù)據(jù)管理器中將該變量值為0的觀測單位標(biāo)上刪除記號,系統(tǒng)對標(biāo)有刪除記號的觀測單位不作分析。Based on

30、 time or case range:順序抽樣。單擊Range按紐,打開Select Case: Range對話框,用戶自行定義從第幾個觀察值開始抽到第幾個觀察值結(jié)束。3.2.4 加權(quán)記錄Weight Cases:設(shè)定某變量為頻數(shù)變量。:設(shè)定某變量為頻數(shù)變量。3.2.5 數(shù)據(jù)匯總數(shù)據(jù)匯總所謂分類匯總就是按指定的分類變量對觀測值進(jìn)行分組,對每組記錄的各變量求指定的描述統(tǒng)計量,結(jié)果可以存入新數(shù)據(jù)文件,也可以替換當(dāng)前數(shù)據(jù)文件。一、匯總的概念一、匯總的概念二、進(jìn)行分類二、進(jìn)行分類匯總的方法匯總的方法1、打開“data”菜單,選擇“Aggregate”,展開aggregate data”對話框。2、在

31、左側(cè)的源變量框中選擇一個或多個變量作為分類變量進(jìn)入分類變量(Break Variables)框中。3、在左側(cè)的源變量框中選擇一個或多個變量作為要求匯總的變量進(jìn)入?yún)R總變量(Aggregate Variables)框中,即要求這些變量的值進(jìn)行分類匯總。4、“name& label” (名稱與標(biāo)簽):單擊此按鈕可以修改組合后所生成新變量名稱以及標(biāo)簽:可以在name后面的矩形框中輸入新變量名。在Label后面的矩形框中輸入新變量標(biāo)簽。單擊“continue”按鈕繼續(xù)。5、“Function”(函數(shù)) 選擇此項可以確定匯總變量的描述內(nèi)容;系統(tǒng)默認(rèn)函數(shù)為平均數(shù)。3.3文件級別的數(shù)據(jù)管理(二)3.3

32、.1 數(shù)據(jù)字典的定義與應(yīng)用在大型的數(shù)據(jù)分析項目中,數(shù)據(jù)管理是非常重要的一個環(huán)節(jié),為了保證工作質(zhì)量,數(shù)據(jù)處理人員往往會事先定義好一個非常詳細(xì)的數(shù)據(jù)格式,包括變量格式、變量標(biāo)簽、標(biāo)簽值、缺失值定義等,這被稱為數(shù)據(jù)字典。一、變量屬性定義導(dǎo)向:Define Variable Properties 具體說來,可以列出所選變量的所有值;分辨沒有值標(biāo)簽的值,并且提供自動給出值標(biāo)簽的功能;可以將另一個變量的屬性拷貝到所選變量,也可以將所選變量的屬性拷貝到其他變量。二、復(fù)制數(shù)據(jù)文件屬性導(dǎo)向Copy Data Properties 過程用于將定義好的數(shù)據(jù)字典直接應(yīng)用到當(dāng)前文件中。操作時不僅可以將一個外部數(shù)據(jù)文件相

33、關(guān)屬性拷貝到當(dāng)前數(shù)據(jù)文件中,還可以進(jìn)行自行定義,只選擇某些變量,或者某些屬性進(jìn)行拷貝,這無疑大大提高了連續(xù)性項目對原有資源的利用程度。3.3.2 查找重復(fù)記錄Identifying Duplicate Cases:用于查找重復(fù)記錄。運行結(jié)束后,結(jié)果窗口會給出本次操作的信息匯總:Stat isticsStat isticsIndicator of each last m atching case as Prim ary120Vali dM i ssingNIndicator of each last m atching case as Pri m aryIndicator of each las

34、t m atching case as Pri m ary325.025.025.0975.075.0100.012100.0100.0Duplicate CasePrim ary CaseTotalVali dFrequencyPercentVali d Per centCum ulativePercent3.3.3 數(shù)據(jù)文件的重新排列與轉(zhuǎn)置數(shù)據(jù)文件的重新排列與轉(zhuǎn)置一、數(shù)據(jù)的長型與寬型格式:長型格式和寬型格式指的是重復(fù)測量數(shù)據(jù)的兩種不同的排列方式。由于重復(fù)測量模型可以使用不同的統(tǒng)計模型加以分析,因此根據(jù)模型的要求進(jìn)行長型格式和寬型格式之間的互轉(zhuǎn)換是數(shù)據(jù)分析中經(jīng)常要遇到的問題。二、長型格式轉(zhuǎn)換

35、為寬型格式:二、長型格式轉(zhuǎn)換為寬型格式:Restructure。選擇Data Restructure,系統(tǒng)就會彈出下圖導(dǎo)向。G enerated VariablesG enerated Variablesscore.1score.1:Scorescore.2score.2:Scorescore.3score.3:Scorescore.4score.4:ScoreTrial1234O riginal VariableScoreNam eLabelResul tProcessi ng St atist icsProcessi ng St atist ics48124.0574Cases InCas

36、es O utCases In/Cases O utVari ables InVari ables O utIndex Values三、數(shù)據(jù)轉(zhuǎn)置Transpose:用于對數(shù)進(jìn)行行列轉(zhuǎn)置,數(shù)據(jù)文件的轉(zhuǎn)置就是將數(shù)據(jù)編輯窗口中數(shù)據(jù)的行列互換,即將記錄轉(zhuǎn)為變量,將變量轉(zhuǎn)為記錄后,重新顯示在數(shù)據(jù)編輯窗口中。Variable(s):放入將要行列轉(zhuǎn)置的變量名。在數(shù)據(jù)文件中,未放入欄中的變量會遺失。字符串變量不能轉(zhuǎn)換,如強迫轉(zhuǎn)換,變量值轉(zhuǎn)變?yōu)橄到y(tǒng)缺失值。Name variable:變量命名欄,在左側(cè)源變量欄中選擇一個變量,放入name variable欄,技改變量的數(shù)據(jù)作為轉(zhuǎn)置后的變量名。3.3.4 多個數(shù)據(jù)

37、文件的合并多個數(shù)據(jù)文件的合并縱向連接:幾個數(shù)據(jù)集中的數(shù)據(jù)相加,組成一個新的數(shù)據(jù)集,新數(shù)據(jù)集中的記錄是原來幾個數(shù)據(jù)集中記錄數(shù)的總和。橫向連接:指的是按照記錄的次序,或者某個關(guān)鍵變量的數(shù)值,將不同數(shù)據(jù)集中的不同變量合并為一個數(shù)據(jù)集,新數(shù)據(jù)集中的變量數(shù)是所有原數(shù)據(jù)集中不重名變量的總和。一、數(shù)據(jù)文件的縱向連接一、數(shù)據(jù)文件的縱向連接縱向合并實質(zhì)就是將兩個數(shù)據(jù)文件的變量列,按照各個變量名的含義,一一對應(yīng)的進(jìn)行首尾相接。縱向合并必須遵循兩個條件:第一,兩個合并的spss數(shù)據(jù)文件,其內(nèi)容合并是有實際意義的。第二,為方便spss數(shù)據(jù)文件的合并,在不同的數(shù)據(jù)文件中,最好起相同的名字,變量類型和變量長度也要盡量相同

38、。Unpaired variable:不匹配變量欄。指變量名相同而變量定義不同的變量,或變量名不同的變量。Variable in new working data:新工作數(shù)據(jù)變量欄。Indicate case source as variable:指示記錄來源的變量選項/二、數(shù)據(jù)文件的橫向合并二、數(shù)據(jù)文件的橫向合并橫向合并的實質(zhì)是將兩個數(shù)據(jù)文件的記錄,按照記錄對應(yīng),一一進(jìn)行左右對接。橫向合并遵循三個條件:第一,如果不是按照記錄號對應(yīng)的規(guī)律進(jìn)行合并,則兩個數(shù)據(jù)文件必須至少有一個變量名相同的公共變量,這個變量是兩個數(shù)據(jù)文件橫向合并的依據(jù),成為關(guān)鍵變量。第二,如果是使用關(guān)鍵變量進(jìn)行合并的對應(yīng),則兩個

39、數(shù)據(jù)文件都必須事先按關(guān)鍵變量進(jìn)行升序排列。第三,為方便SPSS文件的合并,在不同的數(shù)據(jù)文件中,數(shù)據(jù)含義不相同的列,變量名不應(yīng)取相同的名稱。Excluded Variables:拒絕變量名。外部文件與當(dāng)前數(shù)據(jù)的同變量,拒絕加到新工作區(qū)中。New Working Data:新工作數(shù)據(jù)變量欄。Match Case on Key Variable in sort:排序文件中按關(guān)鍵變量匹配記錄選項。Both files provide case:由外部文件和當(dāng)前數(shù)據(jù)量兩者提供記錄。External file is keyed table:外部文件為關(guān)鍵表,以當(dāng)前數(shù)據(jù)為基準(zhǔn),外部文件匹配當(dāng)前數(shù)據(jù)的關(guān)鍵變量

40、值,如匹配成功,外部文件的新變量值加入到當(dāng)前數(shù)據(jù)的新變量中,匹配不成功則不加入。Working Data File is keyed table:當(dāng)前數(shù)據(jù)為關(guān)鍵表。Key Variables:關(guān)鍵變量欄,在拒絕變量選擇某變量作為關(guān)鍵變量。Indicate case source as variable:指示記錄來源的變量選項。第4章 連續(xù)性變量的統(tǒng)計描述與參數(shù)估計4.1 連續(xù)變量的統(tǒng)計描述概述4.1.1 統(tǒng)計描述中的可用工具(1)各種初步匯總描述方法頻數(shù)、百分位數(shù)。(2)各種統(tǒng)計描述指標(biāo)均值、標(biāo)準(zhǔn)差、四分位數(shù)間距。(3)統(tǒng)計表(4)統(tǒng)計圖4.1.2 連續(xù)變量的統(tǒng)計描述指標(biāo)體系年齡70.065.

41、060.055.050.045.040.035.030.025.0年齡Frequency3020100Std. Dev = 10.23 Mean = 42.7N = 70.00(1)集中趨勢(Central Trend):均數(shù)(Mean)中位數(shù)(Median)眾數(shù)(Mode)總合(Sum)(4)其他趨勢百分位數(shù)指標(biāo)(Percentile)、M統(tǒng)計量(M-Estimators)、極端值(Outlier)。(2)離散趨勢(Dispersion Trend)標(biāo)準(zhǔn)差(Std. Deviation)、方差(Variance)、全距(Range)、最小值(Minimum)、最大值(Maximum)、標(biāo)準(zhǔn)誤

42、(S.E. Mean)(3)分布特征(Distribution Tendency)偏度系數(shù)(Skewness)和峰度系數(shù)(Kurtosis)4.1.3 spss中的相應(yīng)功能1、Spss的用于連續(xù)變量統(tǒng)計描述的過程,均集中在Descriptive Statistics子菜單中。(1)Frequencies:產(chǎn)生原始數(shù)據(jù)的頻數(shù)表,并能計算各種百分位數(shù)??刂祁l數(shù)表輸出范圍類型的最大數(shù)目(2)Descriptive過程該過程用于一般性的統(tǒng)計描述,相對于Frequencies過程而言,它不能繪制統(tǒng)計圖。(3)Explore 過程該過程用于對連續(xù)性資料分布狀況不清楚時的探索性分析,它可以計算許多描述統(tǒng)計量

43、,給出各種統(tǒng)計圖,并進(jìn)行簡單的參數(shù)估計。(4)Ratio 過程用于對兩個連續(xù)性變量計算相對比指標(biāo)。2、Compares means 均值比較means過程:means過程的優(yōu)勢在于各組的描述指標(biāo)被放在一起便于相互比較,并且如果需要,可以直接輸出結(jié)果,無須再次調(diào)用其它過程。4.2集中趨勢的的描述指標(biāo)4.2.1 算術(shù)平均算術(shù)平均(Arithmetic Mean)是最常用的描述輸送距分布的集中趨勢的統(tǒng)計良??傮w均數(shù)(Population Mean)用希臘字母 表示,樣本均數(shù)常用 表示。 一、算術(shù)平均數(shù)的定義和性質(zhì)XXaaXXXXXnXnXXXXiiiin22210二、均數(shù)的意義二、均數(shù)的意義任何一個

44、平均數(shù)值首先是同類現(xiàn)象的平均數(shù)。任何一個平均數(shù)總是一個平衡點。但平均數(shù)在高度概括觀測數(shù)據(jù)從而使問題簡化的同時,卻丟失了某些有用的信息,一方面它把各個觀測數(shù)據(jù)之間的差異性掩蓋了起來,另一方面由于平均數(shù)對于個別極端值反應(yīng)比較靈敏,因而平均數(shù)在某些情況下可能具有一定的欺騙性。三、均數(shù)的適用范圍三、均數(shù)的適用范圍嚴(yán)格的講平均數(shù)指示用于定距變量。但有時對于定序變量,求平均等級也可以使用平均數(shù)。4.2.2 中位數(shù)中位數(shù)(Median)是將總體各單位的標(biāo)志值按大小順序排列,處于中間位置的那個標(biāo)志。一、中位數(shù)的定義對于未分組的原始資料,首先必須將標(biāo)志值按大小順序。設(shè)排序結(jié)果為:則中位數(shù)就可以按下列方式確定:二

45、、中位數(shù)的適用范圍nXXXX321為偶數(shù)時當(dāng)為奇數(shù)時當(dāng)n2/n12/2/2/1nnnXXMXM4.2.3其他集中趨勢指標(biāo)一、截尾均數(shù)由于均數(shù)較易受極端之的影響,因此可以考慮將數(shù)據(jù)排序后,按照一定的比例去掉最兩端的數(shù)據(jù),只是用中部的數(shù)據(jù)來求均數(shù)。如果截尾均數(shù)河源均數(shù)相差不大,則說明數(shù)據(jù)不存在極端值,或者兩側(cè)極端值的影響正好抵消;反之,則說明數(shù)據(jù)中有極端值,此時截為均數(shù)更好地反映數(shù)據(jù)的集中趨勢。常用的截尾均數(shù)有5%截尾均數(shù),即兩端各去掉5%的數(shù)據(jù)。二、幾何均數(shù)二、幾何均數(shù)幾何均數(shù)適用于原始數(shù)據(jù)分布不對稱,但經(jīng)過對數(shù)轉(zhuǎn)換后稱對稱分布的資料。nXGXXXXGinnlglg1321幾何均數(shù)世紀(jì)上就是對數(shù)

46、轉(zhuǎn)換后的數(shù)據(jù)lgX的算術(shù)平均數(shù)的反對數(shù)。四、調(diào)和均數(shù)它實際上是觀察值X倒數(shù)之均數(shù)的倒數(shù)。三、眾數(shù)(Mode)眾數(shù)指的是樣本數(shù)據(jù)中出現(xiàn)頻次最多的那個數(shù)。眾數(shù)適用于任何層次的變量,特別適用于單峰對稱的情況,是比較兩個分布是否接近首先要考慮的參數(shù)。在SPSS中,眾數(shù)可以在Report子菜單和Tables子菜單的全部報表過程和制表過程中計算出來。在SPSS中,調(diào)和均數(shù)可以在Report子菜單的4個報表過程過程中計算出來。xnxxxnnxxxGnn1111111121214.3 離散趨勢的描述指標(biāo)4.3.1全距(Range)又稱為極差,是一組數(shù)據(jù)中最大值(Maximun)與最小值(Minimum)之差。

47、極差反映的是變量分布的差異范圍或離散程度,在總體中,任何兩個標(biāo)志值之差都不可能超過極差。極差存在兩點不足:一是它僅僅取決于兩個極端之的水平,不能反映其間的變量分布情況,提供的信息太少。二是它容易受個別極端值的影響,不符合穩(wěn)健型的要求。minmaxXXR4.3.2 方差和標(biāo)準(zhǔn)差一、方差(Variance)和標(biāo)準(zhǔn)差(Standard Deviation)的定義將離均差平方和(Sum of Squares of Deviation from Mean,SS)除以觀察例數(shù)N,就得到方差:方差越大,數(shù)據(jù)分布離散程度越大。對于樣本數(shù)據(jù)而言,方差的計算公式為:將方差開方,就得到標(biāo)準(zhǔn)差。對于同性質(zhì)的數(shù)據(jù)來說,

48、標(biāo)準(zhǔn)差越小,表明數(shù)據(jù)的變異程度越小,即數(shù)據(jù)越整齊,數(shù)據(jù)的分布范圍越集中;標(biāo)準(zhǔn)差越大,表明數(shù)據(jù)的變異程度越大,即數(shù)據(jù)越參差不齊,分布越分散。二、方差和標(biāo)準(zhǔn)差的適用范圍:方差和標(biāo)準(zhǔn)差的適用范圍應(yīng)當(dāng)是正態(tài)分布。NXXi22122nXXSi4.3.3 百分位數(shù)、四分位數(shù)與四分位數(shù)間距分位差是對極差指標(biāo)的一種改進(jìn),是從變量數(shù)列中剔除了一部分極端值后重新計算的類似于極差的指標(biāo)。常用的分位差有四分位差、十分位差、百分位差。一、分位數(shù)一、分位數(shù)分位數(shù):是一種位置指標(biāo),用PX表示。一個百分位數(shù)PX將一組觀測之分為兩部分,理論上有x%的觀測值比它小,(100-x)%的觀測值比它大。四分位數(shù)(quartile)、十

49、分位數(shù)(decile)、百分位數(shù)(percentile),他們分別是用3個點、9個點、99個點將數(shù)據(jù)4等分、10等分和100等分后各分位點上的值。二、四分位數(shù)二、四分位數(shù)四分位數(shù):實際上是三個數(shù)值的總稱,分別是P25、P50、P75分位數(shù)。很顯然,中間的分位數(shù)是中位數(shù),因此通常所說的四分位數(shù)是指第一個四分位數(shù)(下四分位數(shù))和第三個四分位數(shù)(上四分位數(shù))。上下四分位數(shù)的差值稱為四分位數(shù)間距:QR=Q3-Q14.3.4 變異系數(shù)當(dāng)需要比較兩組數(shù)據(jù)離散程度大小的時候,往往直接使用標(biāo)準(zhǔn)差來進(jìn)行比較并不合適。這可以被分為兩種情況:(1)測量尺度相差太大;(2)數(shù)據(jù)量綱不同。在以上情形中,就應(yīng)當(dāng)消除測量尺

50、度和量綱的影響,而變異系數(shù)(Coefficient of Variance),它是標(biāo)準(zhǔn)差和其平均數(shù)的比率。XSCV 4.4 連續(xù)變量統(tǒng)計描述實例4.4.1 數(shù)據(jù)背景介紹4.4.2 使用Explore過程進(jìn)行分析探索分析是對數(shù)據(jù)進(jìn)行初步的觀察分析,主要的分析項目有:觀察數(shù)據(jù)的分布特征:可通過繪制箱圖和莖葉圖等圖形直觀地反映數(shù)據(jù)的分布形式和數(shù)據(jù)的一些規(guī)律性,包括考察數(shù)據(jù)中是否存在異常值等。 正態(tài)分布檢驗:檢驗數(shù)據(jù)是否服從正態(tài)分布。方差齊性的檢驗:用Levene檢驗比較各組的方差是否相等。1、單擊Analyze-Descriptive statistics-Explore,打開Explore主對話框

51、: 一、分析操作一、分析操作(3)在Display欄中選擇輸出項,依次是Both選擇項,輸出圖形與描述統(tǒng)計量(系統(tǒng)默認(rèn)),只輸出描述統(tǒng)計量和只輸出圖形。本例中選擇默認(rèn)項。(1)從左側(cè)的變量列表中選出變量”身高”,送入Dependent List欄。(2)選擇”性別”作為 因 子 變 量 , 送 入Factor List欄。有了因子變量,SPSS會把所有的觀測個體按照因子變量的取值分成若干各組 , 再 分 組 考 察Dependent List中的各個變量,如果不選擇因子變量,SPSS會對全部觀測來做探索分析。2、單擊Statistics統(tǒng)計量按鈕,打開Statistics對話框,選擇統(tǒng)計輸出量

52、。(1)Descriptives基本統(tǒng)計描述。同時指定均值的置信區(qū)間的置信度,系統(tǒng)默認(rèn)為95。 (2)M-估計(M估計在計算時對所有觀測量賦予權(quán)重,隨觀測量距分布中心的遠(yuǎn)近而變化)。(3)Outliers輸出分析數(shù)據(jù)中五個最大值和五個最小值。(4)Percentiles輸出百分?jǐn)?shù)。 3、單擊Plots 圖形按鈕,打開Plots對話框。 (1)Boxplot 箱圖選擇欄 Factor levels together因變量按因素水平分組(系統(tǒng)默認(rèn));Dependents together 所有因變量生成一個并列箱圖(本例中選擇項);None不顯示箱圖。(2)Descriptive 描述圖形欄Ste

53、m-and-leaf 莖葉圖Histogram 直方圖(3)Normality plots with test(復(fù)選項),正態(tài)分布檢驗并輸出Q-Q圖。 None:不產(chǎn)生回歸直線的斜率和方差齊性檢驗;Power Estimation轉(zhuǎn)換冪值估計(對每組數(shù)據(jù)產(chǎn)生一個中位數(shù)自然對數(shù)及四個分位數(shù)的自然對數(shù)的散點圖)選項;Transformed 變換原始數(shù)據(jù)選擇項;Untransformed不變換變換原始數(shù)據(jù)選擇項。(4)Spread vs level with Levene Test欄,對所有的散布層次圖,同時輸出回歸直線的斜率以及方差齊性的Levenes檢驗。4、單擊Option按紐,打開Optio

54、n對話框如圖所示??蛇x擇缺失值的處理方式,SPSS提供三種處理方式:(1)Exclude cases listwies 剔除帶缺失值的觀測量(系統(tǒng)默認(rèn))。(2)Exclude cases pairwise 剔除帶缺失值的觀測量時還一并剔除與缺失值有成對關(guān)系的觀測量。(3)Report values 輸出頻數(shù)表時同時輸出缺失值。5、單擊OK,得到相應(yīng)的輸出結(jié)果如表所示。 二、基本的分析結(jié)果二、基本的分析結(jié)果Case Processi ng Sum m aryCase Processi ng Sum m ary6995.8%34.2%72100.0%14699.3%1.7%147100.0%性別男

55、女身高NPercentNPercentNPercentVali dM i ssingTotalCasesDescript ivesDescript ives174.71.671173.37176.05174.70175.0031.0625.573159188298-.034.289.138.570162.88.430162.03163.73162.83163.0026.9505.191151178277.157.201-.203.399M eanLower BoundUpper Bound95% ConfidenceInt erval f or M ean5% Trim m ed M eanM

56、 edianVar ianceStd. Deviati onM i nim umM axi m umRangeInt erquarti le RangeSkewnessKur tosisM eanLower BoundUpper Bound95% ConfidenceInt erval f or M ean5% Trim m ed M eanM edianVar ianceStd. Deviati onM i nim umM axi m umRangeInt erquarti le RangeSkewnessKur tosis性別男女身高StatisticStd. Error三、輸出百分位數(shù)和

57、極端值列表Percentil esPercentil es165.00168.00170.00175.00178.00182.00185.00155.00156.70159.00163.00166.00170.00172.00170.00175.00178.00159.00163.00166.00性別男女男女身高身高W eightedAverage(Definiti on 1)Tukey s Hinges5102550759095Percentiles160170180190身高05101520FrequencyMean = 174.71Std. Dev. = 5.573N = 69for s

58、ex= 男Histogram身高 Stem-and-Leaf Plot forsex= 男 Frequency Stem & Leaf 1.00 15 . 9 .00 16 . 9.00 16 . 555778999 20.00 17 . 00000000011112334444 24.00 17 . 555555555556677777788889 12.00 18 . 000000122234 3.00 18 . 668 Stem width: 10 Each leaf: 1 case(s)男女性別150160170180190身高114箱圖中,最底部的水平線段是數(shù)據(jù)的最小值(奇異

59、點除外),頂部的水平線段是數(shù)據(jù)的最大值(奇異點除外),中間矩形箱子的底所在位置是數(shù)據(jù)的第一個四分位數(shù)(即25分位數(shù)),箱子頂部所在位置是數(shù)據(jù)的第三個四分位數(shù)據(jù)(即75分位數(shù))。箱子中間的水平線段刻畫的是數(shù)據(jù)的中位數(shù)(即50分位數(shù))。 4.4.3使用其他過程過程進(jìn)行分析一、Descriptive過程的結(jié)果D De es sc cr ri ip pt ti iv ve e S St ta at ti is st ti ic cs s215151188166.677.668215身高Valid N (listwise)NMinimumMaximumMeanStd. Deviation二、Freque

60、ncies過程的結(jié)果Statisti csStatisti cs身高2154155.80160.00165.00172.00180.00Val idM issi ngN525507595Per centiles4.5 連續(xù)性變量的參數(shù)估計根據(jù)樣本數(shù)據(jù)對總體的客觀規(guī)律性作出合理估計的過程被稱為統(tǒng)計推斷(Statistical Inference),它可以被分為參數(shù)估計和假設(shè)檢驗兩大類。4.5.1 正態(tài)分布一、正態(tài)分布的定義若連續(xù)性隨即變量X的概率分布密度函數(shù)為則稱隨機變量X服從正態(tài)分布(Normal Distribution) 22221Xexf二、正態(tài)分布的特征(1)正態(tài)分布是一條對稱曲線,關(guān)于均數(shù)對稱,因此

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論