數(shù)據(jù)統(tǒng)計SPSS教程完整版

上傳人：5*** IP屬地：湖北上傳時間：2021-10-29 格式：PPT 頁數(shù)：430 大?。?.32MB 積分：30 舉報 版權(quán)申訴

已閱讀5頁，還剩425頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、統(tǒng)計學(xué)實踐主講：李曉軍E-mail：第1 1章數(shù)據(jù)分析概述與軟件入門1.1 SPSS軟件概述1.1.1 SPSS簡介 SPSS（Statistics Package for Social Science ）for Windows是一種運行在Windows系統(tǒng)下的社會科學(xué)統(tǒng)計軟件軟件包。SPSS的基本功能包括數(shù)據(jù)管理、統(tǒng)計分析、圖表分析、輸出管理等，具體內(nèi)容包括描述統(tǒng)計、列聯(lián)分析，總體的均值比較、相關(guān)分析、回歸模型分析、聚類分析、主成份分析、時間序列分析、非參數(shù)檢驗等多個大類，每個類中還有多個專項統(tǒng)計方法。一、功能強大（1）囊括了各種成熟的統(tǒng)計方法與模型，為統(tǒng)計分析用戶提供了全方位的統(tǒng)計學(xué)算

2、法，為各種研究提供了相應(yīng)的統(tǒng)計學(xué)方法。（2）提供了各種數(shù)據(jù)準(zhǔn)備與數(shù)據(jù)整理技術(shù)。（3）自由靈活的表格功能。（4）各種常用的統(tǒng)計學(xué)圖形。二、SPSS的實驗環(huán)境要求（1）系統(tǒng)運行環(huán)境SPSS10.0以上版本軟件包可以工作在兩種模式下，單機模式和作為網(wǎng)絡(luò)系統(tǒng)的用戶界面模式。（2）輔助軟件環(huán)境三、SPSS的主要界面SPSS的主要界面有數(shù)據(jù)編輯窗口和結(jié)果輸出窗口。四、SPSS的幫助系統(tǒng)SPSS對一些基本模塊中的統(tǒng)計提供了幫助，可以通過單擊Help菜單中的Statistics Coach命令，選擇所需要的統(tǒng)計指導(dǎo)。 SPSS附加模塊功能SPSS Advanced一般線性模型、混合線性模型、對數(shù)線性模型、生

3、存分析等SPSS Categories對應(yīng)分析、感知圖、Proxscal等SPSS Complex Sample多階段復(fù)雜抽樣技術(shù)等SPSS Conjoint正交設(shè)計、聯(lián)合分析等，適用于市場研究SPSS Exact Test精確P值計算、隨機抽樣P值計算等SPSS Maps在地圖上展示數(shù)據(jù)等SPSS Missing Value Analysis缺失數(shù)據(jù)的報告與填補等SPSS RegressionLogistic回歸、非線性回歸、Probit回歸等SPSS Tables交互式創(chuàng)建各種表格（如堆積表、嵌套表、分層表等）SPSS TrendsArima模型、指數(shù)平滑、自回歸等五、五、SPSS的運行方

4、式的運行方式SPSS提供了3種基本運行方式：完全窗口菜單方式，程序運行方式、混合運行方式。程序運行方式和混合運行方式是使用者從特殊的分析需要出發(fā)，編寫自己的SPSS命令程序，通過語句直接運行。 SPSS中使用的對話框主要有兩類，一類是文件操作對話框，文件操作對話窗口操作與Windows應(yīng)用軟件操作風(fēng)格一致。另一類是統(tǒng)計分析對話框，統(tǒng)計分析對話框可以分為主窗口和下級窗口，在該類對話框中，選擇參與分析的各類變量及統(tǒng)計方法是對話框的主要任務(wù)。 1.1.2 spss的安裝一、啟動Windows 后，把SPSS 系統(tǒng)安裝軟盤（或光盤）插入軟驅(qū)（或光驅(qū)），并找到SPSS的安裝程序的可執(zhí)行文件Setup.e

5、xe。二、雙擊 Setup.exe 文件，安裝程序向?qū)⒔o出每一步操作的提示。在出現(xiàn)Welcome（歡迎）窗口后，選擇Next進(jìn)入下一步。三、安裝程序顯示Software License Agreement對話框時，選擇Yes接受顯示的協(xié)議條款。1.2 spss操作入門1.2.1 spss軟件的啟動與退出單擊Windows 的開始按鈕，在程序菜單項SPSS for Windows中找到SPSS 10.0 for Windows并單擊。1.2.2 SPSS的5個窗口（1）數(shù)據(jù)編輯窗口（SPSS Data Editor）Spss處理數(shù)據(jù)的工作全在此窗口進(jìn)行。（2）結(jié)果管理窗口（SPSS Outpu

6、t viewer）此窗口用于存放分析結(jié)果。左邊是目錄區(qū)，右邊是內(nèi)容區(qū)。（3）草稿結(jié)果窗口（SPSS Draft Viewer）草稿結(jié)果是結(jié)果的一種簡化文本格式。實際上就是WORD所兼容的rtf超文本格式，因此可以在沒有安裝SPSS的PC機上使用文字編輯軟件打開。（4）語法編輯窗口（SPSS Syntax Editor）（5）腳本窗口（SPSS Script Editor）1.2.3 SPSS的四種運行方式一、菜單對話方式首先打開SPSS軟件，然后選擇菜單File Open file。然后，利用菜單Analyze Descriptive Statistics Frequencies， Emplo

7、yment CategoryEmployment Category36376.676.676.6275.75.782.38417.717.7100.0474100.0100.0ClericalCustodialManagerTotalValidFrequencyPercentValid PercentCumulativePercent二、程序方式在Syntax編輯窗口中鍵入以下程序：Get file=c:program filesspssemployee data.sav.Frequencies variables = jobcat/order = analysis。只需要選擇菜單Run Al

8、l，運行該程序也一樣會出現(xiàn)相同的分析結(jié)果。三、Include命令方式當(dāng)編寫Syntax程序時，如果發(fā)現(xiàn)將要編寫的程序語句正好是另一個Syntax文件的內(nèi)容；或者發(fā)現(xiàn)所需要的程序語句其實是幾個Syntax文件的總和是，除了可以通過“Copy”、“Paste”的方法利用資源，生產(chǎn)一個新的Syntax文件外，還可以利用Include命令。Include c:sytaxsample.sps.四、spss Production Faccility 方式在Windows的程序菜單中，spss菜單組除了有“spss for windows”項之外，還有一個“spss production facility”

9、。（1）單擊Syntax框下的“Add”按鈕，到C盤根目錄下打開“syntaxsample”。（2）單擊Syntax框下的“Edit”按鈕，對程序進(jìn)行編輯。（3）單擊右下角的“uesr prompts”按鈕，添加對程序的交互分析界面。（4）單擊“Browse”按鈕制定結(jié)果保存路徑，單擊“export options”按鈕還可以制定結(jié)果保存格式。1.2.4 spss的四種輸出結(jié)果1、表格格式2、文本格式3、標(biāo)準(zhǔn)圖與交互圖4、結(jié)果的保存和導(dǎo)出第2章數(shù)據(jù)錄入與數(shù)據(jù)獲取本章主要解決兩個問題：第一個問題，根據(jù)問題類型的不同，將會從開放題、單選題和多選題的錄入方式為例進(jìn)行介紹。第二個問題，重點介紹如何用

10、SPSS直接讀取Excel類型和文本格式的數(shù)據(jù)，以及如何用ODBC接口讀取數(shù)據(jù)庫文件。2.1.1 統(tǒng)計軟件中數(shù)據(jù)的錄入格式（1）不同觀測對象的數(shù)據(jù)不能在同一記錄中出現(xiàn)，即同一觀測數(shù)據(jù)應(yīng)當(dāng)獨占一行。（2）每一個觀測量指標(biāo)或影響因素只能占據(jù)一列的位置，即同一指標(biāo)的數(shù)量觀測值都應(yīng)當(dāng)錄入到同一個變量中去。2.1 數(shù)據(jù)格式概述數(shù)據(jù)格式概述即：一個觀測占一行，一個變量占一列在錄入數(shù)據(jù)時，歸納為以下三步：第一步：定義變量名；第一步：指定每個變量的各種屬性；第一步：錄入數(shù)據(jù)。變量名不能與spss保留字相同，spss的保留字有ALL、END、BY、EQ、GE、GT、LE、LT、NE、NOT、OR、TO、WITH

11、。2.1.2 變量屬性介紹變量屬性介紹一、變量的儲存類型SPSS中，變量有三種的基本類型：數(shù)值型、字符型和日期型。標(biāo)準(zhǔn)數(shù)值型逗號數(shù)值型圓點數(shù)值型科學(xué)技術(shù)法數(shù)值型美元數(shù)值型用戶自定義型數(shù)值型：數(shù)值型的數(shù)據(jù)是0-9的阿拉伯?dāng)?shù)字和其他符號，如美元符號、逗號或圓點組成的。字符型：字符型數(shù)據(jù)的默認(rèn)顯示寬度為8個字符位，系統(tǒng)不區(qū)分變量名中的大小寫字母，并且不能進(jìn)行數(shù)學(xué)運算。注意：在輸入數(shù)據(jù)時不應(yīng)輸入引號，否則雙引號將會作為字符型數(shù)據(jù)的一部分。日期型：日期型數(shù)據(jù)是用來表示日期或時間的。日期型數(shù)據(jù)的顯示格式有很多，SPSS以菜單方式列出日期型數(shù)據(jù)的顯示格式以供用戶選擇。事實上，SPSS存儲中的日期型變量是該實

12、踐與1582年10月14日零點相差的秒數(shù)。關(guān)于日期型格式的幾點說明：“m”在年與日（字母y與d）之間表示月份；在時與秒（字母h與s）之間表示“分”鐘?！癿mm”表示要求書寫英文月份單詞的前三個字母組成的縮寫?！癲dd”三個字母d表示要求用從元月一日算起的日數(shù)表示日期。指定了日期變量的格式，不一定在輸入時就使用指定的格式?？梢暂斎胗谩?”或“”作分隔符的具體日期，回車后，系統(tǒng)將自動將輸入的格式轉(zhuǎn)化為指定的格式，顯示在單元各種。二、變量的測量尺度在SPSS中使用Measure屬性對變量的測量尺度進(jìn)行定義。（1）定類尺度（Nominal Measurement）：定類尺度是對事物的類別或?qū)傩缘囊环N測

13、度，按照事物的某種屬性對其進(jìn)行分類或分組。特點：其值僅代表了事物的類別和屬性，即能測度類別差異，不能比較各類之間的大小，所以各類之間沒有順序和等級。對定類尺度的變量只能計算頻數(shù)和頻率。在spss中，能適用定類尺度的數(shù)據(jù)可以是數(shù)值型，也可以是字符型變量。使用定類變量對事物進(jìn)行分類時，必須符合窮盡原則和互斥原則。（2）定序尺度（Ordinal Measurement）：定序尺度是對事物之間的等級或順序差別的一種測度，可比較優(yōu)劣或排序。特點：由于定序變量只能側(cè)度類別之間的順序，無法測出類別之間的準(zhǔn)確差值，即測量數(shù)值不代表絕對的數(shù)量大小，所以其測量結(jié)果只能排序，不能進(jìn)行運算。（3）定矩尺度（Inter

14、val Measurement）：定矩尺度是對事物類別或次序之間間距的測度。特點：不僅能將事物區(qū)分為不同類型并進(jìn)行排序，而且可能準(zhǔn)確指出類別之間的差距是多少；定居變量通常以自然或物理單位為計量尺度，因此測量結(jié)果往往表現(xiàn)為數(shù)值，所以計量結(jié)果可以進(jìn)行加減運算。（4）定比尺度（Scale Measurement）：定比尺度是能夠測算兩個測度值之間比值的一種計量尺度，它的測量結(jié)果同定距變量一樣表現(xiàn)為數(shù)值。特點：定必變量是測量尺度的最高水平，它除了具有其他三種測量尺度的全部特點外，還具有可計算兩個側(cè)度至之間筆直的特點，因此它可以進(jìn)行加、減、乘、除運算，而定居變量值可進(jìn)行加減運算。三、變量名與變量標(biāo)簽值L

15、abel：定義變量名標(biāo)簽Value：定義變量值標(biāo)簽四、缺失值四、缺失值Spss中缺失值有用戶自定義缺失值和系統(tǒng)缺失值兩大類。在SPSS中，對字符型變量，默認(rèn)的缺失值為空格；對數(shù)值型變量，默認(rèn)的缺失值為零。2.2 數(shù)據(jù)的直接錄入2.1.1 操作界面說明標(biāo)尺欄菜單欄工具欄數(shù)據(jù)輸入?yún)^(qū)數(shù)據(jù)編輯區(qū)窗口標(biāo)簽標(biāo)題欄狀態(tài)欄當(dāng)前數(shù)據(jù)欄顯示區(qū)滾動條Data View表可以直接輸入觀測數(shù)據(jù)值或存放數(shù)據(jù)，表的左端列邊框顯示觀測個體的序號，最上端行邊框顯示變量名。 Variable View表用來定義和修改變量的名稱、類型及其他屬性，如圖所示。如果輸入變量名后回車，將給出變量的默認(rèn)屬性。如果不定義變量的屬性，直接輸入數(shù)

16、據(jù)，系統(tǒng)將默認(rèn)變量Var00001,Var00002等。在Variable View表中，每一行描述一個變量，依次是：Name：變量名。變量名必須以字母、漢字及開頭，總長度不超過8個字符，共容納4個漢字或8個英文字母，英文字母不區(qū)別大小寫，最后一個字符不能是句號。Type：變量類型。變量類型有8 種，最常用的是Numeric數(shù)值型變量。其它常用的類型有：String字符型，Date日期型,Comma逗號型（隔3位數(shù)加一個逗號）等。Width：變量所占的寬度。Decimals：小數(shù)點后位數(shù)。Label：變量標(biāo)簽。關(guān)于變量涵義的詳細(xì)說明。Values：變量值標(biāo)簽。關(guān)于變量各個取值的涵義說明。Mis

17、sing：缺失值的處理方式。Columns：變量在Date View 中所顯示的列寬（默認(rèn)列寬為8）。Align：數(shù)據(jù)對齊格式（默認(rèn)為右對齊）。Measure：數(shù)據(jù)的測度方式。系統(tǒng)給出名義尺度、定序尺度和等間距尺度三種（默認(rèn)為等間距尺度）。為了在統(tǒng)計分析過程中能有效的利用其它軟件產(chǎn)生的數(shù)據(jù)，SPSS軟件編輯窗口除可以使用*.sav擴展名數(shù)據(jù)文件，還可以直接打開和保存下述類型的文件：SPSS DOS版本產(chǎn)生的數(shù)據(jù)文件*.sys；Excel 報表程序產(chǎn)生的數(shù)據(jù)文件*.xls；DBASE 數(shù)據(jù)庫格式文件*.dbf；SAS統(tǒng)計軟件產(chǎn)生的數(shù)據(jù)文件。2.2.2 開放題和簡單單選題的錄入開放題和簡單單選題的

18、錄入一、在一、在spss中定義變量中定義變量錄入數(shù)據(jù)的第一步是定義變量屬性，隨后才能進(jìn)行數(shù)據(jù)錄入。二、開放題的錄入二、開放題的錄入三、單選題的錄入三、單選題的錄入單選題的錄入可以采用字符直接錄入、字符代碼+值標(biāo)簽、數(shù)值代碼+值標(biāo)簽三種方式。2.2.3多選題的錄入一、多重二分法（Multiple Dichotomy Method）所謂多重二分法，是在編碼的時候，對應(yīng)每一個選項都要定義一個變量，有幾個選項就有幾個變量，這些變量均為二分類，他們各自代表對一個選項的選擇結(jié)果。二、多重分類法（Multiple Category Method）多重分類法，也是利用多個變量對一個多選題的答案進(jìn)行定義，應(yīng)該用

19、多少個變量，由被訪者實際可能給出的最多答案數(shù)而定。三、多選題錄入在三、多選題錄入在spss中的實現(xiàn)中的實現(xiàn)2.3 外部數(shù)據(jù)的獲取SPSS讀入非SPSS類型的文件數(shù)據(jù)，有三種主要方式：直接打開，利用文本導(dǎo)向讀入文本數(shù)據(jù)以及利用數(shù)據(jù)庫OBDC接口讀入數(shù)據(jù)。2.3.1 電子表格數(shù)據(jù)如何導(dǎo)入電子表格數(shù)據(jù)如何導(dǎo)入spss中中SPSS中可以直接讀入許多常用格式的數(shù)據(jù)文件，選擇菜單File Open Data或直接單擊快捷鍵工具欄上的快捷按鈕，系統(tǒng)就會彈出Open File 對話框，單擊“文件類型”列表框，在里面能夠看到可以直接打開的數(shù)據(jù)文件格式。2.3.2 文本數(shù)據(jù)如何導(dǎo)入文本數(shù)據(jù)如何導(dǎo)入spss中中第

20、一步：首先，在Open File 文件框中選中文件，單擊“打開”，系統(tǒng)會自動啟動文本倒入向?qū)υ捒颉５诙剑哼x擇“NO”并單擊“下一步”按鈕。用某種字符區(qū)分固定寬度第三步：分別選擇“Delimited”和“yes”,然后單擊“下一步”按鈕。第四步第四步第五步第五步第六步第七步2.4 數(shù)據(jù)的保存2.4.1 存為spss格式2.4.2 存為其他數(shù)據(jù)格式第3章數(shù)據(jù)管理3.1 變量級別的數(shù)據(jù)管理對變量進(jìn)行操作的內(nèi)容主要集中于Transform菜單中，包括新變量的生成、記錄的排序、對變量進(jìn)行計數(shù)等。計算新變量：就是用Compute過程。變量轉(zhuǎn)換：包括Recode、Visual Bander、Count

21、、Rank Case、Automatic Recode這五個過程。專用過程：包括建立時間序列、缺失值代替和設(shè)定隨機種子三個過程。Run Pending Transforming：用于執(zhí)行編程中被掛起的數(shù)據(jù)整理操作。計算產(chǎn)生新變量變量值自動編碼設(shè)定隨機數(shù)種子創(chuàng)建代替缺失值變量創(chuàng)建時間序列變量運行其它轉(zhuǎn)換程序變量值重新編碼創(chuàng)建計數(shù)變量觀測量排秩連續(xù)變量進(jìn)行分段3.1.1 計算新變量計算新變量的功能就是在原有spss數(shù)據(jù)文件的基礎(chǔ)上，根據(jù)用戶的要求，使用spss算術(shù)表達(dá)式及函數(shù)，對所有記錄或滿足SPSS條件表達(dá)式的記錄，計算出一個新結(jié)果，并將結(jié)果存入一個用戶指定的變量中。一、常用基本概念（1）sp

22、ss算術(shù)表達(dá)式 spss算術(shù)表達(dá)式是由常量、spss變量名、spss的算術(shù)運算符、圓括號等組成的式子。（2）spss函數(shù) spss提供了多達(dá)70多種函數(shù)，分為八大類：算術(shù)函數(shù)、統(tǒng)計函數(shù)、分布函數(shù)、邏輯函數(shù)、字符串函數(shù)、日期時間函數(shù)、缺失值函數(shù)和其它函數(shù)。（3）spss條件表達(dá)式通過spss的算術(shù)表達(dá)式和函數(shù)可以對所有記錄計算一個結(jié)果，如果僅希望對部分記錄進(jìn)行計算，則應(yīng)當(dāng)利用spss的條件表達(dá)式指定對那些記錄進(jìn)行計算。二、compute過程的分析實例例3.1 統(tǒng)計英語成績在60分以上的學(xué)生的數(shù)學(xué)和語文的平均成績。例3.2 計算工人工資的所得稅。學(xué)生自己練習(xí)。3.1.2 對變量值進(jìn)行分組合并對變

23、量值進(jìn)行分組合并一、對連續(xù)變量進(jìn)行分組一、對連續(xù)變量進(jìn)行分組在SPSS中可以將連續(xù)變量轉(zhuǎn)換為離散（等級或定序）變量，按照某種一一對應(yīng)的關(guān)系生成新變量值，可以將新值賦給原變量。Recode過程和Visual Bander過程都可以完成這一任務(wù)，但前者給為簡單和常用。例3.3 當(dāng)學(xué)生英語成績小于60時取值為“不及格”，大于等于60且小于70為“及格”，大于等于70且小于80為“較好”，大于等于80為“優(yōu)秀”。二、分類變量類別的合并二、分類變量類別的合并Recode過程也常用于合并某個分類變量的幾個水平為一個水平。將上例grade中優(yōu)秀、良好和及格三個等級合并為一個等級“PASS”，將grade的等

24、級“不及格”轉(zhuǎn)換為“NOPASS”。3.1.3 連續(xù)變量的可視化分段VISUAL Bander 用于將連續(xù)變量進(jìn)行分段，該過程使用百分位數(shù)、標(biāo)準(zhǔn)差范圍或者等間距方式將連續(xù)變量劃分為若干組段，并采用圖形化操作的方式。例3.4 對數(shù)學(xué)成績進(jìn)行分段，假設(shè)現(xiàn)在希望按變量math將學(xué)生分為5組，60分以下為第一組，60分以上的按照等間距的方式分為4組。3.1.4 將字符變量轉(zhuǎn)換為數(shù)值變量用automatic recode將字符變量轉(zhuǎn)換為數(shù)值變量。3.1.5 變量的編秩所謂編秩，就是對記錄按照某個變量值大小來排序。Rank case過程就是用來排序的一個專用過程。例：根據(jù)性別分組計算數(shù)學(xué)成績的秩次。3.1

25、.6 Transform菜單中的其它功能（1）count過程如果用戶需要對滿足某項條件的數(shù)據(jù)進(jìn)行計數(shù)，可以使用Count命令。先在Target Variable中指定一個變量（可以是已經(jīng)存在的變量或新變量），并定義變量標(biāo)簽，然后指定要統(tǒng)計的變量加到Numeric Variables框中，再單擊Define Values按紐，打開Value to Count對話框。 Value:輸入某個值為清點對象；System-missing:以系統(tǒng)的缺失值為清點對象；System-or user missing:以系統(tǒng)或用戶指定的缺失值為清點對象；Range:指定數(shù)值的計數(shù)區(qū)域：其中包括：（）thr

26、ough（）在框內(nèi)指定下限和上限lowest through（）: 在框內(nèi)只指定上限；（）highest through: 在框內(nèi)只指定下限。（2）random Number Seed過程：過程：用于設(shè)定偽隨機函數(shù)的隨機種子。用于設(shè)定偽隨機函數(shù)的隨機種子。3.2 文件級別的數(shù)據(jù)管理（一）文件級別的數(shù)據(jù)管理（一）數(shù)據(jù)編輯窗口的Data菜單為用戶創(chuàng)建和定義數(shù)據(jù)提供了方便的功能。這個菜單是SPSS統(tǒng)計軟件數(shù)據(jù)整理的特有功能菜單。它的功能包括：對變量、觀測量的編輯處理；對變量數(shù)據(jù)的變換；對觀察量數(shù)據(jù)整理。（1）簡單命令：包括插入變量、插入記錄和到達(dá)某條記錄，他們的功能實際上都可以用鼠標(biāo)在數(shù)據(jù)表

27、界面上直接完成，很少會使用菜單來調(diào)用。（2）常用的簡單過程：包括排序、拆分文件、選擇記錄和加權(quán)記錄。（3）變量與數(shù)據(jù)文件屬性導(dǎo)向：用于定義數(shù)據(jù)字典，或者將于定義的數(shù)據(jù)字典直接引入當(dāng)前數(shù)據(jù)文件。（4）數(shù)重構(gòu)過導(dǎo)向：用于進(jìn)行數(shù)據(jù)轉(zhuǎn)置，或者對重復(fù)測量數(shù)據(jù)表進(jìn)行長型、寬型記錄間的轉(zhuǎn)換。（5）文件合并過程：將幾個數(shù)據(jù)文件合并為一個大的spss數(shù)據(jù)文件，含橫向合并和縱向合并兩種情況。（6）正交設(shè)計過程：實際上是聯(lián)合分析模塊的一部分，用于生成實施聯(lián)合分析所需要的設(shè)計。（7）其他過程：包括定義日期變量過程、數(shù)據(jù)匯總過程和查找重復(fù)記錄導(dǎo)向。定義變量屬性定義變量日期插入觀測量拷貝數(shù)據(jù)屬性插入一個變量定位觀測量觀

28、測量排序重構(gòu)數(shù)據(jù)結(jié)構(gòu)分類或不分類匯總正交設(shè)計數(shù)據(jù)文件轉(zhuǎn)置合并數(shù)據(jù)文件標(biāo)識重復(fù)觀測量拆分?jǐn)?shù)據(jù)文件選擇觀測量觀測量加權(quán)3.2.1 記錄排序記錄排序一、排序的兩種方法：（1）在數(shù)據(jù)表格的變量名處單擊右鍵，彈出的右鍵菜單最后兩項就是“sort Ascending”和“Sort Descending”。（2）對于多變量排序，則需要使用Sort Cases過程來進(jìn)行。二、多變量排序需要注意的三點：（1）在多重排序中，制定排序變量名是很關(guān)鍵的，先指定的變量在排序時必然優(yōu)先于后制訂的變量。（2）可以指定按某變量值升序排序的同時按另一變量值降序排序，或相反。（3）排序以后，原來記錄數(shù)據(jù)的排列次序?qū)⒈淮騺y。3.2

29、.2 記錄拆分記錄拆分Split File 分割文件的功能是把當(dāng)前工作分割成兩個或兩個以上的組，隨后的分析將對每個組進(jìn)行。3.2.3 記錄篩選Select Cases：當(dāng)用戶不需要分析全部的數(shù)據(jù)，而是按要求分析其中的一部分，使用該選擇。All case：選擇所有數(shù)據(jù)；If condition is satisfied: 按指定條件選擇數(shù)據(jù)。Random Sample of cases：對觀察值進(jìn)行隨機抽樣。 Use filter variable：用指定變量作過濾。先選擇一個變量，系統(tǒng)自動在數(shù)據(jù)管理器中將該變量值為0的觀測單位標(biāo)上刪除記號，系統(tǒng)對標(biāo)有刪除記號的觀測單位不作分析。Based on

30、 time or case range：順序抽樣。單擊Range按紐，打開Select Case: Range對話框，用戶自行定義從第幾個觀察值開始抽到第幾個觀察值結(jié)束。3.2.4 加權(quán)記錄Weight Cases：設(shè)定某變量為頻數(shù)變量。：設(shè)定某變量為頻數(shù)變量。3.2.5 數(shù)據(jù)匯總數(shù)據(jù)匯總所謂分類匯總就是按指定的分類變量對觀測值進(jìn)行分組，對每組記錄的各變量求指定的描述統(tǒng)計量，結(jié)果可以存入新數(shù)據(jù)文件，也可以替換當(dāng)前數(shù)據(jù)文件。一、匯總的概念一、匯總的概念二、進(jìn)行分類二、進(jìn)行分類匯總的方法匯總的方法1、打開“data”菜單，選擇“Aggregate”，展開aggregate data”對話框。2、在

31、左側(cè)的源變量框中選擇一個或多個變量作為分類變量進(jìn)入分類變量（Break Variables）框中。3、在左側(cè)的源變量框中選擇一個或多個變量作為要求匯總的變量進(jìn)入?yún)R總變量（Aggregate Variables）框中，即要求這些變量的值進(jìn)行分類匯總。4、“name& label” （名稱與標(biāo)簽）：單擊此按鈕可以修改組合后所生成新變量名稱以及標(biāo)簽：可以在name后面的矩形框中輸入新變量名。在Label后面的矩形框中輸入新變量標(biāo)簽。單擊“continue”按鈕繼續(xù)。5、“Function”（函數(shù)）選擇此項可以確定匯總變量的描述內(nèi)容；系統(tǒng)默認(rèn)函數(shù)為平均數(shù)。3.3文件級別的數(shù)據(jù)管理（二）3.3

32、.1 數(shù)據(jù)字典的定義與應(yīng)用在大型的數(shù)據(jù)分析項目中，數(shù)據(jù)管理是非常重要的一個環(huán)節(jié)，為了保證工作質(zhì)量，數(shù)據(jù)處理人員往往會事先定義好一個非常詳細(xì)的數(shù)據(jù)格式，包括變量格式、變量標(biāo)簽、標(biāo)簽值、缺失值定義等，這被稱為數(shù)據(jù)字典。一、變量屬性定義導(dǎo)向：Define Variable Properties 具體說來，可以列出所選變量的所有值；分辨沒有值標(biāo)簽的值，并且提供自動給出值標(biāo)簽的功能；可以將另一個變量的屬性拷貝到所選變量，也可以將所選變量的屬性拷貝到其他變量。二、復(fù)制數(shù)據(jù)文件屬性導(dǎo)向Copy Data Properties 過程用于將定義好的數(shù)據(jù)字典直接應(yīng)用到當(dāng)前文件中。操作時不僅可以將一個外部數(shù)據(jù)文件相

33、關(guān)屬性拷貝到當(dāng)前數(shù)據(jù)文件中，還可以進(jìn)行自行定義，只選擇某些變量，或者某些屬性進(jìn)行拷貝，這無疑大大提高了連續(xù)性項目對原有資源的利用程度。3.3.2 查找重復(fù)記錄Identifying Duplicate Cases：用于查找重復(fù)記錄。運行結(jié)束后，結(jié)果窗口會給出本次操作的信息匯總：Stat isticsStat isticsIndicator of each last m atching case as Prim ary120Vali dM i ssingNIndicator of each last m atching case as Pri m aryIndicator of each las

34、t m atching case as Pri m ary325.025.025.0975.075.0100.012100.0100.0Duplicate CasePrim ary CaseTotalVali dFrequencyPercentVali d Per centCum ulativePercent3.3.3 數(shù)據(jù)文件的重新排列與轉(zhuǎn)置數(shù)據(jù)文件的重新排列與轉(zhuǎn)置一、數(shù)據(jù)的長型與寬型格式：長型格式和寬型格式指的是重復(fù)測量數(shù)據(jù)的兩種不同的排列方式。由于重復(fù)測量模型可以使用不同的統(tǒng)計模型加以分析，因此根據(jù)模型的要求進(jìn)行長型格式和寬型格式之間的互轉(zhuǎn)換是數(shù)據(jù)分析中經(jīng)常要遇到的問題。二、長型格式轉(zhuǎn)換

35、為寬型格式：二、長型格式轉(zhuǎn)換為寬型格式：Restructure。選擇Data Restructure，系統(tǒng)就會彈出下圖導(dǎo)向。G enerated VariablesG enerated Variablesscore.1score.1:Scorescore.2score.2:Scorescore.3score.3:Scorescore.4score.4:ScoreTrial1234O riginal VariableScoreNam eLabelResul tProcessi ng St atist icsProcessi ng St atist ics48124.0574Cases InCas

36、es O utCases In/Cases O utVari ables InVari ables O utIndex Values三、數(shù)據(jù)轉(zhuǎn)置Transpose：用于對數(shù)進(jìn)行行列轉(zhuǎn)置，數(shù)據(jù)文件的轉(zhuǎn)置就是將數(shù)據(jù)編輯窗口中數(shù)據(jù)的行列互換，即將記錄轉(zhuǎn)為變量，將變量轉(zhuǎn)為記錄后，重新顯示在數(shù)據(jù)編輯窗口中。Variable(s)：放入將要行列轉(zhuǎn)置的變量名。在數(shù)據(jù)文件中，未放入欄中的變量會遺失。字符串變量不能轉(zhuǎn)換，如強迫轉(zhuǎn)換，變量值轉(zhuǎn)變?yōu)橄到y(tǒng)缺失值。Name variable：變量命名欄，在左側(cè)源變量欄中選擇一個變量，放入name variable欄，技改變量的數(shù)據(jù)作為轉(zhuǎn)置后的變量名。3.3.4 多個數(shù)據(jù)

37、文件的合并多個數(shù)據(jù)文件的合并縱向連接：幾個數(shù)據(jù)集中的數(shù)據(jù)相加，組成一個新的數(shù)據(jù)集，新數(shù)據(jù)集中的記錄是原來幾個數(shù)據(jù)集中記錄數(shù)的總和。橫向連接：指的是按照記錄的次序，或者某個關(guān)鍵變量的數(shù)值，將不同數(shù)據(jù)集中的不同變量合并為一個數(shù)據(jù)集，新數(shù)據(jù)集中的變量數(shù)是所有原數(shù)據(jù)集中不重名變量的總和。一、數(shù)據(jù)文件的縱向連接一、數(shù)據(jù)文件的縱向連接縱向合并實質(zhì)就是將兩個數(shù)據(jù)文件的變量列，按照各個變量名的含義，一一對應(yīng)的進(jìn)行首尾相接。縱向合并必須遵循兩個條件：第一，兩個合并的spss數(shù)據(jù)文件，其內(nèi)容合并是有實際意義的。第二，為方便spss數(shù)據(jù)文件的合并，在不同的數(shù)據(jù)文件中，最好起相同的名字，變量類型和變量長度也要盡量相同

38、。Unpaired variable：不匹配變量欄。指變量名相同而變量定義不同的變量，或變量名不同的變量。Variable in new working data：新工作數(shù)據(jù)變量欄。Indicate case source as variable：指示記錄來源的變量選項/二、數(shù)據(jù)文件的橫向合并二、數(shù)據(jù)文件的橫向合并橫向合并的實質(zhì)是將兩個數(shù)據(jù)文件的記錄，按照記錄對應(yīng)，一一進(jìn)行左右對接。橫向合并遵循三個條件：第一，如果不是按照記錄號對應(yīng)的規(guī)律進(jìn)行合并，則兩個數(shù)據(jù)文件必須至少有一個變量名相同的公共變量，這個變量是兩個數(shù)據(jù)文件橫向合并的依據(jù)，成為關(guān)鍵變量。第二，如果是使用關(guān)鍵變量進(jìn)行合并的對應(yīng)，則兩個

39、數(shù)據(jù)文件都必須事先按關(guān)鍵變量進(jìn)行升序排列。第三，為方便SPSS文件的合并，在不同的數(shù)據(jù)文件中，數(shù)據(jù)含義不相同的列，變量名不應(yīng)取相同的名稱。Excluded Variables：拒絕變量名。外部文件與當(dāng)前數(shù)據(jù)的同變量，拒絕加到新工作區(qū)中。New Working Data：新工作數(shù)據(jù)變量欄。Match Case on Key Variable in sort：排序文件中按關(guān)鍵變量匹配記錄選項。Both files provide case：由外部文件和當(dāng)前數(shù)據(jù)量兩者提供記錄。External file is keyed table：外部文件為關(guān)鍵表，以當(dāng)前數(shù)據(jù)為基準(zhǔn)，外部文件匹配當(dāng)前數(shù)據(jù)的關(guān)鍵變量

40、值，如匹配成功，外部文件的新變量值加入到當(dāng)前數(shù)據(jù)的新變量中，匹配不成功則不加入。Working Data File is keyed table：當(dāng)前數(shù)據(jù)為關(guān)鍵表。Key Variables：關(guān)鍵變量欄，在拒絕變量選擇某變量作為關(guān)鍵變量。Indicate case source as variable：指示記錄來源的變量選項。第4章連續(xù)性變量的統(tǒng)計描述與參數(shù)估計4.1 連續(xù)變量的統(tǒng)計描述概述4.1.1 統(tǒng)計描述中的可用工具（1）各種初步匯總描述方法頻數(shù)、百分位數(shù)。（2）各種統(tǒng)計描述指標(biāo)均值、標(biāo)準(zhǔn)差、四分位數(shù)間距。（3）統(tǒng)計表（4）統(tǒng)計圖4.1.2 連續(xù)變量的統(tǒng)計描述指標(biāo)體系年齡70.065.

41、060.055.050.045.040.035.030.025.0年齡Frequency3020100Std. Dev = 10.23 Mean = 42.7N = 70.00（1）集中趨勢（Central Trend）：均數(shù)（Mean）中位數(shù)（Median）眾數(shù)（Mode）總合（Sum）（4）其他趨勢百分位數(shù)指標(biāo)（Percentile）、M統(tǒng)計量（M-Estimators)、極端值（Outlier）。（2）離散趨勢（Dispersion Trend）標(biāo)準(zhǔn)差（Std. Deviation）、方差（Variance）、全距（Range）、最小值（Minimum）、最大值（Maximum）、標(biāo)準(zhǔn)誤

42、（S.E. Mean）（3）分布特征（Distribution Tendency）偏度系數(shù)（Skewness）和峰度系數(shù)（Kurtosis）4.1.3 spss中的相應(yīng)功能1、Spss的用于連續(xù)變量統(tǒng)計描述的過程，均集中在Descriptive Statistics子菜單中。（1）Frequencies：產(chǎn)生原始數(shù)據(jù)的頻數(shù)表，并能計算各種百分位數(shù)?？刂祁l數(shù)表輸出范圍類型的最大數(shù)目（2）Descriptive過程該過程用于一般性的統(tǒng)計描述，相對于Frequencies過程而言，它不能繪制統(tǒng)計圖。（3）Explore 過程該過程用于對連續(xù)性資料分布狀況不清楚時的探索性分析，它可以計算許多描述統(tǒng)計量

43、，給出各種統(tǒng)計圖，并進(jìn)行簡單的參數(shù)估計。（4）Ratio 過程用于對兩個連續(xù)性變量計算相對比指標(biāo)。2、Compares means 均值比較means過程：means過程的優(yōu)勢在于各組的描述指標(biāo)被放在一起便于相互比較，并且如果需要，可以直接輸出結(jié)果，無須再次調(diào)用其它過程。4.2集中趨勢的的描述指標(biāo)4.2.1 算術(shù)平均算術(shù)平均（Arithmetic Mean）是最常用的描述輸送距分布的集中趨勢的統(tǒng)計良?？傮w均數(shù)（Population Mean）用希臘字母表示，樣本均數(shù)常用表示。一、算術(shù)平均數(shù)的定義和性質(zhì)XXaaXXXXXnXnXXXXiiiin22210二、均數(shù)的意義二、均數(shù)的意義任何一個

44、平均數(shù)值首先是同類現(xiàn)象的平均數(shù)。任何一個平均數(shù)總是一個平衡點。但平均數(shù)在高度概括觀測數(shù)據(jù)從而使問題簡化的同時，卻丟失了某些有用的信息，一方面它把各個觀測數(shù)據(jù)之間的差異性掩蓋了起來，另一方面由于平均數(shù)對于個別極端值反應(yīng)比較靈敏，因而平均數(shù)在某些情況下可能具有一定的欺騙性。三、均數(shù)的適用范圍三、均數(shù)的適用范圍嚴(yán)格的講平均數(shù)指示用于定距變量。但有時對于定序變量，求平均等級也可以使用平均數(shù)。4.2.2 中位數(shù)中位數(shù)（Median）是將總體各單位的標(biāo)志值按大小順序排列，處于中間位置的那個標(biāo)志。一、中位數(shù)的定義對于未分組的原始資料，首先必須將標(biāo)志值按大小順序。設(shè)排序結(jié)果為：則中位數(shù)就可以按下列方式確定：二

45、、中位數(shù)的適用范圍nXXXX321為偶數(shù)時當(dāng)為奇數(shù)時當(dāng)n2/n12/2/2/1nnnXXMXM4.2.3其他集中趨勢指標(biāo)一、截尾均數(shù)由于均數(shù)較易受極端之的影響，因此可以考慮將數(shù)據(jù)排序后，按照一定的比例去掉最兩端的數(shù)據(jù)，只是用中部的數(shù)據(jù)來求均數(shù)。如果截尾均數(shù)河源均數(shù)相差不大，則說明數(shù)據(jù)不存在極端值，或者兩側(cè)極端值的影響正好抵消；反之，則說明數(shù)據(jù)中有極端值，此時截為均數(shù)更好地反映數(shù)據(jù)的集中趨勢。常用的截尾均數(shù)有5%截尾均數(shù)，即兩端各去掉5%的數(shù)據(jù)。二、幾何均數(shù)二、幾何均數(shù)幾何均數(shù)適用于原始數(shù)據(jù)分布不對稱，但經(jīng)過對數(shù)轉(zhuǎn)換后稱對稱分布的資料。nXGXXXXGinnlglg1321幾何均數(shù)世紀(jì)上就是對數(shù)

46、轉(zhuǎn)換后的數(shù)據(jù)lgX的算術(shù)平均數(shù)的反對數(shù)。四、調(diào)和均數(shù)它實際上是觀察值X倒數(shù)之均數(shù)的倒數(shù)。三、眾數(shù)（Mode）眾數(shù)指的是樣本數(shù)據(jù)中出現(xiàn)頻次最多的那個數(shù)。眾數(shù)適用于任何層次的變量，特別適用于單峰對稱的情況，是比較兩個分布是否接近首先要考慮的參數(shù)。在SPSS中，眾數(shù)可以在Report子菜單和Tables子菜單的全部報表過程和制表過程中計算出來。在SPSS中，調(diào)和均數(shù)可以在Report子菜單的4個報表過程過程中計算出來。xnxxxnnxxxGnn1111111121214.3 離散趨勢的描述指標(biāo)4.3.1全距（Range）又稱為極差，是一組數(shù)據(jù)中最大值（Maximun）與最小值（Minimum）之差。

47、極差反映的是變量分布的差異范圍或離散程度，在總體中，任何兩個標(biāo)志值之差都不可能超過極差。極差存在兩點不足：一是它僅僅取決于兩個極端之的水平，不能反映其間的變量分布情況，提供的信息太少。二是它容易受個別極端值的影響，不符合穩(wěn)健型的要求。minmaxXXR4.3.2 方差和標(biāo)準(zhǔn)差一、方差（Variance）和標(biāo)準(zhǔn)差（Standard Deviation）的定義將離均差平方和（Sum of Squares of Deviation from Mean，SS）除以觀察例數(shù)N，就得到方差：方差越大，數(shù)據(jù)分布離散程度越大。對于樣本數(shù)據(jù)而言，方差的計算公式為：將方差開方，就得到標(biāo)準(zhǔn)差。對于同性質(zhì)的數(shù)據(jù)來說，

48、標(biāo)準(zhǔn)差越小，表明數(shù)據(jù)的變異程度越小，即數(shù)據(jù)越整齊，數(shù)據(jù)的分布范圍越集中；標(biāo)準(zhǔn)差越大，表明數(shù)據(jù)的變異程度越大，即數(shù)據(jù)越參差不齊，分布越分散。二、方差和標(biāo)準(zhǔn)差的適用范圍：方差和標(biāo)準(zhǔn)差的適用范圍應(yīng)當(dāng)是正態(tài)分布。NXXi22122nXXSi4.3.3 百分位數(shù)、四分位數(shù)與四分位數(shù)間距分位差是對極差指標(biāo)的一種改進(jìn)，是從變量數(shù)列中剔除了一部分極端值后重新計算的類似于極差的指標(biāo)。常用的分位差有四分位差、十分位差、百分位差。一、分位數(shù)一、分位數(shù)分位數(shù)：是一種位置指標(biāo)，用PX表示。一個百分位數(shù)PX將一組觀測之分為兩部分，理論上有x%的觀測值比它小，（100-x）%的觀測值比它大。四分位數(shù)（quartile）、十

49、分位數(shù)（decile）、百分位數(shù)（percentile），他們分別是用3個點、9個點、99個點將數(shù)據(jù)4等分、10等分和100等分后各分位點上的值。二、四分位數(shù)二、四分位數(shù)四分位數(shù)：實際上是三個數(shù)值的總稱，分別是P25、P50、P75分位數(shù)。很顯然，中間的分位數(shù)是中位數(shù)，因此通常所說的四分位數(shù)是指第一個四分位數(shù)（下四分位數(shù)）和第三個四分位數(shù)（上四分位數(shù)）。上下四分位數(shù)的差值稱為四分位數(shù)間距：QR=Q3-Q14.3.4 變異系數(shù)當(dāng)需要比較兩組數(shù)據(jù)離散程度大小的時候，往往直接使用標(biāo)準(zhǔn)差來進(jìn)行比較并不合適。這可以被分為兩種情況：（1）測量尺度相差太大；（2）數(shù)據(jù)量綱不同。在以上情形中，就應(yīng)當(dāng)消除測量尺

50、度和量綱的影響，而變異系數(shù)（Coefficient of Variance），它是標(biāo)準(zhǔn)差和其平均數(shù)的比率。XSCV 4.4 連續(xù)變量統(tǒng)計描述實例4.4.1 數(shù)據(jù)背景介紹4.4.2 使用Explore過程進(jìn)行分析探索分析是對數(shù)據(jù)進(jìn)行初步的觀察分析，主要的分析項目有：觀察數(shù)據(jù)的分布特征：可通過繪制箱圖和莖葉圖等圖形直觀地反映數(shù)據(jù)的分布形式和數(shù)據(jù)的一些規(guī)律性，包括考察數(shù)據(jù)中是否存在異常值等。正態(tài)分布檢驗：檢驗數(shù)據(jù)是否服從正態(tài)分布。方差齊性的檢驗：用Levene檢驗比較各組的方差是否相等。1、單擊Analyze-Descriptive statistics-Explore，打開Explore主對話框

51、：一、分析操作一、分析操作（3）在Display欄中選擇輸出項，依次是Both選擇項，輸出圖形與描述統(tǒng)計量（系統(tǒng)默認(rèn)），只輸出描述統(tǒng)計量和只輸出圖形。本例中選擇默認(rèn)項。（1）從左側(cè)的變量列表中選出變量”身高”，送入Dependent List欄。（2）選擇”性別”作為因子變量，送入Factor List欄。有了因子變量，SPSS會把所有的觀測個體按照因子變量的取值分成若干各組，再分組考察Dependent List中的各個變量，如果不選擇因子變量，SPSS會對全部觀測來做探索分析。2、單擊Statistics統(tǒng)計量按鈕，打開Statistics對話框,選擇統(tǒng)計輸出量

52、。（1）Descriptives基本統(tǒng)計描述。同時指定均值的置信區(qū)間的置信度，系統(tǒng)默認(rèn)為95。（2）M-估計（M估計在計算時對所有觀測量賦予權(quán)重，隨觀測量距分布中心的遠(yuǎn)近而變化）。（3）Outliers輸出分析數(shù)據(jù)中五個最大值和五個最小值。（4）Percentiles輸出百分?jǐn)?shù)。 3、單擊Plots 圖形按鈕，打開Plots對話框。（1）Boxplot 箱圖選擇欄 Factor levels together因變量按因素水平分組（系統(tǒng)默認(rèn)）；Dependents together 所有因變量生成一個并列箱圖（本例中選擇項）；None不顯示箱圖。（2）Descriptive 描述圖形欄Ste

53、m-and-leaf 莖葉圖Histogram 直方圖（3）Normality plots with test(復(fù)選項)，正態(tài)分布檢驗并輸出Q-Q圖。 None：不產(chǎn)生回歸直線的斜率和方差齊性檢驗；Power Estimation轉(zhuǎn)換冪值估計（對每組數(shù)據(jù)產(chǎn)生一個中位數(shù)自然對數(shù)及四個分位數(shù)的自然對數(shù)的散點圖）選項；Transformed 變換原始數(shù)據(jù)選擇項；Untransformed不變換變換原始數(shù)據(jù)選擇項。（4）Spread vs level with Levene Test欄，對所有的散布層次圖，同時輸出回歸直線的斜率以及方差齊性的Levenes檢驗。4、單擊Option按紐，打開Optio

54、n對話框如圖所示?？蛇x擇缺失值的處理方式，SPSS提供三種處理方式：（1）Exclude cases listwies 剔除帶缺失值的觀測量（系統(tǒng)默認(rèn)）。（2）Exclude cases pairwise 剔除帶缺失值的觀測量時還一并剔除與缺失值有成對關(guān)系的觀測量。（3）Report values 輸出頻數(shù)表時同時輸出缺失值。5、單擊OK，得到相應(yīng)的輸出結(jié)果如表所示。二、基本的分析結(jié)果二、基本的分析結(jié)果Case Processi ng Sum m aryCase Processi ng Sum m ary6995.8%34.2%72100.0%14699.3%1.7%147100.0%性別男

55、女身高NPercentNPercentNPercentVali dM i ssingTotalCasesDescript ivesDescript ives174.71.671173.37176.05174.70175.0031.0625.573159188298-.034.289.138.570162.88.430162.03163.73162.83163.0026.9505.191151178277.157.201-.203.399M eanLower BoundUpper Bound95% ConfidenceInt erval f or M ean5% Trim m ed M eanM

56、 edianVar ianceStd. Deviati onM i nim umM axi m umRangeInt erquarti le RangeSkewnessKur tosisM eanLower BoundUpper Bound95% ConfidenceInt erval f or M ean5% Trim m ed M eanM edianVar ianceStd. Deviati onM i nim umM axi m umRangeInt erquarti le RangeSkewnessKur tosis性別男女身高StatisticStd. Error三、輸出百分位數(shù)和

57、極端值列表Percentil esPercentil es165.00168.00170.00175.00178.00182.00185.00155.00156.70159.00163.00166.00170.00172.00170.00175.00178.00159.00163.00166.00性別男女男女身高身高W eightedAverage(Definiti on 1)Tukey s Hinges5102550759095Percentiles160170180190身高05101520FrequencyMean = 174.71Std. Dev. = 5.573N = 69for s

58、ex= 男Histogram身高 Stem-and-Leaf Plot forsex= 男 Frequency Stem & Leaf 1.00 15 . 9 .00 16 . 9.00 16 . 555778999 20.00 17 . 00000000011112334444 24.00 17 . 555555555556677777788889 12.00 18 . 000000122234 3.00 18 . 668 Stem width: 10 Each leaf: 1 case(s)男女性別150160170180190身高114箱圖中，最底部的水平線段是數(shù)據(jù)的最小值（奇異

59、點除外），頂部的水平線段是數(shù)據(jù)的最大值（奇異點除外），中間矩形箱子的底所在位置是數(shù)據(jù)的第一個四分位數(shù)（即25分位數(shù)），箱子頂部所在位置是數(shù)據(jù)的第三個四分位數(shù)據(jù)（即75分位數(shù)）。箱子中間的水平線段刻畫的是數(shù)據(jù)的中位數(shù)（即50分位數(shù)）。 4.4.3使用其他過程過程進(jìn)行分析一、Descriptive過程的結(jié)果D De es sc cr ri ip pt ti iv ve e S St ta at ti is st ti ic cs s215151188166.677.668215身高Valid N (listwise)NMinimumMaximumMeanStd. Deviation二、Freque

60、ncies過程的結(jié)果Statisti csStatisti cs身高2154155.80160.00165.00172.00180.00Val idM issi ngN525507595Per centiles4.5 連續(xù)性變量的參數(shù)估計根據(jù)樣本數(shù)據(jù)對總體的客觀規(guī)律性作出合理估計的過程被稱為統(tǒng)計推斷（Statistical Inference），它可以被分為參數(shù)估計和假設(shè)檢驗兩大類。4.5.1 正態(tài)分布一、正態(tài)分布的定義若連續(xù)性隨即變量X的概率分布密度函數(shù)為則稱隨機變量X服從正態(tài)分布（Normal Distribution） 22221Xexf二、正態(tài)分布的特征（1）正態(tài)分布是一條對稱曲線，關(guān)于均數(shù)對稱，因此

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

數(shù)據(jù)統(tǒng)計SPSS教程完整版

文檔簡介

溫馨提示

最新文檔

評論

數(shù)據(jù)統(tǒng)計SPSS教程完整版

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔