版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
實(shí)驗(yàn)基本描述統(tǒng)計(jì)1第一頁,共八十八頁,2022年,8月28日統(tǒng)計(jì)分析軟件的作用統(tǒng)計(jì)分析是數(shù)據(jù)分析的主要工具完整的數(shù)據(jù)分析過程包括:數(shù)據(jù)的收集數(shù)據(jù)的整理數(shù)據(jù)的分析統(tǒng)計(jì)學(xué)為數(shù)據(jù)分析過程提供一套完整的科學(xué)的方法論。統(tǒng)計(jì)分析軟件為數(shù)據(jù)分析提供了實(shí)現(xiàn)手段。2第二頁,共八十八頁,2022年,8月28日統(tǒng)計(jì)軟件的種類很多。有些功能齊全,有些價(jià)格便宜;有些容易操作,有些需要更多的實(shí)踐才能掌握。還有些是專門的軟件,只處理某一類統(tǒng)計(jì)問題。面對(duì)太多的選擇往往給決策帶來困難。這里介紹最常見的幾種。統(tǒng)計(jì)軟件3第三頁,共八十八頁,2022年,8月28日幾種常用的統(tǒng)計(jì)軟件典型的統(tǒng)計(jì)軟件SASSPSSMINITABEviewsExcelMINITABSTATISTICAExcelSASSPSS4第四頁,共八十八頁,2022年,8月28日SAS:這是功能非常齊全的軟件;盡管價(jià)格相當(dāng)不菲,許多公司,特別是美國制藥公司,還是因?yàn)槠涔δ鼙姸嗪湍承┟绹畽C(jī)構(gòu)認(rèn)可而使用。盡管現(xiàn)在已經(jīng)盡量“通俗化”,但仍然需要一定的訓(xùn)練才可以進(jìn)入。也可以對(duì)它編程;但對(duì)于基本統(tǒng)計(jì)課程則不那么方便。Minitab:這個(gè)軟件是很方便的功能強(qiáng)大而又齊全的軟件,在我國用的不如SPSS與SAS那么普遍。Eviews:一個(gè)主要處理回歸和時(shí)間序列的軟件。采用計(jì)量經(jīng)濟(jì)學(xué)方法與技術(shù),對(duì)社會(huì)經(jīng)濟(jì)關(guān)系與經(jīng)濟(jì)活動(dòng)的數(shù)量規(guī)律進(jìn)行“觀察”,是一個(gè)得到普遍使用計(jì)量經(jīng)濟(jì)學(xué)軟件包。5第五頁,共八十八頁,2022年,8月28日S-PlusS語言(AT&T貝爾實(shí)驗(yàn)室)的后續(xù)發(fā)展極為強(qiáng)大的統(tǒng)計(jì)功能和繪圖能力應(yīng)用上以理論研究、統(tǒng)計(jì)建模為主需要有較好的數(shù)理統(tǒng)計(jì)背景對(duì)編程能力要求極高Excel凡有MicrosoftOffice的計(jì)算機(jī),基本上都裝有Excel。但要注意,必須裝數(shù)據(jù)分析的功能。隨著問題的深入,Excel需要使用函數(shù)。專門一些的統(tǒng)計(jì)推斷問題還需要其他專門的統(tǒng)計(jì)軟件來處理。6第六頁,共八十八頁,2022年,8月28日SPSS:很受歡迎;容易操作,輸出漂亮,功能齊全,價(jià)格合理。它也有自己的程序語言,但基本上已經(jīng)“通俗化”。對(duì)于非專業(yè)統(tǒng)計(jì)工作者是很好的選擇。7第七頁,共八十八頁,2022年,8月28日SPSS軟件最初全稱為“社會(huì)科學(xué)統(tǒng)計(jì)軟件包”(StatisticalPackageforthesocialScience);隨著SPSS產(chǎn)品服務(wù)領(lǐng)域的擴(kuò)大和服務(wù)深度的增加,SPSS公司于2000年正式將英文全稱更改為“統(tǒng)計(jì)產(chǎn)品與服務(wù)解決方案”(StatisticalProductandServiceSolutions);如今SPSS已出至版本19.0,而且更名為PASWStatistics。SPSS是一個(gè)集數(shù)據(jù)整理、分析過程、結(jié)果輸出等功能于一身的組合式軟件包,是數(shù)據(jù)處理和統(tǒng)計(jì)領(lǐng)域的國際標(biāo)準(zhǔn)軟件之一;SPSSForWindows是SPSS軟件的Windows版本,它具有清晰、直觀、易學(xué)易用、涵蓋面廣的特點(diǎn)。8第八頁,共八十八頁,2022年,8月28日應(yīng)用統(tǒng)計(jì)軟件進(jìn)行分析的基本過程弄清分析的目的正確收集待處理和分析的數(shù)據(jù)(目的、影響因素的剔除)弄清統(tǒng)計(jì)概念和統(tǒng)計(jì)含義,知道統(tǒng)計(jì)方法的適用范圍。無需記憶公式選擇一種或幾種統(tǒng)計(jì)分析方法來探索性地分析數(shù)據(jù)讀懂計(jì)算機(jī)分析的數(shù)據(jù)結(jié)果,發(fā)現(xiàn)規(guī)律,得出結(jié)論9第九頁,共八十八頁,2022年,8月28日從統(tǒng)計(jì)方法的構(gòu)成分類統(tǒng)計(jì)方法描述統(tǒng)計(jì)推斷統(tǒng)計(jì)10第十頁,共八十八頁,2022年,8月28日描述統(tǒng)計(jì):是用圖形、表格和概括性的數(shù)字對(duì)數(shù)據(jù)進(jìn)行描述的統(tǒng)計(jì)方法。內(nèi)容:搜集數(shù)據(jù)整理數(shù)據(jù)顯示數(shù)據(jù)
目的描述數(shù)據(jù)特征找出數(shù)據(jù)的基本規(guī)律02550Q1Q2Q3Q4¥=30s2=10511第十一頁,共八十八頁,2022年,8月28日推斷統(tǒng)計(jì):
研究如何根據(jù)樣本數(shù)據(jù)對(duì)總體進(jìn)行估計(jì)、假設(shè)檢驗(yàn)、預(yù)測(cè)和其他推斷的統(tǒng)計(jì)方法。內(nèi)容參數(shù)估計(jì)假設(shè)檢驗(yàn)?zāi)康膶?duì)總體特征作出推斷可靠性測(cè)度樣本總體12第十二頁,共八十八頁,2022年,8月28日實(shí)驗(yàn)內(nèi)容安排軟件:SPSS18.0目的:掌握統(tǒng)計(jì)軟件的基本應(yīng)用實(shí)驗(yàn)1:數(shù)據(jù)文件管理實(shí)驗(yàn)2:基本的統(tǒng)計(jì)描述實(shí)驗(yàn)3:方差分析實(shí)驗(yàn)4:相關(guān)與回歸分析13第十三頁,共八十八頁,2022年,8月28日實(shí)驗(yàn)1:數(shù)據(jù)文件管理§1.1SPSS系統(tǒng)運(yùn)行管理方式§1.2數(shù)據(jù)管理窗口介紹§1.3數(shù)據(jù)文件的建立與管理實(shí)驗(yàn)?zāi)康模赫莆瘴募膭?chuàng)建和整理,包括數(shù)據(jù)的查詢、數(shù)據(jù)排序、篩選等。14第十四頁,共八十八頁,2022年,8月28日§1.1SPSS系統(tǒng)運(yùn)行管理方式完全窗口菜單運(yùn)行方式是在數(shù)據(jù)編輯窗口和輸出觀察窗口中,通過選用菜單項(xiàng)中的各種功能和工具欄中的圖標(biāo)按鈕來完成各項(xiàng)統(tǒng)計(jì)功能的一種運(yùn)行方式特點(diǎn):利用對(duì)話框操作,簡便直觀,特別適用于初學(xué)者和非專業(yè)人員;對(duì)于某些專業(yè)人員來說,可能不能充分滿足其需要。15第十五頁,共八十八頁,2022年,8月28日程序運(yùn)行方式是通過在Syntax(語句)窗口中直接運(yùn)行編寫好的程序來完成各項(xiàng)統(tǒng)計(jì)功能的運(yùn)行方式特點(diǎn):方便已習(xí)慣使用SPSS語言編寫程序的用戶使用;能簡化某些工作,比如,成批次地處理數(shù)據(jù)、重復(fù)相同的統(tǒng)計(jì)分析過程等;專業(yè)人員可通過該運(yùn)行方式,使用某些對(duì)話框操作不能實(shí)現(xiàn)的功能?;旌线\(yùn)行方式是完全窗口菜單運(yùn)行方式和程序運(yùn)行方式的結(jié)合,既能簡化操作,又可以補(bǔ)充單純窗口運(yùn)行管理的不足。16第十六頁,共八十八頁,2022年,8月28日進(jìn)行統(tǒng)計(jì)分析的基本操作步驟:將數(shù)據(jù)輸入SPSS(定義變量、錄入數(shù)據(jù)等),并存盤;進(jìn)行必要的預(yù)分析(進(jìn)行分布圖、均數(shù)、標(biāo)準(zhǔn)差的描述等),以確定應(yīng)采用的統(tǒng)計(jì)分析方法;按分析目的選用統(tǒng)計(jì)程序,執(zhí)行統(tǒng)計(jì)分析過程;保存和導(dǎo)出分析結(jié)果。第十七頁,共八十八頁,2022年,8月28日菜單欄常用工具欄數(shù)據(jù)欄當(dāng)前單元格§1.2數(shù)據(jù)管理窗口介紹18第十八頁,共八十八頁,2022年,8月28日File(文件操作)完成文件的調(diào)入,存儲(chǔ),顯示和打印等操作Edit(文件編輯)完成文本或數(shù)據(jù)內(nèi)容的選擇、拷貝、粘貼、尋找和替換等操作19第十九頁,共八十八頁,2022年,8月28日View(窗口外觀控制)完成文本或數(shù)據(jù)內(nèi)容的狀態(tài)欄、工具欄、字體、網(wǎng)格線和數(shù)值標(biāo)簽等功能的操作Data(數(shù)據(jù)管理)完成數(shù)據(jù)變量名稱和格式的定義,數(shù)據(jù)資料的選擇、排序、加權(quán)、數(shù)據(jù)文件的轉(zhuǎn)換、連接和匯總等操作20第二十頁,共八十八頁,2022年,8月28日Transform(數(shù)據(jù)轉(zhuǎn)換)完成數(shù)據(jù)值的計(jì)算、重新編碼和缺失值替代等操作Analyze(統(tǒng)計(jì)分析)完成一系列統(tǒng)計(jì)分析的選擇和應(yīng)用21第二十一頁,共八十八頁,2022年,8月28日Graphs(統(tǒng)計(jì)圖表)完成統(tǒng)計(jì)圖表的建立和編輯Utilities(實(shí)用程序)有關(guān)命令解釋、字體選擇、文件信息、定義輸出標(biāo)題和窗口設(shè)計(jì)等Window(窗口控制)可進(jìn)行窗口的排列、選擇和顯示等操作Help(幫助)幫助文件的調(diào)用、查詢和顯示等22第二十二頁,共八十八頁,2022年,8月28日SPSS數(shù)據(jù)文件是一種有結(jié)構(gòu)的數(shù)據(jù)文件,它包括:文件結(jié)構(gòu)數(shù)據(jù)§1.3數(shù)據(jù)文件的建立與管理23第二十三頁,共八十八頁,2022年,8月28日SPSS數(shù)據(jù)文件中的一列數(shù)據(jù)稱為一個(gè)變量,每個(gè)變量都有一個(gè)名稱,即變量名,變量名是存取SPSS每個(gè)變量的唯一標(biāo)識(shí)。SPSS數(shù)據(jù)文件的結(jié)構(gòu)是對(duì)每個(gè)變量及其相關(guān)屬性的描述。一行數(shù)據(jù)稱為一條個(gè)案(Case)或觀測(cè),所有個(gè)案組成了SPSS數(shù)據(jù)文件的數(shù)據(jù)部分。24第二十四頁,共八十八頁,2022年,8月28日建立SPSS數(shù)據(jù)文件應(yīng)通過兩大步驟實(shí)現(xiàn):第一步:定義SPSS數(shù)據(jù)文件的結(jié)構(gòu);第二步:輸入分析數(shù)據(jù)。定義SPSS數(shù)據(jù)文件的結(jié)構(gòu);包括:變量名、變量類型、變量寬度、變量名標(biāo)簽、變量值標(biāo)簽、缺失值、顯示寬度、顯示的對(duì)齊方式、變量的測(cè)度類型等信息。
至少要定義變量名和變量類型,其他暫時(shí)設(shè)為默認(rèn)值,待分析需要時(shí)再設(shè)置。25第二十五頁,共八十八頁,2022年,8月28日在數(shù)據(jù)編輯窗口中,單擊“變量視圖”的標(biāo)簽進(jìn)行設(shè)置。變量定義完成后,單擊“數(shù)據(jù)視圖”的標(biāo)簽進(jìn)行具體變量值的錄入。26第二十六頁,共八十八頁,2022年,8月28日數(shù)據(jù)編輯在SPSS中,對(duì)數(shù)據(jù)進(jìn)行基本編輯操作的功能集中在“編輯”和“數(shù)據(jù)”菜單中。移動(dòng)指針到指定序號(hào)的觀測(cè)量
【編輯】——【轉(zhuǎn)至個(gè)案】查找指定變量中的指定數(shù)據(jù)
【編輯】——【查找】插入一個(gè)變量
【編輯】——【插入變量】插入一個(gè)觀測(cè)量
【編輯】——【插入個(gè)案】查看變量信息
【實(shí)用程序】——【變量】27第二十七頁,共八十八頁,2022年,8月28日在數(shù)據(jù)窗口單擊【數(shù)據(jù)】【排列個(gè)案】,打開對(duì)話框。觀測(cè)數(shù)據(jù)排序28第二十八頁,共八十八頁,2022年,8月28日在統(tǒng)計(jì)分析中,有時(shí)不需要對(duì)所有的觀測(cè)進(jìn)行分析,可能只對(duì)某些特定的對(duì)象有興趣。利用【數(shù)據(jù)】【選擇個(gè)案】,可以實(shí)現(xiàn)。抽樣(篩選)全部個(gè)案:選擇所有數(shù)據(jù);如果條件滿足:按指定條件選擇數(shù)據(jù)。單擊如果按紐,打開選擇個(gè)案:If對(duì)話框,先選擇變量,然后定義條件。29第二十九頁,共八十八頁,2022年,8月28日選擇個(gè)案:If對(duì)話框,先選擇變量,然后定義條件。30第三十頁,共八十八頁,2022年,8月28日抽樣(篩選)隨機(jī)個(gè)案樣本:對(duì)觀察值進(jìn)行隨機(jī)抽樣。單擊樣本按紐,打開選擇個(gè)案:隨機(jī)樣本對(duì)話框。如圖所示。在樣本尺寸欄中有兩種選擇方式:一種是大約:即鍵入抽樣比例后由系統(tǒng)隨機(jī)抽樣;另一種是精確:要求輸入從第幾個(gè)觀察值起抽取多少數(shù)據(jù)。31第三十一頁,共八十八頁,2022年,8月28日抽樣(篩選)基于時(shí)間或個(gè)案全距:順序抽樣。單擊范圍按紐,打開選擇個(gè)案:范圍對(duì)話框,用戶自行定義從第幾個(gè)觀察值開始抽到第幾個(gè)觀察值結(jié)束。使用篩選器變量:用指定變量作過濾。先選擇一個(gè)變量,系統(tǒng)自動(dòng)在數(shù)據(jù)管理器中將該變量值為0的觀測(cè)單位標(biāo)上刪除記號(hào),系統(tǒng)對(duì)標(biāo)有刪除記號(hào)的觀測(cè)單位不作分析。32第三十二頁,共八十八頁,2022年,8月28日實(shí)驗(yàn)2:基本的統(tǒng)計(jì)描述作為一條普遍的規(guī)則,當(dāng)一批數(shù)據(jù)中的數(shù)據(jù)有20個(gè)左右或者更多的時(shí)候,就應(yīng)該制作表格或者圖表。這樣,數(shù)據(jù)的重要特征就能從表格或者圖表中反映出來。其目標(biāo)也是提高數(shù)據(jù)分析和數(shù)據(jù)解釋的效率——這是決策過程的兩個(gè)關(guān)鍵方面。33第三十三頁,共八十八頁,2022年,8月28日在建立了數(shù)據(jù)文件之后,需要對(duì)數(shù)據(jù)作進(jìn)一步的考察,如了解數(shù)據(jù)的基本特征,如數(shù)據(jù)的均值、標(biāo)準(zhǔn)差、四分位點(diǎn),數(shù)據(jù)的分布形態(tài)等,這個(gè)過程稱為對(duì)數(shù)據(jù)進(jìn)行基本統(tǒng)計(jì)描述。所以說,數(shù)據(jù)的基本統(tǒng)計(jì)描述的目的是:了解數(shù)據(jù)的基本特征和基本分布形狀,為進(jìn)一步分析做好充分準(zhǔn)備。34第三十四頁,共八十八頁,2022年,8月28日數(shù)值描述分布的形狀集中趨勢(shì)離散程度眾數(shù)中位數(shù)平均值標(biāo)準(zhǔn)誤差方差峰態(tài)標(biāo)準(zhǔn)差全距偏態(tài)35第三十五頁,共八十八頁,2022年,8月28日眾數(shù):在總體中出現(xiàn)次數(shù)最多的那個(gè)標(biāo)志值不受極端值影響具有不惟一性數(shù)據(jù)分布偏斜程度較大時(shí)應(yīng)用中位數(shù):一組排序的數(shù)據(jù)中,在中間位置上的數(shù)據(jù)不受極端值影響數(shù)據(jù)分布偏斜程度較大時(shí)應(yīng)用均值:全部數(shù)據(jù)的算術(shù)平均易受極端值影響數(shù)學(xué)性質(zhì)優(yōu)良數(shù)據(jù)對(duì)稱分布或接近對(duì)稱分布時(shí)應(yīng)用集中趨勢(shì)的測(cè)度值:36第三十六頁,共八十八頁,2022年,8月28日數(shù)據(jù)類型和所適用的集中趨勢(shì)測(cè)度值定類數(shù)據(jù)定序數(shù)據(jù)數(shù)量數(shù)據(jù)適用的測(cè)度值眾數(shù)*眾數(shù)眾數(shù)中位數(shù)*中位數(shù)均值*幾何平均數(shù)調(diào)和平均數(shù)*表示最適合37第三十七頁,共八十八頁,2022年,8月28日全距:最大值與最小值的差計(jì)算方便,易于理解只考慮兩端數(shù)據(jù),比較粗略方差:離差平方的平均數(shù)準(zhǔn)確反映數(shù)據(jù)的離散程度數(shù)據(jù)離散程度的最常用測(cè)度值標(biāo)準(zhǔn)差:離差平方平均數(shù)的平方根準(zhǔn)確反映數(shù)據(jù)的離散程度具有量綱,實(shí)際意義清楚數(shù)據(jù)離散程度的最常用測(cè)度值離散程度的測(cè)度值:38第三十八頁,共八十八頁,2022年,8月28日數(shù)據(jù)類型和所適用的離散程度測(cè)度值定類數(shù)據(jù)定序數(shù)據(jù)數(shù)量數(shù)據(jù)適用的測(cè)度值異眾比率*異眾比率異眾比率四分位差*四分位差
極差、平均差方差、標(biāo)準(zhǔn)差*離散系數(shù)*(比較)*表示最適合39第三十九頁,共八十八頁,2022年,8月28日偏態(tài):分布偏斜方向及程度偏態(tài)系數(shù)
SK=0為對(duì)稱分布偏態(tài)系數(shù)SK>0
為右偏分布偏態(tài)系數(shù)SK<0
為左偏分布SK的絕對(duì)值越大,表示偏斜的程度就越大分布的形狀:左偏分布均值
中位數(shù)
眾數(shù)fx右偏分布眾數(shù)
中位數(shù)均值fx40第四十頁,共八十八頁,2022年,8月28日峰度:分布集中趨勢(shì)高峰的形狀峰態(tài)系數(shù)K=0標(biāo)準(zhǔn)正態(tài)分布峰態(tài)系數(shù)K<0為扁平分布峰態(tài)系數(shù)K>0為尖峰分布分布的形狀:扁平分布尖峰分布與標(biāo)準(zhǔn)正態(tài)分布比較!41第四十一頁,共八十八頁,2022年,8月28日1.描述統(tǒng)計(jì)分析2.頻數(shù)分析3.探索分析4.列聯(lián)表5.統(tǒng)計(jì)圖42第四十二頁,共八十八頁,2022年,8月28日1.描述統(tǒng)計(jì)分析描述統(tǒng)計(jì)分析是對(duì)數(shù)據(jù)進(jìn)行基礎(chǔ)性描述的過程??梢酝ㄟ^計(jì)算均值、算術(shù)和、標(biāo)準(zhǔn)差、極值、方差、均值、標(biāo)準(zhǔn)誤等統(tǒng)計(jì)量來描述樣本數(shù)據(jù)的集中趨勢(shì)、離散趨勢(shì)及分布特征;描述統(tǒng)計(jì)分析過程,可通過分析對(duì)話框(分析描述統(tǒng)計(jì)描述)來具體實(shí)現(xiàn)。43第四十三頁,共八十八頁,2022年,8月28日例2.1以某年全國職工平均工資表為例(SY-11),要求對(duì)其進(jìn)行簡單的描述統(tǒng)計(jì)分析。具體操作步驟如下:1、首先打開數(shù)據(jù)表SY-11,按照分析(Analyze)描述統(tǒng)計(jì)(DescriptivesStatistics)
描述(Descriptives),打開對(duì)話框,如圖所示。從左邊源變量中選擇一個(gè)或者幾個(gè)變量進(jìn)入右框中計(jì)算并保存所選變量的標(biāo)準(zhǔn)化值,公式為44第四十四頁,共八十八頁,2022年,8月28日2.單擊選項(xiàng)Options按鈕,打開Options對(duì)話框,如圖所示:在此例中選擇按平均值升序項(xiàng),返回主對(duì)話框,單擊OK,在輸出窗口得描述統(tǒng)計(jì)分析輸出表。45第四十五頁,共八十八頁,2022年,8月28日輸出結(jié)果:標(biāo)準(zhǔn)化值46第四十六頁,共八十八頁,2022年,8月28日2.頻數(shù)分析利用頻數(shù)分析可以方便地對(duì)數(shù)據(jù)按組進(jìn)行歸類整理;形成各變量的不同水平(分組)的頻數(shù)分布表及圖形,以便對(duì)各變量的數(shù)據(jù)特征和觀測(cè)量的分布狀況有一個(gè)概括的認(rèn)識(shí);47第四十七頁,共八十八頁,2022年,8月28日48第四十八頁,共八十八頁,2022年,8月28日例2.2數(shù)據(jù)文件SY-12是一個(gè)公司職員表,其中有性別、年齡,受教育年限等五個(gè)變量,具體操作如下:
1、打開數(shù)據(jù)文件SY-12后,單擊分析描述統(tǒng)計(jì)頻率(Frequencies),打開頻數(shù)分析對(duì)話框。2、在左邊的變量框中選中一個(gè)或多個(gè)變量。3、選中顯示頻率表格。49第四十九頁,共八十八頁,2022年,8月28日4、單擊統(tǒng)計(jì)量按鈕,得到對(duì)話框圖。在頻率:統(tǒng)計(jì)量對(duì)話框中選擇要求輸出的統(tǒng)計(jì)量。50第五十頁,共八十八頁,2022年,8月28日5、單擊圖表(Chart)按鈕,得到對(duì)話框圖選擇直方圖51第五十一頁,共八十八頁,2022年,8月28日6、單擊格式(Format)按鈕,得到對(duì)話框圖。本例中均選擇系統(tǒng)默認(rèn)項(xiàng)52第五十二頁,共八十八頁,2022年,8月28日輸出結(jié)果:點(diǎn)擊OK53第五十三頁,共八十八頁,2022年,8月28日從表和直方圖中可以觀察到該公司32歲至47歲之間的人數(shù)最多,占到總?cè)藬?shù)的60%以上。54第五十四頁,共八十八頁,2022年,8月28日3探索分析過程探索分析是指對(duì)測(cè)得的數(shù)據(jù)進(jìn)行更為深入詳盡的描述性統(tǒng)計(jì)分析。在一般描述性統(tǒng)計(jì)指標(biāo)的基礎(chǔ)上,增加有關(guān)數(shù)據(jù)其他特征的文字與圖形描述,顯得更加細(xì)致與全面,有助于用戶思考對(duì)數(shù)據(jù)進(jìn)行進(jìn)一步分析的方案。目的是:觀察數(shù)據(jù)的分布特征:可通過繪制箱圖和莖葉圖等圖形直觀地反映數(shù)據(jù)的分布形式和數(shù)據(jù)的一些規(guī)律性,包括考察數(shù)據(jù)中是否存在異常值等。正態(tài)分布檢驗(yàn):檢驗(yàn)數(shù)據(jù)是否服從正態(tài)分布。方差齊性的檢驗(yàn):用Levene檢驗(yàn)比較各組的方差是否相等。55第五十五頁,共八十八頁,2022年,8月28日以數(shù)據(jù)庫SY-13提供的兩個(gè)班的學(xué)習(xí)成績數(shù)據(jù)為例,對(duì)兩個(gè)班的數(shù)學(xué)成績按照性別進(jìn)行數(shù)據(jù)的分布、按照性別檢驗(yàn)其數(shù)學(xué)成績的方差是否相等。打開數(shù)據(jù)庫SY-13。例2.356第五十六頁,共八十八頁,2022年,8月28日1、單擊分析(Analyze)->描述統(tǒng)計(jì)(Descriptivestatistics)->探索(Explore),打開Explore主對(duì)話框。選擇分析變量指定分組變量選擇標(biāo)識(shí)變量從左側(cè)的變量列表中選出分析變量,送入因變量列表欄;選擇因子變量,SPSS會(huì)把所有的觀測(cè)個(gè)體按照因子變量的取值分成若干各組,再分組考察分析變量中的各個(gè)變量,如果不選擇因子變量,SPSS會(huì)對(duì)全部觀測(cè)來做探索分析。選擇標(biāo)識(shí)變量,當(dāng)輸出涉及到觀測(cè)量時(shí),使用該變量值標(biāo)識(shí)各觀測(cè)量。57第五十七頁,共八十八頁,2022年,8月28日2、單擊統(tǒng)計(jì)量按鈕,打開對(duì)話框,選擇統(tǒng)計(jì)輸出量。有四個(gè)選擇項(xiàng),分別是:基本統(tǒng)計(jì)描述。同時(shí)指定均值的置信區(qū)間的置信度,系統(tǒng)默認(rèn)為95%。M-估計(jì)(M估計(jì)在計(jì)算時(shí)對(duì)所有觀測(cè)量賦予權(quán)重,隨觀測(cè)量距分布中心的遠(yuǎn)近而變化);Outliers輸出分析數(shù)據(jù)中五個(gè)最大值和五個(gè)最小值;Percentiles輸出百分?jǐn)?shù)。本例中選擇Descriptives和Outliers后,返回主對(duì)話框。。58第五十八頁,共八十八頁,2022年,8月28日3.單擊繪制按鈕,打開對(duì)話框,如圖所示。59第五十九頁,共八十八頁,2022年,8月28日4、單擊選項(xiàng)按紐,打開對(duì)話框??蛇x擇缺失值的處理方式,SPSS提供三種處理方式:剔除帶有缺失值的觀測(cè)量同時(shí)剔除缺失值及與其有成對(duì)關(guān)系的觀測(cè)量輸出頻數(shù)表時(shí)同時(shí)輸出缺失值60第六十頁,共八十八頁,2022年,8月28日5、單擊OK,得到相應(yīng)的輸出結(jié)果。輸出結(jié)果㈠:5%的修正均值:排除掉數(shù)據(jù)分布兩端5%的變量值之后計(jì)算的平均值5%的修正均值:排除掉數(shù)據(jù)分布兩端5%的變量值之后計(jì)算的平均值四分位數(shù)間距61第六十一頁,共八十八頁,2022年,8月28日極端值:按照性別輸出數(shù)學(xué)成績的五個(gè)最大值及五個(gè)最小值62第六十二頁,共八十八頁,2022年,8月28日正態(tài)分布檢驗(yàn)表
從檢驗(yàn)結(jié)果可以看出,由于假設(shè)檢驗(yàn)的P值均大于0.05,故可以認(rèn)為男女生的數(shù)學(xué)成績分布都近似地服從正態(tài)分布。輸出結(jié)果㈡:當(dāng)顯著性水平P<0.05時(shí),數(shù)據(jù)就不是正態(tài)分布當(dāng)樣本量小于50時(shí)才比較精確63第六十三頁,共八十八頁,2022年,8月28日莖葉圖輸出結(jié)果(三):64第六十四頁,共八十八頁,2022年,8月28日
按照性別繪制的數(shù)學(xué)成績的箱圖
(代表變量中間50%的觀測(cè)值)從上面的箱圖中可以得出結(jié)論:女生的數(shù)學(xué)成績的平均水平比男生低且分散程度小,但有一個(gè)離群值。除了離群值O(距方框上下限超1.5倍盒距)和極值E(距方框上下限超3倍盒距)之外的最大值和最小值上下四分位數(shù)、中位數(shù)65第六十五頁,共八十八頁,2022年,8月28日正態(tài)圖(也可判斷正態(tài)分布,但不能僅僅依靠正態(tài)圖)輸出結(jié)果(四):【探索】命令會(huì)輸出兩種正態(tài)圖:NormalQ-Q圖;DetrendedNormalQ-Q圖;66第六十六頁,共八十八頁,2022年,8月28日正態(tài)分布Q-Q圖上圖中間的斜線是服從正態(tài)分布的標(biāo)準(zhǔn)線。從上面的分布圖中看出,除個(gè)別極端點(diǎn)外,數(shù)據(jù)點(diǎn)都在斜線周圍波動(dòng),故可以認(rèn)為女生的數(shù)學(xué)成績近似服從正態(tài)分布。67第六十七頁,共八十八頁,2022年,8月28日縱坐標(biāo)是期望值(在標(biāo)準(zhǔn)正態(tài)分布下的轉(zhuǎn)換值)68第六十八頁,共八十八頁,2022年,8月28日離散正態(tài)分布圖從上面的離散正態(tài)分布圖中看出,除個(gè)別極端點(diǎn)外,離散點(diǎn)都在±2的周圍波動(dòng),故可以認(rèn)為女生的數(shù)學(xué)成績近似服從正態(tài)分布??v坐標(biāo)是實(shí)際觀測(cè)值與期望值的差69第六十九頁,共八十八頁,2022年,8月28日方差齊性檢驗(yàn)由表得出方差齊性檢驗(yàn)的P值為0.8以上,故認(rèn)為男女生數(shù)學(xué)成績的方差是相等的。輸出結(jié)果(五):70第七十頁,共八十八頁,2022年,8月28日4列聯(lián)表分析當(dāng)觀察的現(xiàn)象與兩個(gè)因素有關(guān)時(shí),如某種服裝的銷量受價(jià)格和居民收入影響;某種產(chǎn)品的生產(chǎn)成本受原材料價(jià)格和產(chǎn)量的影響等等;交叉列聯(lián)表分析可以比較好的反映出兩個(gè)因素之間有無關(guān)聯(lián)性,兩因素與現(xiàn)象之間的相關(guān)關(guān)系。
71第七十一頁,共八十八頁,2022年,8月28日數(shù)據(jù)列聯(lián)表分析主要包括兩個(gè)基本任務(wù):根據(jù)收集的樣本數(shù)據(jù),產(chǎn)生二維或多維交叉列聯(lián)表;在此基礎(chǔ)上,對(duì)兩兩變量間是否存在關(guān)聯(lián)性進(jìn)行檢驗(yàn)。變量x是列變量,類別數(shù)為c,一般為自變量;變量y是行變量,類別數(shù)為r,一般為因變量;72第七十二頁,共八十八頁,2022年,8月28日下面仍然以數(shù)據(jù)SY-13學(xué)生成績?yōu)槔?,將學(xué)生成績按照五級(jí)制分等級(jí)后,按照班級(jí)形成數(shù)學(xué)等級(jí)和物理等級(jí)交叉分析表,并考察學(xué)生的物理和數(shù)學(xué)成績間有無關(guān)聯(lián)性。73第七十三頁,共八十八頁,2022年,8月28日制作交叉列聯(lián)表的具體操作步驟:1、打開數(shù)據(jù)SY-1,單擊分析描述統(tǒng)計(jì)交叉表對(duì)話框。二維列聯(lián)表分析,選擇行、列變量進(jìn)入框中。如進(jìn)行三維以上的列聯(lián)表,可以將其它變量作為控制變量選到層(Layer)框中。多控制變量可以是同層次的也可以是逐層疊加的。此例中選擇數(shù)學(xué)等級(jí)為行變量,物理等級(jí)為列變量,班級(jí)作為控制變量。74第七十四頁,共八十八頁,2022年,8月28日2、單擊單元格(Cell)按紐,打開對(duì)話框。在計(jì)數(shù)框中選擇觀察值(系統(tǒng)默認(rèn))或期望頻數(shù);在百分比框內(nèi)選擇行、列及總百分比。在殘差框中選擇輸出殘差。本列中選擇默認(rèn)項(xiàng)觀察值。75第七十五頁,共八十八頁,2022年,8月28日3、單擊格式(Format)按紐,指定列聯(lián)表的輸出排列順序,一般選擇系統(tǒng)默認(rèn)的升序。然后點(diǎn)擊OK,就可得到交叉列聯(lián)表。76第七十六頁,共八十八頁,2022年,8月28日從上表中可以看出,一班中數(shù)學(xué)和物理成績均為優(yōu)秀者有四人,數(shù)學(xué)不及格的兩人的物理成績都是及格。77第七十七頁,共八十八頁,2022年,8月28日兩變量關(guān)聯(lián)性檢驗(yàn)(Chi-squareTest卡方檢驗(yàn))卡方檢驗(yàn)是一種非參數(shù)檢驗(yàn)方法??梢杂脕頇z驗(yàn)兩個(gè)變量因素之間是否有關(guān)聯(lián)關(guān)系。如果要考察學(xué)生的數(shù)學(xué)成績和物理成績之間是否有關(guān)聯(lián),相當(dāng)于檢驗(yàn)假設(shè):H0:數(shù)學(xué)成績和物理成績之間是相互獨(dú)立的(無關(guān)聯(lián)關(guān)系);H1:數(shù)學(xué)成績和物理成績之間的關(guān)聯(lián)關(guān)系顯著。78第七十八頁,共八十八頁,2022年,8月28日編制列聯(lián)表時(shí)應(yīng)注意的問題編制列聯(lián)表時(shí),如果兩個(gè)變量之間不存在因果關(guān)系,行變量和列變量可以隨意指定。在對(duì)三個(gè)及以上變量進(jìn)行列聯(lián)分析時(shí),一般來說,每個(gè)單元格至少要有5個(gè)觀測(cè)值才能有說服力。列聯(lián)表只是檢驗(yàn)變量之間是否有關(guān)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 代表會(huì)提案工作發(fā)言材料
- 2025借款借條合同的范本
- 廚房日常工作流程
- 2025工程項(xiàng)目招標(biāo)合同
- 酒店管理的市場(chǎng)調(diào)研與分析
- 地?cái)偨?jīng)營前臺(tái)工作總結(jié)
- 酒店員工溝通技巧培訓(xùn)
- 2025護(hù)坡承包合同范文
- 2025校園觀光車承包經(jīng)營合同
- 教育環(huán)境下的健康生活習(xí)慣培養(yǎng)計(jì)劃
- 2025年山東水發(fā)集團(tuán)限公司社會(huì)招聘高頻重點(diǎn)提升(共500題)附帶答案詳解
- JJG 1204-2025電子計(jì)價(jià)秤檢定規(guī)程(試行)
- 2024年計(jì)算機(jī)二級(jí)WPS考試題庫(共380題含答案)
- 《湖南省房屋建筑和市政工程消防質(zhì)量控制技術(shù)標(biāo)準(zhǔn)》
- 中建集團(tuán)面試自我介紹
- 《工業(yè)園區(qū)節(jié)水管理規(guī)范》
- 警校生職業(yè)生涯規(guī)劃
- 意識(shí)障礙患者的護(hù)理診斷及措施
- 2025企業(yè)年會(huì)盛典
- 215kWh工商業(yè)液冷儲(chǔ)能電池一體柜用戶手冊(cè)
- 場(chǎng)地平整施工組織設(shè)計(jì)-(3)模板
評(píng)論
0/150
提交評(píng)論