版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
用Sxcd也SPSS圖A<0酉
Ch.1緒論
1.1Excel的主要統(tǒng)計功能及其不足
1.2常用統(tǒng)計軟件簡介
1.3使用統(tǒng)計軟件學(xué)習(xí)統(tǒng)計學(xué)的兒點建議
1.1Excel的主要統(tǒng)計功能及其不足
Excel的基本功能中包括了比較強大的數(shù)據(jù)處理功能,還提供了豐富的工作表函數(shù),
可以完成很多類型的數(shù)據(jù)處理和分析任務(wù)。除了工作表函數(shù)以外,Excel還提供了一個
稱為“分析工具庫”的加載宏。
1.1.1Excel分析工具庫的安裝和調(diào)用
安裝分析工具庫可以采用以下三種方式。
1、在Office的默認安裝中分析工具庫并沒有安裝到你的計算機中,第一次使用“分
析工具庫”時需要從安裝盤安裝。操作步驟是:單擊“工具”菜單中的“加載宏”命令,
在彈出的“加載宏”對話框中選擇“分析工具庫”,單擊“確定”按鈕(如圖1-1所示),
此時系統(tǒng)要求插入Office安裝盤,安裝完成后,在“工具”菜單就多出了一個“數(shù)據(jù)分析”
命令(圖1-2)。“數(shù)據(jù)分析”模塊提供了對數(shù)據(jù)進行描述統(tǒng)計、假設(shè)檢驗、相關(guān)和回
歸分析、方差分析等分析工具。我們在以后的章節(jié)中將會逐步講解這些方法。
可用加載宏Q):
rInternetAssistantVBA
□查閱向?qū)?/p>
祝文俅解
□歐元工具
口條件求和向?qū)?/p>
分析工具摩
為金融元科學(xué)數(shù)蹇分析提供界面和相應(yīng)功能
圖1-1加載分析工具庫的界面
ii(I息檢索(R)...AltKHck
共享工作區(qū)(R)...
*v
選項(?!?/p>
敷據(jù)分析①)...
圖1-2加載分析工具庫后的菜單
topT
2、如果希望在第一次安裝Office時就安裝“分析工具庫”,則需要在安裝Office
時選擇自定義安裝,再選中“選擇應(yīng)用程序的高級自定義”選擇框,選擇“下一步”,
會彈出一個對話框,在Excel的加載宏中把“分析工具庫”的安裝方式改為“從本機運
行”(圖1-3)o
S1匕!MicrosoftOffictA
?Xw|Microsoft0£fic<Access
-__jIMicrosoftOfficeExcel
工|幫助
,豆m電子表格根被
aLj-laats-
分析工具摩
遼恒元ft射王真
m]查閱向?qū)
「圖1-3自定義安裝“分析工具庫”的界面
3、如果你需要在一臺沒有安裝該模塊的電腦上臨時使用“分析工具庫”,也可以
采用以下方法:在安裝了“分析工具庫”的電腦中找到一個名為“Analysis”的文件夾
(一般情況下路徑為"C:\ProgramFiles\MicrosoftOffice\OFFICEll\Library\Analysis"),
把這個文件夾復(fù)制到U盤上。需要使用“分析工具庫”時雙擊運行文件夾中的
ANALYS32.XLL就可以了(如果系統(tǒng)彈出一個安全警告的對話框,單擊“啟用宏”)。
要卸載分析工具庫只需要在圖1-1中取消選定“分析工具庫”,否則每次啟動Excel
時這一模塊都會自動加載。
1.1.2Excel是一個適當(dāng)統(tǒng)計軟件嗎?
由于Excel應(yīng)用的普及性,許多人都把它作為最常用的統(tǒng)計軟件來使用。Excel提供
的統(tǒng)計功能包括數(shù)據(jù)管理、描述統(tǒng)計、概率計算、假設(shè)檢驗、方差分析和回歸分析等等,
對于統(tǒng)計學(xué)原理所涉及的大部分內(nèi)容已經(jīng)足夠了。然而,在學(xué)習(xí)Excel的統(tǒng)計功能以前
我們有必要先交待一下Excel在統(tǒng)計分析方面的局限性。下面是在網(wǎng)絡(luò)、雜志和個人經(jīng)
驗中發(fā)現(xiàn)的一些值得注意的方面:
1、就統(tǒng)計學(xué)原理所涉及的統(tǒng)計方法而言,Excel沒有直接提供的方法包括:箱線圖
(Boxplot),莖葉圖、相關(guān)系數(shù)的p-值、無交互作用可重復(fù)的雙因素方差分析、方差
分析中的多重比較、非參數(shù)檢驗方法、質(zhì)量控制圖等。
2、按照優(yōu)秀圖形的標(biāo)準(zhǔn),Excel做出的很多圖形都不合格。Excel的有些圖形可能
適合于普通大眾,但不適合用于科學(xué)報告中。例如二維圖形的三維表示,圓柱圖,圓錐
圖等等。Excel提供的有些圖形可能永遠不應(yīng)該使用。
3、Excel不能很好的處理缺失值(Missingdata)問題??傮w來說Excel對缺失值的處
理方式遠不如專門的統(tǒng)計軟件恰當(dāng)。
4、雖然大部分情況下Excel的計算結(jié)果都是可靠的,但在些極端情況卜Excel的
計算程序不夠穩(wěn)定和準(zhǔn)確(特別是Excel2003以前的版本中);有些自動功能可能會導(dǎo)
致意想不到地結(jié)果。關(guān)于這一方面的內(nèi)容我們在后面的章節(jié)中還會提及,在這里只舉兩
個例子使你有一點直觀的印象。
練習(xí)1:如果自己計算,你認為“-5八2”等于多少?在Excel工作表的單元格中輸入
“=-5八2”得到的答案是多少?
練習(xí)2:在區(qū)域Bl:B3中分別輸入數(shù)字10、20、30;然后在B5中輸入公式
“=sum(bl:b3)”。謝B5的值等于多少?現(xiàn)在再在B4中輸入40,B5的值有什么變化?
在第一個練習(xí)中Excel2003得出的結(jié)果是25,這至少與通行的數(shù)學(xué)規(guī)則不一致。在
第二個練習(xí)中Excel會自動將B5的公式改為“=sum(bl:b4)”。但這種自動功能有時候
并不是我們想要的。在我們不知情的情況下對公式的修改將會直接導(dǎo)致計算結(jié)果的錯
誤。
總體來說,Excel為我們輸入和管理數(shù)據(jù)、描述數(shù)據(jù)特征、制作統(tǒng)計表和統(tǒng)計圖都
提供了強大的支持,但在處理復(fù)雜的計算時有時候誤差相對較大,因而一些數(shù)據(jù)處理專
家建議人們避免采用Excel處理復(fù)雜的統(tǒng)計問題。
topt
1.2常用統(tǒng)計軟件簡介
常用的統(tǒng)計分析軟件包括SAS、SPSS、S-plus、Stata、Minitab等等。這些軟件都能
完成常用的統(tǒng)計方法,如描述統(tǒng)計、回歸分析、生存分析、方差分析、多元分析等等,
但不同的軟件在功能、易用性、擴展性等方面又各具特色,下面我們分別加以簡要介紹。
1、SAS
SAS過去是"StatisticalAnalysisSystem”的簡稱,由于其功能現(xiàn)已遠遠超出了統(tǒng)計
分析的范圍,“SAS”已經(jīng)變成了一個單純的商標(biāo)。其強大的功能和可編程性使其成為
一些超級用戶的首選。
SAS軟件的主要特點包括:可以同時處理多個數(shù)據(jù)集;有很多模塊、功能非常全面;
雖然也提供了許多菜單操作方式,但仍以編程為主,學(xué)習(xí)起來有一定困難,是最難掌握
的統(tǒng)計軟件之一。
SAS的繪圖功能可能是所有的統(tǒng)計軟件中最強大的,但同時也是最難掌握的:雖然
SAS也提供了一些交互式的制圖界面,但與其他軟件相比還不夠方便。
2、SPSS
SPSS過去是"StatisticalPackageforSocialSciences”的簡稱,它也是最早的統(tǒng)計軟
件之一。許多初學(xué)者都喜歡使用SPSS,因為它非常容易使用(以及誤用):用鼠標(biāo)點
擊下拉菜單中的命令就能完成分析工作。當(dāng)然,SPSS也提供了編程的操作方式。
SPSS的數(shù)據(jù)編輯窗口與Excel類似,并且可以自己定義數(shù)據(jù)的屬性(數(shù)值標(biāo)簽、數(shù)
據(jù)類型等等),最多允許有4096個變量。但其數(shù)據(jù)管理功能相對較弱,-個SPSS過程
只允許同時打開一個數(shù)據(jù)文件,這對于有些分析工作來說可能不夠方便。SPSS是一個
模塊式的軟件,可以根據(jù)需要選擇購買不同的功能模塊。SPSS在方差分析和多元統(tǒng)計
分析方面的功能比較突出。
SPSS也有強大的圖形功能,可以做出高質(zhì)量的圖形,并且可以比較方便的進行編
輯。
3>S-Plus
許多人認為S-Plus是介于SAS和SPSS之間的?個軟件,它也可以完成絕大部分統(tǒng)
計分析,具有菜單式的操作界面,同時提供了強大的編程語言。你可以很容易地把自己
編寫的函數(shù)集成到S-Plus中去。S-Plus的繪圖能力特別出色,靈活性強。
4、R
R是一套很像S-Plus的免費統(tǒng)計軟件,其語法與圖形功能幾乎跟S-Plus?模?樣,
大多數(shù)的S-Plus程序也可在R上面順利執(zhí)行。R可以在Rproject的網(wǎng)頁免費取得,不
足之處是沒有實現(xiàn)菜單式的圖形用戶界面,對于初學(xué)者來說學(xué)習(xí)起來較為困難。
5、Stata
經(jīng)濟學(xué)和社會科學(xué)領(lǐng)域的許多學(xué)者喜歡使用Stata軟件。這一軟件也有菜單式的操
作界面,同時提供了強大的編程能力,易學(xué)易用,擴展性強,更新速度快,很容易將自
己編寫或者網(wǎng)上下載的程序加入到軟件中。
Stata的回歸分析和回歸診斷部分功能非常強大,幾乎能估計統(tǒng)計學(xué)和計量經(jīng)濟學(xué)中
的所有回歸模型,而在多元統(tǒng)計分析方面的功能稍弱。Stata可以用菜單或程序做出高質(zhì)
量的圖形,但完成后的圖形不能再進行編輯。
6、Minitab
Minitab也是一個簡單易學(xué)的統(tǒng)計軟件,其統(tǒng)計功能和圖形功能都比較全面,在統(tǒng)
計學(xué)的教學(xué)中應(yīng)用廣泛。這一軟件突出特色是提供的質(zhì)量改進分析工具非常全面易用。
topt
1.3使用統(tǒng)計軟件學(xué)習(xí)統(tǒng)計學(xué)的幾點建議
1.3.1我應(yīng)該選擇哪個軟件?
每個軟件都有自己的優(yōu)勢和劣勢。就統(tǒng)計學(xué)原理涉及的統(tǒng)計方法而言幾乎所有的統(tǒng)
計軟件都可以勝任,但對于一些具體的實際問題可能有的軟件會比其它軟件更適合。例
如在進行一些多元統(tǒng)計分析時你可能會選擇SAS,處理抽樣調(diào)查數(shù)據(jù)可能會選擇Stata,
做方差分析可能會選擇SPSS,進行質(zhì)量改進統(tǒng)計分析可能會選擇Minitab,希望進行統(tǒng)
計應(yīng)用開發(fā)時可能會選擇SAS或S-plus。因此,如果你需要經(jīng)常進行統(tǒng)計分析,我們的
建議是你把這些軟件都納入到你的工具箱中。
作為入門的軟件,易學(xué)易用的SPSS或者Minitab可能是較好的選擇,一開始就學(xué)
習(xí)復(fù)雜的統(tǒng)計軟件可能令人沮喪。
Excel為我們處理數(shù)據(jù)和對數(shù)據(jù)進行初步的分析提供了良好的條件,但Excel至少在
2003以前版本的部分統(tǒng)計函數(shù)中有一些缺陷,而且Excel的統(tǒng)計功能有限,如果你正進
行的分析工作牽涉到重大的決策、對計算結(jié)果的準(zhǔn)確性有很高的要求,我們建議你采用
專門的統(tǒng)計軟件。許多用戶(包括作者)喜歡用Excel準(zhǔn)備數(shù)據(jù),然后用專門的統(tǒng)計軟
件進行統(tǒng)計分析,有時候還會把結(jié)果轉(zhuǎn)回Excel中作圖。
1.3.2使用統(tǒng)計軟件學(xué)習(xí)統(tǒng)計學(xué)的一些建議
1、如果你要做統(tǒng)計分析的話,一定要正確的去做!使用Excel以及其它統(tǒng)計軟件獲
得一些分析結(jié)果易如反掌,但要獲得正確的答案并不容易,這要求你對相應(yīng)的統(tǒng)計方法
有透徹的理解。
2、在開始學(xué)習(xí)一種統(tǒng)計方法時,不要試圖立即搞清楚軟件的全部輸出結(jié)果。即使
你只希望計算一下數(shù)據(jù)的平均值,統(tǒng)計軟件也可能有數(shù)頁的輸出結(jié)果:搞清楚所有輸出
結(jié)果的努力可能使你很沮喪,因為有些內(nèi)容可能已經(jīng)大大超出了你的學(xué)科范圍。
3、不要試圖使用你還不理解的統(tǒng)計方法,這很容易導(dǎo)致統(tǒng)計方法的誤用;但要勇
于學(xué)習(xí)新的方法,新的方法可能更適合你所研究的問題。
4、不要不加分析的把軟件的全部輸出結(jié)果直接復(fù)制到分析報告中,這只能說明你
并沒有真正理解軟件的輸出結(jié)果??赡軐δ阊芯康膯栴}而言軟件的大部分輸出都是不必
要的。此外,軟件生成的圖表往往也需要進行一些編輯工作才能使用。
5、學(xué)習(xí)統(tǒng)計軟件的最好方法是在應(yīng)用中學(xué)習(xí)。
6、軟件的幫助文件可能是軟件最好的使用說明書,許多軟件還附有簡明的例子。
7^uGarbagein,garbageoutn:如果你輸入的是垃圾,得到的也只能是垃圾。你
要反復(fù)檢查數(shù)據(jù)的準(zhǔn)確性,任何軟件都不可能基于錯誤的數(shù)據(jù)得出可靠的結(jié)論。
用Excel和SPSS進行描述統(tǒng)計分析
Ch.3用Excel和SPSS進行描述統(tǒng)計
3.1用Excel和SPSS計算常用的描述統(tǒng)計指標(biāo)
3.2用Excel和SPSS進行分組匯總
Ch.4用Excel和SPSS制作統(tǒng)計圖
4.1用Excel和SPSS制作常用統(tǒng)計圖
4.2描述數(shù)據(jù)分布狀況的統(tǒng)計圖
在某學(xué)期的統(tǒng)計學(xué)教學(xué)中,教師在教學(xué)中使用了英文教材,并采用了案例教學(xué)的方
法。在學(xué)期結(jié)束時,采用以下問卷對35名學(xué)生進行了調(diào)查。調(diào)查問卷如下:
1、你的性別:()0=男,1=女
2、你的年齡為周歲。
3.寫出對于以下三種說法的觀點(1=完全不同意,2=比較不同意,3=無所謂,4=
比較同意,5=完全同意)
(1)“我對統(tǒng)計學(xué)很感興趣”()
(2)“英文原版教材的使用對我的學(xué)習(xí)幫助很大”()
(3)“案例對我掌握相關(guān)知識非常重要”()
4、你概率論課程的考試成績是。
5、你上個月的生活費支出為()元。
1=300以下,2=300-400,3=400-500,4=500-600,
5=600-700,6=700-800,7=800-900,8=900以上
6、你的身高=cm,體重=kgo
topT
在考試結(jié)束后在調(diào)查數(shù)據(jù)又增加了學(xué)生的統(tǒng)計學(xué)考試成績,最后得到的數(shù)據(jù)如表
3-1。在本書接下來的章節(jié)中我們將這次調(diào)查稱為“學(xué)生調(diào)查”,并對調(diào)查結(jié)果進行相
關(guān)的統(tǒng)計分析。
表3-1學(xué)生調(diào)查得到的數(shù)據(jù)表
英文案例概率統(tǒng)計月
編號性別年齡興趣身高體重
教材教學(xué)成績成績支出
1021545748341728()
20202558278617362
30221214938518367
41214128087816249
51205459091315949
61224347178616145
71212559297316651
80202336760217474
91223256365816552
101204247883316354
111214259089416050
120221557869516855
130212246855217365
140202358782317260
151222239189516552
160213357870117053
170202157268116460
181215458885615852
191213158781416348
201212448688715953
210225557480717578
221201247375616242
231213356865516549
241224257678516453
251215458592416151
261224347169316349
271214257565515855
281221456455616550
290223256264116951
300205557768218075
310213547880217162
321212458788316150
330204246668116770
340225557983217865
350213457577516862
2.1用Excel輸入數(shù)據(jù)
2.1.1數(shù)據(jù)錄入的列表格式
在絕大部分情況下統(tǒng)計軟件都要求以“列表格式"(Listformat)存儲數(shù)據(jù),而不能用其
它格式存儲?!傲斜砀袷健笨捎帽?-1來說明,表2-2則不是“列表格式”??赡苤挥蠩xcel
中的方差分析仍然需要使用表2-2的格式。在表2-1中,每一行稱為一個觀測,每一列稱為
一個變量。
表2-1以列表格式的存儲的數(shù)據(jù)
序號性別學(xué)歷工資
1112600
2I12700
3124100
4124000
5213200
6212500
6225300
8225500
表2-2不是以列表格式的存儲的數(shù)據(jù)
性別學(xué)歷1(本科)2(研究生)
16004100
1(女)
17004000
32005300
2(男)
25005500
tODt
2.1.2用Excel錄入數(shù)據(jù)的基本規(guī)則
為了保證其它軟件能夠直接讀入用Excel錄入的數(shù)據(jù)進行分析,在用Excel錄入數(shù)據(jù)時
要盡量遵循以下規(guī)則:
1、從一次調(diào)查中得出的所有的數(shù)據(jù)要存儲在一個電子表格中。
2、在數(shù)據(jù)表的第一行中輸入變量名。如果你還需要借助于不能識別中文的統(tǒng)計軟件對
數(shù)據(jù)進行分析,變量名要以字母開頭,并且不超過8個字符;變量名中不能有空格,但可以
用卜劃線。這是因為很多軟件都對變量名都有類似的規(guī)定(在Excel中可以使用漢字作為變
量名,SPSS13.0中也允許用漢字作變量名,長度不超過32個漢字或64個字符)。
3、數(shù)據(jù)表中應(yīng)避免出現(xiàn)其它文本行,例如標(biāo)題。
4、數(shù)據(jù)中應(yīng)避免出現(xiàn)空行。
5、在原始數(shù)據(jù)中設(shè)置?個標(biāo)識變量(IDvariable),例如觀測的序號、問卷的編號、學(xué)
生證號、身份證號等等,以便在檢查數(shù)據(jù)錄入錯誤時易于查找原始問卷。有的分析中我們會
對數(shù)據(jù)進行排序,這會打亂原來的數(shù)據(jù)順序。這時要查找原始問卷就只能依靠標(biāo)識變量了。
6、如果數(shù)據(jù)包含多個組,需要設(shè)置一個變量來表示每個觀測的分組(見表2-1的例子)。
7、盡量使用數(shù)字編碼來表示分類變量。例如我們可以用1來表示“黨員”,2表示“團
員',3表示“群眾”。如果只有兩個組,將其編碼為0和1可能會使一些分析易于進行。
8、對于缺失值(missingvalues),將相應(yīng)的單元格保留為空白,這樣其他統(tǒng)計軟件才能
正確地識別缺失值。
9、Excel允許在同一列中(對應(yīng)著同一個變量)輸入不同類型的數(shù)據(jù),如數(shù)值型、字符
型、H期型等等。這雖然是給了我們一定的靈活性,但在同一列中輸入不同類型的數(shù)據(jù)在分
析時會造成極大的不便,使用中應(yīng)盡量避免。
10、對數(shù)據(jù)的編碼和計算過程要做好記錄,以免日后忘記了每個變量或數(shù)值對應(yīng)的含義,
例如“0”是代表男性還是女性,某個新變量是如何計算得到的等等。
11、注意Excel的一些限制條件。Excel只能正確處理1900年1月1日以后的日期型數(shù)據(jù);
最多允許256個變量,65536行數(shù)據(jù)。
2.1.3使用Excel的有效性檢查防止數(shù)據(jù)輸入中的錯誤
Excel提供了一個“有效性”檢查的功能,可以在我們輸入數(shù)據(jù)時實時檢查錄入的數(shù)據(jù)
是否符合要求。如果輸入的數(shù)據(jù)量很小,這種有效性檢查并非必要,但如果你要輸入成千上
萬條數(shù)據(jù),“有效性”檢查可以幫助我們避免許多錄入錯誤。
[例2.1]我們以一個簡單的例子來說明“有效性”檢查功能的使用方法。假設(shè)需要輸入
的數(shù)據(jù)如表2-3。
表2-3需要錄入的數(shù)據(jù)
編號班級性別考試成績
11085
21190
32087
42169
53078
63193
74083
84191
我們先在Excel數(shù)據(jù)表的第一行輸入四個變量名:編號,性別,班級,考試成績。
(1)、“編號”的取值我們借助Excel的自動填充功能來實現(xiàn):先在單元格A2、A3中
輸入1,2。用鼠標(biāo)選中區(qū)域A2:A3,把鼠標(biāo)移至該區(qū)域右下角的填充柄(其形狀為黑色的
小方塊),鼠標(biāo)指針變?yōu)橐粋€實心的黑色十字(圖2-1)。按住鼠標(biāo)左鍵向下拖動至A9單元
格,完成數(shù)據(jù)的自動填充。
(2)、對于班級變量,我們用1表示統(tǒng)計班,2表示經(jīng)濟班,3表示金融班,4表示會
計班(同時在另一個工作表中記錄這一編碼規(guī)則,以免日后遺忘)。班級的取值只有1、2、
3、4,其他取值都是錯誤輸入,我們可以利用Excel的“有效性”檢查對輸入的數(shù)據(jù)進行限
定。
圖2-1自動填充指針
tODt
具體操作步驟如下:先選中列B,然后選擇菜單欄中的“數(shù)據(jù)”少“有效性”,會彈出
圖2-2的對話框。單擊“允許”下面的下拉箭頭,選擇“整數(shù)”,再在新的對話框中把最小
值設(shè)為1,最大值設(shè)為4。然后我們在“出錯警告”選項卡的錯誤信息中輸入“請輸入1-4
之間的整數(shù)”,這樣在輸入了1-4以外的數(shù)值時,Excel會彈出出錯信息,并提示“請輸入
1-4之間的整數(shù)二
設(shè)置檢入信息出借警告的入法模式
百戲性條件
允許⑧,
|金部清除0)1I喉I[斷清]
圖2-2數(shù)據(jù)的有效性檢查對話框
(3)、對于取值非常有限的數(shù)據(jù),我們還可以為變量的取值定義一個序列,如果輸入的
數(shù)據(jù)不在這個序列中,即為非法輸入。下面我們用性別變量(0表示男性,1表示女性)加
以說明。選中列C,然后選擇菜單欄中的“數(shù)據(jù)”今“有效性”,在圖2-2的對話框中選擇
序列,在“來源”對話框中輸入“1,2”(數(shù)值用英文狀態(tài)下的逗號隔開)(圖2-3),單擊確
定按鈕。這時,在列C的單元格中輸入數(shù)據(jù)時,Excel會提供一個下拉箭頭使我們能夠從事
先確定的序列中選擇數(shù)值(當(dāng)然我們也可以直接輸入)(圖2-4)。在輸入大量數(shù)據(jù)時,使用
下拉箭頭輸入數(shù)據(jù)會大大影響輸入速度。
[全部清除?)I*定I|取清|
圖2-3數(shù)據(jù)的有效性檢查:定義序列
圖2-4Excel提供的卜拉框
(4)、對于考試成績這一變量,我們只要使用“有效性”把數(shù)據(jù)限定為0-100之間的整
數(shù)就可以了。
注意數(shù)據(jù)的有效性檢查并不能幫助我們避免其它類型的錄入錯誤:如果你把“60”錯輸
成了“90”,Excel不會給你任何警告。
toof
2.1.4處理多項選擇問題
要正確錄入和分析從多項選擇問題中得到的數(shù)據(jù)需要一定的技巧。下面我們以一個簡單
的例子加以說明。
[例2.2]在一次對失業(yè)者的調(diào)查中有以下問題。
在以下8個因素中,哪些是你重新就業(yè)的重大障礙?(最多選3項)()
1、文化水平低2、專業(yè)不對口3、缺少工作經(jīng)臉4、缺少工作崗位
5.歧視6、工資水平低7、工作條件差8、缺少創(chuàng)業(yè)資金
我們的分析目的是要找出以上8個因素對失業(yè)者再就業(yè)的影響程度,在分析中可以分別
看作-.個單獨的問題。如果被調(diào)查者選中了這個選項,其值就等于1,未選中則等于0。也
就是說,問卷中的個變量在分析中被處理成了8個二分變量。
在選項非常多,而每個被調(diào)查者只能選擇少數(shù)兒項時,以下方法會更有效率(以上面的
問題為例):設(shè)定3個變量,分別記錄被調(diào)查者的第一、第二和第三選擇,取值為1-8。在分
析時,將這三個變量的對應(yīng)選項合并,就能得到需要的分析結(jié)果了。例如,假設(shè)在第個變
量中有15人選擇了1,在第二個變量中20人選擇了1,在第三個變量中5人選擇了1,則
選擇1的人總共有15+20+5=40人。如果有些人只選擇了一項或兩項,則其第二和第三個變
量的取值可以設(shè)為空值(缺失值)或者另外給定的一個特定值(例如等于0),在分析中只
要處理得當(dāng)就能得到正確的結(jié)果。
2.2用Excel處理數(shù)據(jù)
2.2.1用Excel對數(shù)據(jù)進行排序和篩選
用Excel可以方便的對數(shù)據(jù)進行排序和篩選。需要特別注意的是,如果你只對某一列進
行排序,則整個數(shù)據(jù)集都會被破壞,每一個數(shù)據(jù)行對應(yīng)的不再是同一個觀測的取值。因此,
使用Excel排序時要格外小心。下面我們通過?個例子說明用Excel進行排序和篩選的操作
方法。
[例2.3]將表2-3的數(shù)據(jù)按照考試成績排序。
單擊數(shù)據(jù)區(qū)域的任何一個單元格,使其成為活動單元格。然后選擇菜單欄中的“數(shù)據(jù)”
分“排序”,會彈出圖2-5的對話框。
圖2-5排序?qū)υ捒?/p>
在這個對話框中將主要關(guān)鍵字設(shè)為考試成績,按降序排列。單擊確定后就可以完成排序
工作了。你也可以在“選項”中定義其他的排序規(guī)則。注意在對文本進行排序時,由于排序
的規(guī)則不同,使用不同的軟件得到的排序結(jié)果可能有差異。
[例2.4]從表2-3的數(shù)據(jù)中篩選出所有男生的資料。
單擊數(shù)據(jù)區(qū)域的任何一個單元格,使其成為活動單元格。然后選擇菜單欄中的“數(shù)據(jù)”
個“篩選”)“自動篩選”,在每列數(shù)據(jù)的頂端會出現(xiàn)一個下拉箭頭(圖2-6)。
圖2-6自動篩選的界面
單擊“性別”變量的下拉箭頭,選擇“0",則Excel2003會篩選出所有男生的資料。當(dāng)
“性別”變量是一個有效的篩選變量時,該變量的下拉箭頭是藍色的。在此基礎(chǔ)上還可以進
行進?步的篩選,例如篩選出成績在85分以上的男生的資料。如果希望顯示全部數(shù)據(jù),則
要在下拉框中選擇“(全部”要取消篩選,再一次選擇菜單欄中的數(shù)據(jù)f篩選好自動篩選
就可以了。
自動篩選功能還可以幫助我們發(fā)現(xiàn)和修改數(shù)據(jù)輸入中的錯誤。如果在變量下拉箭頭打開
的下拉框中有異常值,我們可以利用自動篩選功能方便的查找和定位。從圖2-6可以看出,
在Excel2003中自動篩選功能也包含了升序或降序排列的排序功能。
tODt
2.2.2用Excel公式和函數(shù)生成新的變量
Excel提供了大量函數(shù),我們可以方便的使用這些函數(shù)和其他公式生成所需要的變量。
在Excel中輸入公式時可以直接輸入,也可以通過鼠標(biāo)選擇需要的函數(shù)以及單元格來完成輸
入,一般來說后一種方法更方便而且不容易出錯。關(guān)于Excel函數(shù)的詳細說明清參見Excel
的幫助文件,這里我們只通過一個例子說明使用Excel公式和函數(shù)的一些技巧。
[例2.5]已知1996-2003年我國一、二、三產(chǎn)業(yè)的GDP如表2-4。試根據(jù)這些數(shù)據(jù)計算
各產(chǎn)業(yè)的產(chǎn)值比重。
表2-41996-2003年我國一、二、三產(chǎn)業(yè)的GDP(億元)
年份第一產(chǎn)業(yè)第二產(chǎn)業(yè)第三產(chǎn)業(yè)
199613844.233612.920427.5
199714211.237222.723028.7
199814552.438619.325173.5
199914472.040557.827037.7
200014628.244935.329904.6
200115411.848750.033153.0
200216117.352980.236074.8
200317092.161274.138885.7
在Excel中可以按照如下方法計算。首先計算各年的GDP,等于各年一、二、三產(chǎn)業(yè)的
GDP之和。在E2中輸入一個等號,編輯欄下面的“名稱”框?qū)⒆兂伞昂瘮?shù)”框,如圖2-7
所示。單擊“函數(shù)”按鈕右側(cè)的下拉箭頭,打開函數(shù)列表框,從中選擇所需的函數(shù)(SUM),
Excel將打開”公式選項對話框”(圖2-8)。將求和函數(shù)的參數(shù)改為B2:D2(通過點擊折疊按
鈕£選擇相應(yīng)的區(qū)域來實現(xiàn)),單擊"確定"按鈕即可完成函數(shù)的輸入,得到1996年的GDP。
然后利用Excel的自動填充功能在E3-E9中復(fù)制E2的公式得到各年的GDP。注意這里各填
充單元格的公式是自動調(diào)整的,例如E9單元格的公式為“=SUM(B9:D9)”。
一d-13??!弧毙?/p>
sS國X,■二
SUWBcDEF
HORMDIST一產(chǎn)業(yè)第二產(chǎn)業(yè)第三產(chǎn)業(yè)
AVERAGE
VLDOKUP38442336129204275
TDIST42112372227230287
RAXK45524386193251735
QUARTILE
270377
PERCENTILE4472.0405578
MEDIAN46282449353299046
FIXV54118487500331530
苴的函數(shù)
61173529802360748
9200317092.1612741388857
11.
圖2-7函數(shù)選擇框
圖2-8指定函數(shù)參數(shù)的對話框
要計算第一產(chǎn)業(yè)的產(chǎn)出比重,在F2中輸入“=”,然后單擊B2單元格,再輸入“/”,最
后點擊E2單元格,回車,就在F2中輸入了公式“=B2/E2”,F(xiàn)2中顯示的是1996年第一產(chǎn)
業(yè)的比重。要在G2、H2中計算第二、多三產(chǎn)業(yè)的比重,可以先把F2的公式先修改為
“=B2/$E2”,然后用自動填充把這個公式復(fù)制到G2、H2單元格。這時G2中的公式為
“=C2/$E2”。由于在公式的分母中使用了“$”,分母中的列號就不會改變了,這就是單元
格引用中的“絕對引用二
接下來選中區(qū)域F2:H2,把鼠標(biāo)移至區(qū)域的右下角,指針變?yōu)楹谏珜嵭牟纷謺r按住鼠標(biāo)
左鍵向下拖動至H9,1997-2003年的產(chǎn)值比重就計算出來了。
最后,還可以選中區(qū)域F2:H9,將數(shù)據(jù)格式改為百分數(shù)。計算結(jié)果如表2-5。
表2-51996-2003年我國一、二、三產(chǎn)業(yè)的產(chǎn)值比重
第一產(chǎn)業(yè)第二產(chǎn)業(yè)第三產(chǎn)業(yè)/
年份總產(chǎn)值
比重比重比重
199667884.620.39%49.51%30.09%
199774462.619.09%49.99%30.93%
199878345.218.57%49.29%32.13%
199982067.517.63%49.42%32.95%
200089468.116.35%50.22%33.42%
200197314.815.84%50.10%34.07%
2002105172.215.32%50.37%34.30%
2003117251.914.58%52.26%33.16%
在Excel中復(fù)制和粘貼帶有公式的數(shù)據(jù)時一定要非常小心,注意查看粘貼后的結(jié)果是否
是你希望得到的,避免出現(xiàn)意外的錯誤。如果你希望在原來的單元格中只保留計算結(jié)果而不
保留公式,可以使用以下方法:選中相應(yīng)的單元格,單擊鼠標(biāo)右鍵,選擇“復(fù)制”,然后再
在同樣的位置單擊鼠標(biāo)右鍵,選擇“選擇性粘貼”,在彈出的對話框中選擇“數(shù)值”(圖2-9)。
如果希望把數(shù)值復(fù)制到新的位置,則在新的位置使用“選擇性粘貼”就可以了。
選擇性粘貼閉因
^16
O全部⑥。有效性賽證也)
。公式①)。期瞬外QP
◎教值⑨Io列席①)
o需無。。公式和數(shù)字格式⑥
O艇Go值和數(shù)字格式0!)
運算
◎無Q)。集電)
O加Q)。除9
O?<S)
□跳過至單元也)□???)
I■定II取清]
圖2-9選擇性粘貼選項框
tODt
2.2.3用Excel進行其它數(shù)據(jù)操作
在各種統(tǒng)計軟件之間傳遞數(shù)據(jù)時,當(dāng)數(shù)據(jù)量不是很大時最簡便的方法可能就是“復(fù)制”
+“粘貼”了。有時候我們從其他途徑得到的數(shù)據(jù)不是表格的形式,而是文本形式(.txt)。
這時候要讓Excel正確識別數(shù)據(jù),需要使用Excel的分列功能。
[例2.6]假設(shè)在例2.5中我們最初得到的數(shù)據(jù)為純文本格式,數(shù)據(jù)之間是用逗號分割的
(圖2-10).用Excel對數(shù)據(jù)進行分列。
AB
1年份,第一產(chǎn)業(yè),第二產(chǎn)業(yè),第三產(chǎn)業(yè)
21996,138442,33612.9,204275
31997,142112,37222.7,230287
41998,14552.4,38619.3,25173.5
51999,14472.0,405578,270377
62000,14628.2,44935.3,299046
72001,15411.8,48750.0,33153.0
82002,161173,52980.2,360748
92003,170921,61274.1,388857
10
圖2-10用逗號分割的純文本格式的數(shù)據(jù)
先選中A歹U,然后選擇“數(shù)據(jù)”>“分列”,在彈出的選擇框中把“原始數(shù)據(jù)類型”選
為“分隔符號”,點擊“下一步”,在“分隔符號”中選中“逗號”,這時你會在數(shù)據(jù)預(yù)覽中
看到數(shù)據(jù)被正確分列了。點擊“下一步”,你還可以對每列數(shù)據(jù)的屬性做一些設(shè)定。在這里
我們直接點擊“確定”,數(shù)據(jù)的分列就完成了。
另外一種常用的數(shù)據(jù)操作是轉(zhuǎn)置。Excel中的操作方法是:先選中要轉(zhuǎn)置的區(qū)域,單擊
鼠標(biāo)右鍵,選擇“復(fù)制”,然后在新的位置單擊鼠標(biāo)右鍵,選擇“選擇性粘貼”,在彈出的對
話框中選中“轉(zhuǎn)置”(參見圖2-9)。
2.3用SPSS輸入和處理數(shù)據(jù)
2.3.1用SPSS輸入數(shù)據(jù)
一般情況下,打開SPSS時會自動打開一個空的數(shù)據(jù)表(DataView)和一個變量表
(VariableView)?這兩個表看起來與Excel數(shù)據(jù)表很類似。如果要直接在SPSS中輸入原始
數(shù)據(jù),你只要按自己的需要定義變量、輸入數(shù)據(jù)然后存盤就行了。
[例2.7]在SPSS中輸入表2-3的數(shù)據(jù)。
輸入數(shù)據(jù)最好先對變量進行定義。變量表是SPSS中的一個很具特色的操作界面,在這
里你可以非常方便的定義變量的各種屬性。我們在第一列中依次輸入“編號”“班級”等四
個變量名,你會看到SPSS會自動為這些變量的其他屬性賦予系統(tǒng)默認值。你當(dāng)然可以進
行必要的修改,例如我們這里把小數(shù)位設(shè)為0。也可以為變量加上標(biāo)簽,以對變量的含義
進行更詳細的說明。在輸出結(jié)果中可以讓SPSS輸出變量的標(biāo)簽。
SPSS允許我們通過定義數(shù)值標(biāo)簽對變量值進行定義。我們以“班級”這個變量為例加
以說明。單擊“班級”變量的“Values”單元格的右側(cè),會彈出一個“數(shù)值標(biāo)簽”(ValueLabels)
的對話框。在定義標(biāo)簽對話框的中有三個小矩形框。在第一個矩形框中輸入變量值1,在
第二個矩形框中輸入“統(tǒng)計”,這時“Add”按鈕變亮,點擊Add按鈕,下面的清單中顯示
1=“統(tǒng)計”。按照這種方法繼續(xù)定義2=“經(jīng)濟”,3=“金融”,4=“會計”。
變量定義好以后,就可以在數(shù)據(jù)表中依次輸入數(shù)據(jù)了。對于定義了數(shù)值標(biāo)簽的變量,單
擊工具欄中的⑼按鈕可以顯示數(shù)值標(biāo)簽,再單擊一下則可以顯示數(shù)值。
當(dāng)然,我們也完全可以先在數(shù)據(jù)表中輸入數(shù)據(jù),然后再對變量屬性進行必要的定義。
圖2-11在SPSS中定義數(shù)值標(biāo)簽
2.3.2用SPSS讀入外部數(shù)據(jù)
在很多應(yīng)用中我們需要用SPSS讀入其它格式的數(shù)據(jù),如Excel格式,文本格式等等。
完成這一任務(wù)有多種方式,而在數(shù)據(jù)量不大的情況下最簡便的方式可能是“復(fù)制”+“粘貼”。
SPSS可以直接讀取多種格式的數(shù)據(jù)。用SPSS讀取Excel數(shù)據(jù)的步驟是:用鼠標(biāo)選擇
“File-Open今Data”,將文件類型改為“Excel(*.xls)",找到你要打開的文件名,單擊“打
開”。在隨后的對話框中選擇要打開的數(shù)據(jù)表(因為
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 家居空間裝飾裝修方案
- 景區(qū)活動方案
- 屋頂分布式光伏項目實施方案
- 雨傘相關(guān)行業(yè)投資方案
- 2024年九一八事變85周年紀念日的活動方案
- 市場調(diào)查研究行業(yè)營銷策略方案
- 班班通多媒體教室施工組織方案及對策
- 體育場鋼結(jié)構(gòu)冬季施工方案
- 中秋節(jié)給員工慰問信(14篇)
- 學(xué)校食堂臨時用工協(xié)議書美篇
- 亂扔垃圾的課件
- 消化內(nèi)科五年發(fā)展規(guī)劃
- 2024-2030年中國安全校車市場發(fā)展分析及市場趨勢與投資方向研究報告
- 北京市房山區(qū)2023-2024學(xué)年高二上學(xué)期期中地理試題 含解析
- 期刊編輯的學(xué)術(shù)期刊版權(quán)教育與培訓(xùn)考核試卷
- SolidWorks-2020項目教程全套課件配套課件完整版電子教案
- 2024政務(wù)服務(wù)綜合窗口人員能力與服務(wù)規(guī)范考試試題
- 鼎和財險機器人產(chǎn)品質(zhì)量責(zé)任保險條款
- 動脈瘤病人的護理查房(標(biāo)準(zhǔn)版)
- 2023年全國職業(yè)院校技能大賽-建筑工程識圖賽項賽題
- SY-T 5374.2-2023 固井作業(yè)規(guī)程 第2部分-特殊固井
評論
0/150
提交評論