spss的數據分析案例_第1頁
spss的數據分析案例_第2頁
spss的數據分析案例_第3頁
spss的數據分析案例_第4頁
spss的數據分析案例_第5頁
已閱讀5頁,還剩7頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

spss的數據分析案例spss的數據分析案例spss的數據分析案例關于某公司474名職工綜合狀況的統(tǒng)計分析報告數據介紹:本次分析的數據為某公司474名職工狀況統(tǒng)計表,其中共包含十一變量,分別就是:id(職工編號),gender(性別),bdate(出生日期),edcu(受教育水平程度),jobcat(職務等級),salbegin(起始工資),salary(現工資),jobtime(本單位工作經歷<月>),prevexp(以前工作經歷<月>),minority(民族類型),age(年齡)。通過運用spss統(tǒng)計軟件,對變量進行頻數分析、描述性統(tǒng)計、方差分析、相關分析、以了解該公司職工上述方面的綜合狀況,并分析個變量的分布特點及相互間的關系。數據分析頻數分析?;镜慕y(tǒng)計分析往往從頻數分析開始。通過頻數分析能夠了解變量的取值狀況,對把握數據的分布特征非常有用。此次分析利用了某公司474名職工基本狀況的統(tǒng)計數據表,在gender(性別)、edcu(受教育水平程度)、不同的狀況下的頻數分析,從而了解該公司職工的男女職工數量、受教育狀況的基本分布。 Statisticsspss的數據分析案例全文共12頁,當前為第1頁。首先,對該公司的男女性別分布進行頻數分析,結果如下:spss的數據分析案例全文共12頁,當前為第1頁。GenderEducationalLevel(years)NValid474474Missing00 GenderFrequencyPercentValidPercentCumulativePercentValidFemale21645、645、645、6Male25854、454、4100、0Total474100、0100、0上表說明,在該公司的474名職工中,有216名女性,258名男性,男女比例分別為45、6%與54、4%,該公司職工男女數量差距不大,男性略多于女性。其次對原有數據中的受教育程度進行頻數分析,結果如下表: spss的數據分析案例全文共12頁,當前為第2頁。spss的數據分析案例全文共12頁,當前為第2頁。spss的數據分析案例全文共12頁,當前為第3頁。EducationalLevel(years)spss的數據分析案例全文共12頁,當前為第3頁。FrequencyPercentValidPercentCumulativePercentValid85311、211、211、21219040、140、151、31461、31、352、51511624、524、577、0165912、412、489、517112、32、391、81891、91、993、719275、75、799、4202、4、499、8211、2、2100、0Total474100、0100、0上表及其直方圖說明,被調查的474名職工中,受過12年教育的職工就是該組頻數最高的,為190人,占總人數的40、1%,其次為15年,共有116人,占中人數的24、5%。且接受過高于20年的教育的人數只有1人,比例很低。描述統(tǒng)計分析。再通過簡單的頻數統(tǒng)計分析了解了職工在性別與受教育水平上的總體分布狀況后,我們還需要對數據中的其她變量特征有更為精確的認識,這就需要通過計算基本描述統(tǒng)計的方法來實現。下面就對各個變量進行描述統(tǒng)計分析,得到它們的均值、標準差、片度峰度等數據,以進一步把我數據的集中趨勢與離散趨勢。spss的數據分析案例全文共12頁,當前為第4頁。DescriptiveStstisticsspss的數據分析案例全文共12頁,當前為第4頁。NMinimumMaximumMeanStd、DeviationSkewnessKurtosisStatisticStatisticStatisticStatisticStatisticStatisticStd、ErrorStatisticStd、ErrorEducationalLevel(years)47482113、492、885-、114、112-、265、224CurrentSalary474$15,750$135,000$34,419、57$17,075、6612、125、1125、378、224BeginningSalary474$9,000$79,980$17,016、09$7,870、6382、853、11212、390、224PreviousExperience(months)spss的數據分析案例全文共12頁,當前為第5頁。474spss的數據分析案例全文共12頁,當前為第5頁。047695、86104、5861、510、1121、696、224MonthssinceHire474639881、1110、061-、053、112-1、153、224

如表所示,以起始工資為例讀取分析結果,474名職工的起始工資最小值為$9000,最大值為$79980,平均起始工資為$17016,標準差為$7870、638,偏度系數與峰度系數分別為2、853與12、390。其她數據依此讀取,則該表表明474名職工的受教育水平、起始工資、現工資、先前工作經驗、現在工作經驗的詳細分布狀況。Exploratorydataanalysis。交叉分析。通過頻數分析能夠掌握單個變量的數據分布情況,但就是在實際分析中,不僅要了解單個變量的分布特征,還要分析多個變量不同取值下的分布,掌握多個變量的聯合分布特征,進而分析變量之間的相互影響與關系。就本數據而言,需要了解現工資與性別、年齡、受教育水平、起始工資、本單位工作經歷、以前工作經歷、職務等級的交叉分析。現以現工資與職務等級的列聯表分析為例,讀取數據(下面數據分析表為截取的一部分):spss的數據分析案例全文共12頁,當前為第6頁。單因素分析用來研究一個控制變量的不同水平就是否對觀測變量產生了顯著影響。下面我們把受教育水平與起始工資作為控制變量,現工資為觀測變量,通過單因素方差分析方法研究受教育水平與起始工資對現工資的影響進行分析。分析結果如下:spss的數據分析案例全文共12頁,當前為第6頁。上表就是起始工資對現工資的單因素方差分析結果??梢郧瞥?F統(tǒng)計量的觀測值為33、040,對應的概率P值近似等于0,如果顯著性水平為0、05,由于概率值P小于顯著性水平q,則應拒絕原假設,認為不同的起始工資對現工資產生了顯著影響。同理,上表就是受教育水平對現工資影響的單因素分析結果,其結果亦為拒絕原假設,所以不同的受教育水平對現工資產生顯著影響。相關分析。相關分析就是分析客觀事物之間關系的數量分析法,明確客觀事物之間有怎樣的關系對理解與運用相關分析就是極其重要的。spss的數據分析案例全文共12頁,當前為第7頁。函數關系就是指兩事物之間的一種一一對應的關系,即當一個變量X取一定值時,另一個變量函數Y可以根據確定的函數取一定的值。另一種普遍存在的關系就是統(tǒng)計關系。統(tǒng)計關系就是指兩事物之間的一種非一一對應的關系,即當一個變量X取一定值時,另一個變量Y無法根據確定的函數取一定的值。統(tǒng)計關系可分為線性關系與非線性關系。spss的數據分析案例全文共12頁,當前為第7頁。事物之間的函數關系比較容易分析與測度,而事物之間的統(tǒng)計關系卻不像函數關系那樣直接,但確實普遍存在,并且有的關系強有的關系弱,程度各有差異。如何測度事物之間的統(tǒng)計關系的強弱就是人們關注的問題。相關分析正就是一種簡單易行的測度事物之間統(tǒng)計關系的有效工具。spss的數據分析案例全文共12頁,當前為第8頁。上表就是對本次分析數據中,現工資、起始工資、本單位工作時間、以前工作時間、年齡五個變量間的相關分析,表中相關系數旁邊有兩個星號(**)的,表示顯著性水平為0、01時,仍拒絕原假設。一個星號(*)表示顯著性水平為0、05就是仍拒絕原假設。先以現工資這一變量與其她變量的相關性為例分析,由上表可知,現工資與起始工資的相關性最大,相關系數為0、880,而與在本單位的工作時間相關性最小,相關系數為0、084。spss的數據分析案例全文共12頁,當前為第8頁。參數檢驗。首先對現工資的分布做正態(tài)性檢驗,結果如下:由上圖可知,現工資的分布可近似瞧作符合正態(tài)分布,現推斷現工資變量的平均值就是否為$3,000,0,因此可采取單樣本t檢驗來進行分析。分析如下:One-SampleStatisticsNMeanStd、DeviationStd、ErrorMeanspss的數據分析案例全文共12頁,當前為第9頁。 One-SampleTestspss的數據分析案例全文共12頁,當前為第9頁。TestValue=30000tdfSig、(2-tailed)MeanDifference95%ConfidenceIntervaloftheDifferenceLowerUpperCurrentSalary5、635473、000$4,419、568$2,878、40$5,960、73由One-SampleStatistics可知,474名職工的現工資平均值為¥34,419、57,標準差為$17,075、661,均值標準誤差為$784、311。圖表One-SampleTest中,第二列就是t統(tǒng)計量的觀測值為5、635;第三列就是自由度為473(n-1);第四列就是t統(tǒng)計量觀測值的雙尾概率值;第五列就是樣本均值與檢驗值的差;第六列與第七列就是總體均值與原假設值差的95%的置信區(qū)間為($2,878、40,5,960、73)。該問題的t值等于5、635對應的臨界置信水平為0,遠遠小于設置的0、05,因此拒絕原假設,表明該公司的474名職工的現工資與$3,000,0存在顯著差異。非參數檢驗。對本數據中的年齡做正態(tài)分布檢驗,結果如下:spss的數據分析案例全文共12頁,當前為第10頁。spss的數據分析案例全文共12頁,當前為第10頁。由上圖兩圖可知,474名職工的年齡分布并不完全符合正態(tài)分布,所以現推斷其職工年齡的平均數在40-45歲之間,可對其采用非參數檢驗的方法進行檢驗。檢驗結果如下:Chi-SquareTestspss的數據分析案例全文共12頁,當前為第11頁。spss的數據分析案例全文共12頁

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論