數(shù)據(jù)分析報(bào)告的范文_第1頁(yè)
數(shù)據(jù)分析報(bào)告的范文_第2頁(yè)
數(shù)據(jù)分析報(bào)告的范文_第3頁(yè)
數(shù)據(jù)分析報(bào)告的范文_第4頁(yè)
數(shù)據(jù)分析報(bào)告的范文_第5頁(yè)
已閱讀5頁(yè),還剩17頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

#率遠(yuǎn)遠(yuǎn)低于全國(guó)平均水平,14?29歲的死亡率僅為0.85%。,14?35歲的死亡率為0.95%。。青年人口的民族狀況我國(guó)是一個(gè)多民族國(guó)家,在960萬(wàn)平方公里土地上居住著56個(gè)民族,每個(gè)民族都有自己的青少年人口。2000年第五次人口普查時(shí),漢族仍是我國(guó)的主體民族,14?29歲青少年人口中有90.58%為漢族9.42%為少數(shù)民族;14?35歲青少年人口中漢族比例略高,為91.09%,少數(shù)民族占8.91%。少數(shù)民族中壯族、滿族、回族、維吾爾族、苗族、彝族、土家族、蒙古族、藏族人數(shù)最多,人口比例均占0.5%以上。一、數(shù)據(jù)介紹:本次分析的數(shù)據(jù)為某地區(qū)361個(gè)人旅游情況狀況統(tǒng)計(jì)表,其中共包含七變量,分別是:年齡,為三類變量;性別,為二類變量(0代表女,1代表男);收入,為一類變量;旅游花費(fèi),為一類變量;通道,為二類變量(0代表沒(méi)走通道,1代表走通道);旅游的積極性,為三類變量(0代表積極性差,1代表積極性一般,2代表積極性比較好,3代表積極性好4代表積極性非常好);額外收入,一類變量。通過(guò)運(yùn)用spss統(tǒng)計(jì)軟件,對(duì)變量進(jìn)行頻數(shù)分析、描述性統(tǒng)計(jì)、方差分析、相關(guān)分析,以了解該地區(qū)上述方面的綜合狀況,并分析個(gè)變量的分布特點(diǎn)及相互間的關(guān)系。二、數(shù)據(jù)分析

1、頻數(shù)分析?;镜慕y(tǒng)計(jì)分析往往從頻數(shù)分析開(kāi)始。通過(guò)頻數(shù)分地區(qū)359個(gè)人旅游基本狀況的統(tǒng)計(jì)數(shù)據(jù)表,在性別、旅游的積極性不同的狀況下的頻數(shù)分析,從而了解該地區(qū)的男女職工數(shù)量、不同積極性情況的基本分布。統(tǒng)計(jì)量積極性性別N有效359359缺失00首先,對(duì)該地區(qū)的男女性別分布進(jìn)行頻數(shù)分析,結(jié)果如下性別頻率百分比有效百分比累積百分比有效女19855.255.255.2男16144.844.8100.0合計(jì)359100.0100.0表說(shuō)明,在該地區(qū)被調(diào)查的359個(gè)人中,有198名女性,161名男性,男女比例分別為44.8%和55.2%,該公司職工男女?dāng)?shù)量差距不大,女性略多于男性。其次對(duì)原有數(shù)據(jù)中的旅游的積極性進(jìn)行頻數(shù)分析,結(jié)果如下表:積極性頻率百分比有效百分比累積百分比有效差17147.647.647.6—般7922.022.069.6比較好7922.022.091.6好246.76.798.3非常好61.71.7100.0合計(jì)359100.0100.0

其次對(duì)原有數(shù)據(jù)中的積極性進(jìn)行頻數(shù)分析,結(jié)果如下表其次對(duì)原有數(shù)據(jù)中的是否進(jìn)通道進(jìn)行頻數(shù)分析,結(jié)果如下表Statistics通道NValidMissing3590通道FrequencyPercentValidPercentCumulativePercentValid沒(méi)走通道29381.681.681.6

通道Total66359通道Total6635918.4100.018.4100.0100.0這說(shuō)明,在該地區(qū)被調(diào)查的359個(gè)人中,有沒(méi)走通道的占81.6%,占絕大多數(shù)。上表及其直方圖說(shuō)明,被調(diào)查的359個(gè)人中,對(duì)與旅游積極性差的組頻數(shù)最高的,為171人數(shù)的47.6%,其次為積極性一般和比較好的,占比例都為22.0%,積性為好的和非常好的比例比較低,分別為24人和6人,占總體的比例為6.7%和1.7%。2、描述統(tǒng)計(jì)分析。再通過(guò)簡(jiǎn)單的頻數(shù)統(tǒng)計(jì)分析了解了職工在性別和受教育水平上的總體分布狀況后,我們還需要對(duì)數(shù)據(jù)中的其他變量特征有更為精確的認(rèn)識(shí),這就需要通過(guò)計(jì)算基本描述統(tǒng)計(jì)的方法來(lái)實(shí)現(xiàn)。下面就對(duì)各個(gè)變量進(jìn)行描述統(tǒng)計(jì)分析,得到它們的均值、標(biāo)準(zhǔn)差、片度峰度等數(shù)據(jù),以進(jìn)一步把我數(shù)據(jù)的集中趨勢(shì)和離散趨勢(shì)。描述統(tǒng)計(jì)量N極小值極大值均值標(biāo)準(zhǔn)差方差偏度峰度統(tǒng)計(jì)量統(tǒng)計(jì)量統(tǒng)計(jì)量統(tǒng)計(jì)量統(tǒng)計(jì)量統(tǒng)計(jì)量統(tǒng)計(jì)量標(biāo)準(zhǔn)誤統(tǒng)計(jì)量標(biāo)準(zhǔn)誤收入3597.4266250.0001032.93021762.523942581442.7621.790.1296.869.257旅游花費(fèi)359211006116.41130.71617086.7043.145.12913.401.257有效的N(列表狀態(tài))359如表所示,以起始工資為例讀取分析結(jié)果,359個(gè)人中收入最小值為7.426¥,最大值為6250.00000¥,平均1032.9302¥,標(biāo)準(zhǔn)差為762.5239¥偏度系數(shù)和峰度系數(shù)分別為1.790和6.869。其他數(shù)據(jù)依此讀取,則該表表明該地區(qū)旅游花費(fèi)的詳細(xì)分布狀況。3、探索性數(shù)據(jù)分析1)交叉分析通過(guò)頻數(shù)分析能夠掌握單個(gè)變量的數(shù)據(jù)分布情況,但是在實(shí)際分析中,不僅要了解單個(gè)變量的分布特征,還要分析多個(gè)變量不同取值下的分布,掌握多個(gè)變量的聯(lián)合分布特征,進(jìn)而分析變量之間的相互影響和關(guān)系。就本數(shù)據(jù)而言,需要了解現(xiàn)工資與性別、年齡、受教育水平、起始工資、本單位工作經(jīng)歷、以前工作經(jīng)歷、職務(wù)等級(jí)的交叉分析。現(xiàn)以現(xiàn)工資與職務(wù)等級(jí)的列聯(lián)表分析為例,讀取數(shù)據(jù)(下面數(shù)據(jù)分析表為截取的一部分):Count性別*積極性交叉制表計(jì)數(shù)積極性合計(jì)差—般比較好好非常好性別女964741122198男753238124161合計(jì)1717979246359

性別積極性性別■差■般□比較好□呼□非常好上聯(lián)表及BarChart涉及兩個(gè)變量,即性別與積極性的二維交叉,反映了在不同的性別對(duì)于旅游積極性分布情況。上表中,性別成為行向量,積極性列向量。(2)性別與收入的探索性分析性別CaseProcessingSummary性別CasesValidMissingTotalNPercentNPercentNPercent收入女198100.0%0.0%198100.0%男161100.0%0.0%161100.0%Descriptives性別StatisticStd.Error

收入女Mean1005.285649.514792695%ConfideneeLowerBound907.63853IntervalforMeanUpperBound1102.932725%TrimmedMean957.92011Median937.50000Varianee485439.577Std.Deviation696.734940Minimum7.426Maximum3125.000Range3117.574InterquartileRange937.563Skewness.896.173Kurtosis.310.344田男Mean1066.927965.993211995%ConfideneeLowerBound936.59779IntervalforMeanUpperBound1197.258025%TrimmedMean986.95497Median937.50000Varianee701171.907Std.Deviation837.360082Minimum58.630Maximum6250.000Range6191.370InterquartileRange718.750Skewness2.370.191Kurtosis10.166.380收入Stem-and-LeafPlots收入Stem-and-LeafPlotfor性別=女FrequencyStem&Leaf18.00026.00017.00033.00022.00013.00118.00118.0014.0015.00114.002.0024.0021.0022.0023.00Extremes00111111111111111122222222222223333333333333444444444445555556666666666666666666667777777777770000000001111222222222222222223444455555555555555777788888000001111111115555688(>=3000)Stemwidth:1000.000Eachleaf:1case(s)收入Stem-and-LeafPlotfor性別=男FrequencyStem&Leaf15.0017.0013.0026.0019.0013.0019.0013.00000001100111111111111122222233333333333444444555555566666666666667777777777777888889999999999999900000000000111.44445555555552.001.776.001.8888896.002.00011112.00Extremes(>=2351)Stemwidth:1000.000Eachleaf:Stemwidth:1000.000Eachleaf:1case(s)結(jié)果分析如下收入女男平均數(shù)1005.285621066.92791均數(shù)的95%可信區(qū)間(907.63853,1102.93272)(936.597791197.25802)5%的調(diào)整均數(shù)957.92011986.954975%的調(diào)整均數(shù)957.92011986.95497中位數(shù)937.50000937.50000標(biāo)準(zhǔn)差696.734940837.360082標(biāo)準(zhǔn)差485439.577701171.907最小值7.42658.630最大值3125.0006250.000極差3117.5746191.370四分位數(shù)間距937.563718.750偏度系數(shù)2.3702.370峰度系數(shù).31010.166(3)p-p圖分析的止態(tài)圖AgeAge結(jié)果分析年齡在正態(tài)p-p圖的散點(diǎn)近似成一條直線,無(wú)趨勢(shì)正態(tài)p-p圖的散點(diǎn)均勻分布在直線y=0的上下,故可認(rèn)為本資料服從正態(tài)分布4、相關(guān)分析。相關(guān)分析是分析客觀事物之間關(guān)系的數(shù)量分析法,明確客觀事之間有怎樣的關(guān)系對(duì)理解和運(yùn)用相關(guān)分析是極其重要的。函數(shù)關(guān)系是指兩事物之間的一種一一對(duì)應(yīng)的關(guān)系,即當(dāng)一個(gè)變量X取一定值時(shí),另一個(gè)變量函數(shù)Y可以根據(jù)確定的函數(shù)取一定的值。另一種普遍存在的關(guān)系是統(tǒng)計(jì)關(guān)系。統(tǒng)計(jì)關(guān)系是指兩事物之間的一種非一一對(duì)應(yīng)的關(guān)系,即當(dāng)一個(gè)變量X取一定值時(shí),另一個(gè)變量Y無(wú)法根據(jù)確定的函數(shù)取一定的值。統(tǒng)計(jì)關(guān)系可分為線性關(guān)系和非線性關(guān)系。事物之間的函數(shù)關(guān)系比較容易分析和測(cè)度,而事物之間的統(tǒng)計(jì)關(guān)系卻不像函數(shù)關(guān)系那樣直接,但確實(shí)普遍存在,并且有的關(guān)系強(qiáng)有的關(guān)系弱,程度各有差異。如何測(cè)度事物之間的統(tǒng)計(jì)關(guān)系的強(qiáng)弱是人們關(guān)注的問(wèn)題。相關(guān)分析正是一種簡(jiǎn)單易行的測(cè)度事物之間統(tǒng)計(jì)關(guān)系的有效工具。Correlations收入旅游花費(fèi)額外收入收入PearsonCorrelation1.140**.853**Sig.(2-tailed).008.000N359359359旅游花費(fèi)PearsonCorrelation?140**1.183**Sig.(2-tailed).008.000N359359359額外收入PearsonCorrelation.853**.183**1Sig.(2-tailed).000.000N359359359**.Correlationissignificantatthe0.01level(2-tailed).上表是對(duì)本次分析數(shù)據(jù)中,旅游花費(fèi)、收入、、額外收入的相關(guān)分析,表中相關(guān)系數(shù)旁邊有兩個(gè)星號(hào)(**)的,表示顯著性水平為0.01時(shí),仍拒絕原假設(shè)。一個(gè)星號(hào)(*)表示顯著性水平為0.05是仍拒絕原假設(shè)。先以現(xiàn)旅游花費(fèi)這一變量與其他變量的相關(guān)性為例分析,由上表可知,旅游花費(fèi)與額外收入的相關(guān)性最大,5.回歸分析有相關(guān)性分析可得收入,旅游花費(fèi)呈線性相關(guān),因此作回歸分析VariablesEntered/RemovedbModelVariablesEnteredVariablesRemovedMethod1收入aEnterAllrequestedvariablesentered.DependentVariable:旅游花費(fèi)

ModelSummarybModelRRSquareAdjustedRSquareStd?ErroroftheEstimate1.140a.020.017129.604Predictors:(Constant),收入DependentVariable:旅游花費(fèi)ANOVAbModelSumofSquaresdfMeanSquareFSig.1Regression120443.8091120443.8097.170.008aResidual5996596.23935716797.188Total6117040.048358Predictors:(Constant),收入DependentVariable:旅游花費(fèi)CoefficientsaModelUnstandardizedCoefficientsStandardizedCoefficientstSig.BStd.ErrorBeta1(Constant)91.56311.5287.943.000收入.024.009.1402.678.008a.DependentVariable:旅游花費(fèi)ResidualsStatisticsaMinimumMaximumMeanStd?DeviationNPredictedValue91.74241.90116.4118.342359Std.PredictedValue-1.3456.842.0001.000359StandardErrorof6.84047.3629.0483.426359PredictedValueAdjustedPredictedValue92.09271.79116.5319.018359Residual-193.904891.785.000129.423359Std.Residual-1.4966.881.000.999359

Stud.Residual-1.6076.891.0001.002359DeletedResidual-223.789894.316-.117130.229359Stud.DeletedResidual-1.6117.390.0041.025359Mahal?Distance.00046.811.9972.955359Cook'sDistance.000.199.003.015359CenteredLeverageValue.000.131.003.008359a.DependentVariable:旅游花費(fèi)ChartsOD68ScatterplotDependentVariable:旅游花費(fèi)1200-800-RegressionStandardizedPredictedValue10QQ-60D-斗DELOD68ScatterplotDependentVariable:旅游花費(fèi)1200-800-RegressionStandardizedPredictedValue10QQ-60D-斗DEL200f-/嚴(yán)ooQ警餾喲g弋oo.o耀坤備耐遜00OOO由上圖可知回歸方程:y=91.563+0.024(x1),(P(Sig=0.000)<0.01)即旅游花費(fèi)=91.563+0.024*收入(p<0.01)6單樣本T檢驗(yàn)首先對(duì)現(xiàn)工資的分布做正態(tài)性檢驗(yàn),結(jié)果如下:收入D.DM20DO.DDD4000.000由上圖可知,現(xiàn)工資的分布可近似看作符合正態(tài)分布,現(xiàn)推斷現(xiàn)工資變量的平收入D.DM20DO.DDD4000.000由上圖可知,現(xiàn)工資的分布可近似看作符合正態(tài)分布,現(xiàn)推斷現(xiàn)工資變量的平均值是否為$3,000,0,因此可采取單樣本t檢驗(yàn)來(lái)進(jìn)行分析。分析如下:One-SampleStatistics單個(gè)樣本統(tǒng)計(jì)量N均值標(biāo)準(zhǔn)差均值的標(biāo)準(zhǔn)誤收入3591032.93021762.52394240.244474單個(gè)樣本檢驗(yàn)檢驗(yàn)值二0tdfSig.(雙側(cè))均值差值差分的95%置信區(qū)間下限上限收入25.666358.0001032.930214953.784931112.07550由One-SampleStatistics可知,359個(gè)被調(diào)查的人中收入平均值1032.93021,標(biāo)準(zhǔn)差為762.523942,均值標(biāo)準(zhǔn)誤差為40.244474。圖表One-Samp

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論