![第四章統(tǒng)計(jì)描述與SAS過(guò)程_第1頁(yè)](http://file2.renrendoc.com/fileroot_temp3/2021-10/17/e2990a6c-dfc3-4e3d-85f0-d08ce8f1ca8b/e2990a6c-dfc3-4e3d-85f0-d08ce8f1ca8b1.gif)
![第四章統(tǒng)計(jì)描述與SAS過(guò)程_第2頁(yè)](http://file2.renrendoc.com/fileroot_temp3/2021-10/17/e2990a6c-dfc3-4e3d-85f0-d08ce8f1ca8b/e2990a6c-dfc3-4e3d-85f0-d08ce8f1ca8b2.gif)
![第四章統(tǒng)計(jì)描述與SAS過(guò)程_第3頁(yè)](http://file2.renrendoc.com/fileroot_temp3/2021-10/17/e2990a6c-dfc3-4e3d-85f0-d08ce8f1ca8b/e2990a6c-dfc3-4e3d-85f0-d08ce8f1ca8b3.gif)
![第四章統(tǒng)計(jì)描述與SAS過(guò)程_第4頁(yè)](http://file2.renrendoc.com/fileroot_temp3/2021-10/17/e2990a6c-dfc3-4e3d-85f0-d08ce8f1ca8b/e2990a6c-dfc3-4e3d-85f0-d08ce8f1ca8b4.gif)
![第四章統(tǒng)計(jì)描述與SAS過(guò)程_第5頁(yè)](http://file2.renrendoc.com/fileroot_temp3/2021-10/17/e2990a6c-dfc3-4e3d-85f0-d08ce8f1ca8b/e2990a6c-dfc3-4e3d-85f0-d08ce8f1ca8b5.gif)
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、統(tǒng)計(jì)軟件包統(tǒng)計(jì)軟件包SAS系統(tǒng)與統(tǒng)計(jì)分析系統(tǒng)與統(tǒng)計(jì)分析第四章第四章 統(tǒng)計(jì)描述與統(tǒng)計(jì)描述與SAS過(guò)程過(guò)程4.1 變量的數(shù)字特征與變量的數(shù)字特征與MEANS過(guò)程過(guò)程4.2 單變量分析與單變量分析與UNIVARIATE過(guò)程過(guò)程1、表示位置的數(shù)字特征、表示位置的數(shù)字特征總體均值、中位數(shù)、眾數(shù)總體均值、中位數(shù)、眾數(shù)眾數(shù)是使得隨機(jī)變量密度函數(shù)取最大值的數(shù)值眾數(shù)是使得隨機(jī)變量密度函數(shù)取最大值的數(shù)值一、隨機(jī)變量的數(shù)字特征一、隨機(jī)變量的數(shù)字特征2、表示離散程度的數(shù)字特征、表示離散程度的數(shù)字特征極差、方差、標(biāo)準(zhǔn)差、標(biāo)準(zhǔn)差極差、方差、標(biāo)準(zhǔn)差、標(biāo)準(zhǔn)差(變異)系數(shù)變異)系數(shù)4.1 變量的數(shù)字特征與變量的數(shù)字特征與MEA
2、NS過(guò)程過(guò)程極差:極差:minmaxXXR變異系數(shù):變異系數(shù):CV標(biāo)準(zhǔn)差系數(shù)反映了單位均值上的離散程度標(biāo)準(zhǔn)差系數(shù)反映了單位均值上的離散程度常用在兩個(gè)總體均值不等的離散程度的比較上。常用在兩個(gè)總體均值不等的離散程度的比較上。3、表示分布形狀的數(shù)字特征、表示分布形狀的數(shù)字特征偏度、峰度偏度、峰度 (對(duì)稱正態(tài)為(對(duì)稱正態(tài)為0)偏度:度量總體分布偏斜程度偏度:度量總體分布偏斜程度331)(XEG隨機(jī)變量分布為對(duì)稱分布;, 01G非對(duì)稱的右偏分布,即隨機(jī)變量取值在右邊比較分散;, 01G非對(duì)稱的左偏分布,即隨機(jī)變量取值在左邊比較分散;, 01G峰度:度量總體分布尾部粗細(xì)程度(與正態(tài)分布相比)峰度:度量總
3、體分布尾部粗細(xì)程度(與正態(tài)分布相比)3)(442XEG正態(tài)分布隨機(jī)變量的峰度為正態(tài)分布隨機(jī)變量的峰度為0;與正態(tài)分布相比,隨機(jī)變量與正態(tài)分布相比,隨機(jī)變量X偏離均值的極端值較少,偏離均值的極端值較少,分布形狀較平坦。分布形狀較平坦。, 02G與正態(tài)分布相比,隨機(jī)變量與正態(tài)分布相比,隨機(jī)變量X偏離均值的極端值較多,偏離均值的極端值較多,, 02G分布有一個(gè)沉重的尾部,也稱重尾或粗尾,分布形狀較陡峭;分布有一個(gè)沉重的尾部,也稱重尾或粗尾,分布形狀較陡峭;3、表示分布形狀的樣本統(tǒng)計(jì)量、表示分布形狀的樣本統(tǒng)計(jì)量樣本偏度、樣本峰度樣本偏度、樣本峰度4、區(qū)間估計(jì)、區(qū)間估計(jì)二、參數(shù)估計(jì)二、參數(shù)估計(jì)1、表示位
4、置的樣本統(tǒng)計(jì)量、表示位置的樣本統(tǒng)計(jì)量樣本均值、中位數(shù)、百分位數(shù)樣本均值、中位數(shù)、百分位數(shù)2、表示離散程度的樣本統(tǒng)計(jì)量、表示離散程度的樣本統(tǒng)計(jì)量樣本方差、樣本標(biāo)準(zhǔn)差、四分位差,樣本變異系數(shù)、樣本方差、樣本標(biāo)準(zhǔn)差、四分位差,樣本變異系數(shù)、樣本均值標(biāo)準(zhǔn)誤差樣本均值標(biāo)準(zhǔn)誤差 例題4.1,P93 在實(shí)際應(yīng)用中,經(jīng)常會(huì)遇到數(shù)據(jù)處理的問(wèn)題,那么為了分析數(shù)據(jù)我們就需要利用相關(guān)的統(tǒng)計(jì)量,數(shù)字特征來(lái)反映數(shù)據(jù)的特性。 主要功能主要功能 : MEANS過(guò)程用來(lái)對(duì)數(shù)據(jù)集中的數(shù)值變量的全部非丟失觀測(cè)全部非丟失觀測(cè)計(jì)算簡(jiǎn)單的描述統(tǒng)計(jì)量; 還可以對(duì)均值進(jìn)行假設(shè)檢驗(yàn)并給出置信區(qū)間; 對(duì)觀測(cè)組(BY組)分別計(jì)算簡(jiǎn)單描述統(tǒng)計(jì)量。三
5、、三、 MEANS過(guò)程過(guò)程 MEANS過(guò)程的一般格式為:過(guò)程的一般格式為:PROC MEANS; (必需的語(yǔ)句)var variable-list;class variable-list;freq variable;weight variable;id variable-list;by variable-list;output .其余都是可選語(yǔ)句其余都是可選語(yǔ)句1、PROC MEANS語(yǔ)句語(yǔ)句一般格式:一般格式:PROC MEANS ;常用常用options:(1)DATA=數(shù)據(jù)集名數(shù)據(jù)集名(2)NOPRINT或或PRINT:規(guī)定不輸出或輸出描述統(tǒng)計(jì)量;規(guī)定不輸出或輸出描述統(tǒng)計(jì)量;(3)MAX
6、DEC=number;規(guī)定輸出結(jié)果小數(shù)部分的最大位數(shù),規(guī)定輸出結(jié)果小數(shù)部分的最大位數(shù),缺省為缺省為2;(4)ALPHA=value:規(guī)定置信區(qū)間的置信水平,缺省為規(guī)定置信區(qū)間的置信水平,缺省為0.05;常見統(tǒng)計(jì)量:常見統(tǒng)計(jì)量:MEAN:均值均值 STD:標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差 MIN:最小值最小值 MAX:最大值最大值 RANGE:極差極差 SUM: 求和求和 VAR:方差方差 SKEWNESS:偏度偏度KURTOSIS:峰度峰度 等等等等語(yǔ)句說(shuō)明語(yǔ)句說(shuō)明statistic-keywords:規(guī)定輸出的統(tǒng)計(jì)量:規(guī)定輸出的統(tǒng)計(jì)量2、VAR語(yǔ)句:語(yǔ)句:一般格式一般格式 VAR variable-list;規(guī)
7、定要求計(jì)算簡(jiǎn)單統(tǒng)計(jì)量的數(shù)值變量及次序。規(guī)定要求計(jì)算簡(jiǎn)單統(tǒng)計(jì)量的數(shù)值變量及次序。3、BY語(yǔ)句:語(yǔ)句:一般格式一般格式 BY variable-list;根據(jù)根據(jù)by語(yǔ)句定義的觀測(cè)組分別計(jì)算各組相應(yīng)的簡(jiǎn)單統(tǒng)計(jì)量。語(yǔ)句定義的觀測(cè)組分別計(jì)算各組相應(yīng)的簡(jiǎn)單統(tǒng)計(jì)量。(要先排序)(要先排序)4、CLASS語(yǔ)句:語(yǔ)句:一般格式一般格式 CLASS variable-list;可用其規(guī)定的變量定義觀測(cè)組,并分別計(jì)算各組相應(yīng)的簡(jiǎn)可用其規(guī)定的變量定義觀測(cè)組,并分別計(jì)算各組相應(yīng)的簡(jiǎn)單統(tǒng)計(jì)量。單統(tǒng)計(jì)量。5、FREQ語(yǔ)句:語(yǔ)句:一般格式一般格式 FREQ variable;指定變量表示相應(yīng)觀測(cè)出現(xiàn)的頻數(shù)指定變量表示相應(yīng)觀
8、測(cè)出現(xiàn)的頻數(shù)6、WEIGHT語(yǔ)句:語(yǔ)句:WEIGHT variable;指定變量表示相應(yīng)觀測(cè)的權(quán)數(shù)指定變量表示相應(yīng)觀測(cè)的權(quán)數(shù)7、ID語(yǔ)句:語(yǔ)句:一般格式一般格式 ID variable;對(duì)產(chǎn)生的數(shù)據(jù)集增加一個(gè)或幾個(gè)附加變量,用于識(shí)別輸出數(shù)對(duì)產(chǎn)生的數(shù)據(jù)集增加一個(gè)或幾個(gè)附加變量,用于識(shí)別輸出數(shù)據(jù)集里的觀測(cè)。據(jù)集里的觀測(cè)。 要求把計(jì)算的描述統(tǒng)計(jì)量輸出到新的要求把計(jì)算的描述統(tǒng)計(jì)量輸出到新的SAS數(shù)據(jù)集中,并對(duì)數(shù)據(jù)集中,并對(duì)新數(shù)據(jù)集的名字及所包含的統(tǒng)計(jì)量名字列表。新數(shù)據(jù)集的名字及所包含的統(tǒng)計(jì)量名字列表。8、OUTPUT語(yǔ)句:語(yǔ)句:一般格式:一般格式:OUTPUTMAXID(var-1var-n)=nam
9、e-listMINID (var-1var-n)=name-list;三類任選項(xiàng):三類任選項(xiàng):(1)OUT=SAS-data-set:給出產(chǎn)生輸出數(shù)據(jù)集的名字給出產(chǎn)生輸出數(shù)據(jù)集的名字;(2)output-statistic-list;規(guī)定輸出數(shù)據(jù)集里所要求的統(tǒng)計(jì)量,并規(guī)定這些統(tǒng)計(jì)量規(guī)定輸出數(shù)據(jù)集里所要求的統(tǒng)計(jì)量,并規(guī)定這些統(tǒng)計(jì)量的變量名。的變量名。有以下幾種形式有以下幾種形式 :1)statistic-keyword=:如如output out=result mean=meanx;2) statistic-keywordname-list(名字列表)(名字列表)對(duì)對(duì)所有的分析變量所有的分析變量
10、規(guī)定統(tǒng)計(jì)量的變量名規(guī)定統(tǒng)計(jì)量的變量名如:如:output out=result1 mean=meanx1 meanx2;(3)MAXID(var-1var-n)=name-list MINID (var-1var-n)=name-list;該項(xiàng)選擇用不同分析變量的最大或最小值來(lái)識(shí)別變量的列表。該項(xiàng)選擇用不同分析變量的最大或最小值來(lái)識(shí)別變量的列表。3) statistic-keyword(variable-list)=name-list對(duì)對(duì)部分分析變量部分分析變量規(guī)定統(tǒng)計(jì)量的變量名規(guī)定統(tǒng)計(jì)量的變量名如:如:output out=result2 mean=premean postmean std(
11、post)=stdpost;(統(tǒng)計(jì)關(guān)鍵詞(變量列表)(統(tǒng)計(jì)關(guān)鍵詞(變量列表)=名字列名字列表)表)Var是被取最大值或最小值變量;是被取最大值或最小值變量;id-list是對(duì)最大值或最小值的識(shí)別變量。是對(duì)最大值或最小值的識(shí)別變量。data a;input name$ sex$ height age;cards;rose f 165 19kate f 168 17mike m 176 20john m 180 19alice f 170 22;proc means data=a;var height age;output out=new max=maxh maxa maxid(height(na
12、me) age(name)=heightst agest;run;maxid(height(name) age(name)=heightst agest;要求給出身高和年齡最大者的姓名,并分別用變量名保存在輸出數(shù)據(jù)集中。如:要求找出數(shù)據(jù)集a中身高最高者和年齡最大者輸出結(jié)果課本例課本例4.1(P97)data incomes;input income;cards;271 396 287 399 466 269 295 330 425 324 228 113 226 176 320230 404 487 127 74 234 523 164 336 343 330 436 141 388 2934
13、64 200 392 265 403 259 426 262 221 355 324 374 347 261 287113 135 291 176 342 443 239 302 483 231 292 373 346 293 236223 371 287 400 314 468 337 308 359 352 273 267 277 184 286214 351 270 330 238 248 419 330 319 440 427 314 414 299 265318 415 372 238 323 412 493 286 313 412; proc means data=incomes
14、mean var std cv skewness kurtosis alpha=0.1 t prt clm maxdec=2; var income;run; MEANS過(guò)程應(yīng)用過(guò)程應(yīng)用mean:均值;:均值;var:方差;:方差;std:標(biāo)準(zhǔn)差:標(biāo)準(zhǔn)差cv:標(biāo)準(zhǔn)差系數(shù);:標(biāo)準(zhǔn)差系數(shù);skewness:偏度:偏度kurtosis:峰度;:峰度;alpha=0.1:顯著性水平為:顯著性水平為0.1,即置信水平為,即置信水平為90%;t:均值是否為零的:均值是否為零的t檢驗(yàn)值;檢驗(yàn)值;prt:對(duì)應(yīng):對(duì)應(yīng)t值的概率值的概率clm:上、下置信限:上、下置信限maxdec=2:保留兩位有效小數(shù):保留兩位
15、有效小數(shù)輸出結(jié)果輸出結(jié)果1、計(jì)算家庭人均收入(、計(jì)算家庭人均收入(income),家庭人均消費(fèi)支出,家庭人均消費(fèi)支出(consume)和食品支出和食品支出(food)的均值、標(biāo)準(zhǔn)差、變異系數(shù)、偏度和峰度;的均值、標(biāo)準(zhǔn)差、變異系數(shù)、偏度和峰度;proc means data=cjl.xf2000 mean std cv skewness kurtosis maxdec=2;var income consume food;run;proc means data=cjl.xf2000 mean maxdec=2;Class area;var income consume food;Output ou
16、t=new max=maxin maxcon maxfmaxid(income(province) consume(province) food(province)=incomest consumest foodest;run;proc print data=new;var area maxin maxcon maxf incomest consumest foodest;run;2、按地區(qū)計(jì)算家庭人均收入(、按地區(qū)計(jì)算家庭人均收入(income),家庭人均消費(fèi)支出,家庭人均消費(fèi)支出(Consume)和食品支出和食品支出(food)的均值;的均值;計(jì)算各地區(qū)以上變量的最大值以及對(duì)應(yīng)的省份,并保
17、存到數(shù)據(jù)集計(jì)算各地區(qū)以上變量的最大值以及對(duì)應(yīng)的省份,并保存到數(shù)據(jù)集new中。中。各地區(qū)均值各地區(qū)均值各地區(qū)三個(gè)變量的最大值及相應(yīng)省份各地區(qū)三個(gè)變量的最大值及相應(yīng)省份4.2、單變量分析與、單變量分析與UNIVARIATE過(guò)程過(guò)程 在研究一個(gè)隨機(jī)變量的統(tǒng)計(jì)特性時(shí),僅僅靠一些數(shù)字在研究一個(gè)隨機(jī)變量的統(tǒng)計(jì)特性時(shí),僅僅靠一些數(shù)字特征是不夠的;特征是不夠的; 還必須研究其他反映變量統(tǒng)計(jì)特征的形式,比如:還必須研究其他反映變量統(tǒng)計(jì)特征的形式,比如: 樣本的極端值、分位數(shù)、直方圖、莖葉圖、盒型圖、樣本的極端值、分位數(shù)、直方圖、莖葉圖、盒型圖、 正態(tài)概率圖等。正態(tài)概率圖等。 能完成能完成MEANS過(guò)程的基本統(tǒng)計(jì)
18、量的計(jì)算過(guò)程的基本統(tǒng)計(jì)量的計(jì)算 描述變量極端值的情況描述變量極端值的情況 計(jì)算分位數(shù),如中位數(shù),上、下四分位數(shù)計(jì)算分位數(shù),如中位數(shù),上、下四分位數(shù) 生成若干個(gè)描述變量分布的圖,如莖葉圖、生成若干個(gè)描述變量分布的圖,如莖葉圖、盒型圖、正態(tài)概率圖等盒型圖、正態(tài)概率圖等 生成頻率表生成頻率表 對(duì)數(shù)據(jù)進(jìn)行正態(tài)性檢驗(yàn)對(duì)數(shù)據(jù)進(jìn)行正態(tài)性檢驗(yàn)UNIVARIATE過(guò)程的主要功能過(guò)程的主要功能 UNIVARIATE過(guò)程的過(guò)程的一般格式為:一般格式為:proc univariate ;var variable-list;by variable-list;freq variable;weight variable;i
19、d variable-list;output ; 語(yǔ)句說(shuō)明語(yǔ)句說(shuō)明options除了類似與除了類似與means過(guò)程的選項(xiàng)外還有:過(guò)程的選項(xiàng)外還有:1、proc univariate 語(yǔ)句語(yǔ)句(1) freq:要求生成包含變量值、頻數(shù)、百分?jǐn)?shù):要求生成包含變量值、頻數(shù)、百分?jǐn)?shù)和累積頻數(shù)的頻率表和累積頻數(shù)的頻率表(2)Normal:要求檢驗(yàn)輸入的數(shù)據(jù)是否服從正:要求檢驗(yàn)輸入的數(shù)據(jù)是否服從正態(tài)分布態(tài)分布(3)Plot:要求生成莖葉圖、盒型圖、正態(tài)概率:要求生成莖葉圖、盒型圖、正態(tài)概率圖圖(4)pctldef=value:規(guī)定計(jì)算百分位數(shù)的方法:規(guī)定計(jì)算百分位數(shù)的方法(1)Q3、Q1:上下四分位數(shù):上
20、下四分位數(shù)(2)QRANGE:上下四分位數(shù)間的差上下四分位數(shù)間的差(3)MSIGN:符號(hào)統(tǒng)計(jì)量符號(hào)統(tǒng)計(jì)量(4)PROBM:大于符號(hào)秩統(tǒng)計(jì)量絕對(duì)值的概率大于符號(hào)秩統(tǒng)計(jì)量絕對(duì)值的概率(5)SIGNRANK:符號(hào)秩統(tǒng)計(jì)量符號(hào)秩統(tǒng)計(jì)量(6)PROBS:大于中心符號(hào)秩統(tǒng)計(jì)量的絕對(duì)值的概率大于中心符號(hào)秩統(tǒng)計(jì)量的絕對(duì)值的概率(7)NORMAL:檢驗(yàn)正態(tài)性統(tǒng)計(jì)量:檢驗(yàn)正態(tài)性統(tǒng)計(jì)量(8)PROBN:檢驗(yàn)數(shù)據(jù)來(lái)自正態(tài)分布的假設(shè)的概率檢驗(yàn)數(shù)據(jù)來(lái)自正態(tài)分布的假設(shè)的概率(9)PCTLPTS=percentiles:規(guī)定用戶希望計(jì)算的百分位數(shù)。規(guī)定用戶希望計(jì)算的百分位數(shù)。2、OUTPUT語(yǔ)句語(yǔ)句輸出統(tǒng)計(jì)量表除了輸出統(tǒng)計(jì)量
21、表除了MEANS語(yǔ)句中常用統(tǒng)計(jì)量語(yǔ)句中常用統(tǒng)計(jì)量外,還有以下一些統(tǒng)計(jì)量:外,還有以下一些統(tǒng)計(jì)量:proc univariate data=cjl.xf2000 plot normal;var income;run;例例4.3 檢驗(yàn)例檢驗(yàn)例4.2中變量中變量income的正態(tài)性的正態(tài)性輸出內(nèi)容輸出內(nèi)容三種檢驗(yàn)的三種檢驗(yàn)的P值都值都0.05,故在給定的顯著性水平,故在給定的顯著性水平0.05下,下,拒絕均值為拒絕均值為0的原假設(shè),即變量的原假設(shè),即變量income的均值不為的均值不為0。輸出內(nèi)容樣本容量小于樣本容量小于2000時(shí)用時(shí)用W檢驗(yàn),大于檢驗(yàn),大于2000時(shí)用時(shí)用D檢驗(yàn)。檢驗(yàn)。W檢驗(yàn)對(duì)應(yīng)的
22、檢驗(yàn)對(duì)應(yīng)的P值小于值小于0.05,故在,故在0.05的顯著性水平下拒的顯著性水平下拒絕原假設(shè),即變量絕原假設(shè),即變量income不服從正態(tài)分布。不服從正態(tài)分布。輸出內(nèi)容輸出內(nèi)容縱軸為莖,數(shù)據(jù)代表觀測(cè)間隔。橫軸為葉,表示觀測(cè)頻數(shù),數(shù)據(jù)為縱軸為莖,數(shù)據(jù)代表觀測(cè)間隔。橫軸為葉,表示觀測(cè)頻數(shù),數(shù)據(jù)為觀測(cè)值的末尾數(shù)字,葉右邊數(shù)字代表這一區(qū)間內(nèi)觀測(cè)的個(gè)數(shù)。觀測(cè)值的末尾數(shù)字,葉右邊數(shù)字代表這一區(qū)間內(nèi)觀測(cè)的個(gè)數(shù)。輸出內(nèi)容盒形圖使用莖葉圖的縱軸,上下頂線對(duì)應(yīng)上下四分位數(shù),中間虛線對(duì)應(yīng)盒形圖使用莖葉圖的縱軸,上下頂線對(duì)應(yīng)上下四分位數(shù),中間虛線對(duì)應(yīng)中位數(shù)(中位數(shù)(5644.860) ,中間,中間”+”號(hào)位平均值(號(hào)
23、位平均值(6305.705 ),明顯大于中,明顯大于中位數(shù),說(shuō)明右邊數(shù)據(jù)比較分散,分布向右偏離。位數(shù),說(shuō)明右邊數(shù)據(jù)比較分散,分布向右偏離。穿過(guò)莖葉圖的線為觸須線,表示數(shù)據(jù)的分布范圍;穿過(guò)莖葉圖的線為觸須線,表示數(shù)據(jù)的分布范圍;延伸到上下頂線外的范圍是上下四分位數(shù)差的延伸到上下頂線外的范圍是上下四分位數(shù)差的2.5倍,超過(guò)范圍的數(shù)用倍,超過(guò)范圍的數(shù)用“0”表示,若數(shù)值大于表示,若數(shù)值大于3倍,用倍,用“*”表示。表示。 6305.705 下頂線下的線較短,說(shuō)明這個(gè)范圍的數(shù)據(jù)分布比較集中。輸出內(nèi)容“”代表觀測(cè)值,代表觀測(cè)值,“+”代表參考直線,代表參考直線,若觀測(cè)來(lái)自正態(tài)分布,兩者應(yīng)較為接近或重合。
24、若觀測(cè)來(lái)自正態(tài)分布,兩者應(yīng)較為接近或重合。本例顯然不重合,故變量本例顯然不重合,故變量income不服從正態(tài)分布。不服從正態(tài)分布。輸出內(nèi)容“”代表觀測(cè)值,代表觀測(cè)值,“+”代表參考直線,代表參考直線,若觀測(cè)來(lái)自正態(tài)分布,兩者應(yīng)較為接近或重合。若觀測(cè)來(lái)自正態(tài)分布,兩者應(yīng)較為接近或重合。本例顯然不重合,故變量本例顯然不重合,故變量income不服從正態(tài)分布。不服從正態(tài)分布。proc univariate data=cjl.xf2000 noprint;var income;histogram income/cframe=ligr cfill=green;title histogram of inc
25、ome;run;例例4.4 利用利用PROC UNIVARIATE過(guò)程作直方過(guò)程作直方圖進(jìn)一步分析例圖進(jìn)一步分析例4.2中變量中變量income的分布情況的分布情況顯然不符合正態(tài)分布,右邊比較分散,分布向右偏離。顯然不符合正態(tài)分布,右邊比較分散,分布向右偏離。data a;input province$ x2-x7;cards;bj2.971.681.771174.481078.57779.61tj3.001.412.13827.61770.85581.47sjz3.041.541.97627.9590.32427.87ty2.941.631.80644.51592.17441.25hhht2
26、.731.282.13641.78610.47480.24sy2.971.761.69692.73623.77505.27dl3.061.691.81771.92704.51621.25cc3.061.771.73635.19603.23541.54heb2.901.511.92671.31654.79494.76sh3.001.551.941273.241138.71896.83nj2.901.402.07892.41833.69611.76hz2.991.601.871004.69895.77700.04nb2.891.651.751179.611051.65877.74hf2.931.501.95659.24606.44457.92fz3.121.681.86846.35768.80527.77xm3.161.671.891135.111020.33639.36nc2.931.481.98625.4606.33364.37jn
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年中國(guó)廣州旅游市場(chǎng)運(yùn)行態(tài)勢(shì)及投資戰(zhàn)略咨詢研究報(bào)告
- 清爽柔膚潔面露行業(yè)深度研究報(bào)告
- 2025-2031年中國(guó)大豆磷脂粉行業(yè)市場(chǎng)深度研究及投資策略研究報(bào)告
- 基于翻譯轉(zhuǎn)換理論指導(dǎo)下的《動(dòng)漫文化外交》(節(jié)選)日漢翻譯實(shí)踐報(bào)告
- 碘催化轉(zhuǎn)酰胺反應(yīng)及喹唑啉、吲哚啉的合成方法研究
- 苜蓿高羊茅單播和混播對(duì)羊尿添加的氮素利用研究
- 現(xiàn)代企業(yè)營(yíng)銷策略的多元化趨勢(shì)與挑戰(zhàn)
- 葉片幾何參數(shù)對(duì)軸流泵空化性能的影響研究
- 茶多酚和黃芪甲苷凝膠制劑對(duì)小鼠Ⅱ型糖尿病傷口愈合的作用研究
- 短視頻內(nèi)容創(chuàng)意與制作技巧
- GCP理論考試試題及答案 (一)
- 中考語(yǔ)文句子排序練習(xí)題(文本版)
- 外研版七年級(jí)下冊(cè)重點(diǎn)語(yǔ)法總結(jié)
- 陜西建工集團(tuán)股份有限公司2023環(huán)境、社會(huì)和公司治理(ESG)報(bào)告
- 國(guó)家科學(xué)技術(shù)獎(jiǎng)勵(lì)提名書
- 2024年影視藝術(shù)概論復(fù)習(xí)考試題(附答案)
- 園林綠化一月份養(yǎng)護(hù)計(jì)劃
- 2024年輔警招考時(shí)事政治考題及答案(100題)
- 小腸梗阻的護(hù)理
- 非物質(zhì)文化遺產(chǎn)拓印 課件
- 手拉葫蘆安全技術(shù)操作規(guī)程
評(píng)論
0/150
提交評(píng)論