第五章 統(tǒng)計(jì)圖表與SAS過(guò)程_第1頁(yè)
第五章 統(tǒng)計(jì)圖表與SAS過(guò)程_第2頁(yè)
第五章 統(tǒng)計(jì)圖表與SAS過(guò)程_第3頁(yè)
第五章 統(tǒng)計(jì)圖表與SAS過(guò)程_第4頁(yè)
第五章 統(tǒng)計(jì)圖表與SAS過(guò)程_第5頁(yè)
已閱讀5頁(yè),還剩56頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第五章統(tǒng)計(jì)圖表與SAS過(guò)程5.1統(tǒng)計(jì)報(bào)表與TABULATE過(guò)程5.2統(tǒng)計(jì)圖與SAS過(guò)程5.1統(tǒng)計(jì)報(bào)表與TABULATE過(guò)程統(tǒng)計(jì)表的概念:是以表格的形式簡(jiǎn)明地反映事物間數(shù)量關(guān)系的一種重要的整理成果表達(dá)方式.構(gòu)成要素:標(biāo)題、橫行欄目、縱行欄目和統(tǒng)計(jì)數(shù)字四部分。結(jié)構(gòu)如表橫行總標(biāo)目,通常為分組標(biāo)志;

其子標(biāo)目是其標(biāo)志值,說(shuō)明每一行的內(nèi)容縱行總標(biāo)目,一般指統(tǒng)計(jì)指標(biāo);

其子標(biāo)目為具體統(tǒng)計(jì)指標(biāo),說(shuō)明每一列的內(nèi)容統(tǒng)計(jì)表的種類:按用途分為調(diào)查表、整理表和分析表;按主詞的分組分為簡(jiǎn)單表、簡(jiǎn)單分組表和復(fù)合表。簡(jiǎn)單表:主詞未經(jīng)任何分組簡(jiǎn)單分組表:主詞按一個(gè)標(biāo)志進(jìn)行分組所得到的統(tǒng)計(jì)表復(fù)合表:主詞按兩個(gè)或兩個(gè)以上標(biāo)志進(jìn)行分組所得到的統(tǒng)計(jì)表主要功能:可以對(duì)總體按一個(gè)標(biāo)志進(jìn)行簡(jiǎn)單分組匯總??梢詫?duì)總體按兩個(gè)或兩個(gè)以上標(biāo)志進(jìn)行復(fù)合分組匯總??梢砸员容^靈活的方式對(duì)每組進(jìn)行合計(jì),還可以計(jì)算每個(gè)分組單元的百分比。TABULATE過(guò)程的功能和一般格式proc

tabulatedata=cjl.qiye;classpeopletype;varamountoutputprofit;tabletype,amountoutputprofit;tablepeople*type,amountoutputprofit;run;例5.1某市200家企業(yè)2008年產(chǎn)值、利潤(rùn)情況的整理數(shù)據(jù)資料存放在數(shù)據(jù)集cjl.qiye中,包含變量people(企業(yè)人數(shù))、type(所有制形式)、amount(企業(yè)數(shù))、output(產(chǎn)值)、profit(利潤(rùn))。根據(jù)以上資料,完成以下問(wèn)題:(1)按所有制形式對(duì)200家企業(yè)進(jìn)行分組。(2)先對(duì)企業(yè)人數(shù)分組,再按所有制形式進(jìn)一步細(xì)分。tabletype,amountoutputprofit;對(duì)所有制形式(type)進(jìn)行分組求和tablepeople*type,amountoutputprofit;先對(duì)企業(yè)人數(shù)分組,再對(duì)所有制形式(type)進(jìn)行分組求和TABULATE過(guò)程的一般格式:1、PROCTABULATE語(yǔ)句一般格式:PROCTABULATE<option-list>;TABULATE過(guò)程常用語(yǔ)句說(shuō)明:option-list中可以選擇:(1)data=data-set(2)noseps:要求表中不出現(xiàn)水平分隔線(3)fromat=格式名:對(duì)每個(gè)報(bào)表單元規(guī)定輸出格

式,缺省以BEST12.2代替。2、CLASS語(yǔ)句一般格式:CLASSclass-variable-list;該語(yǔ)句規(guī)定報(bào)表中的分組標(biāo)志在TABLE語(yǔ)句中出現(xiàn)的任一個(gè)分組標(biāo)志必須事先在CLASS語(yǔ)句中予以定義。該語(yǔ)句規(guī)定報(bào)表中的分析變量(數(shù)值型)。所有在TABLE語(yǔ)句中出現(xiàn)的分析變量必須事先在該語(yǔ)句中定義。3、VAR語(yǔ)句一般格式:VARanalysis-variable-list;4、TABLE語(yǔ)句一般格式:TABLE<expression,><row-expression,>column-expression</option-list>;輸出報(bào)表的內(nèi)容、形式、結(jié)構(gòu)都是通過(guò)該語(yǔ)句中的各表達(dá)式通過(guò)組合得到。即通過(guò)維表達(dá)式、行表達(dá)式和列表達(dá)式組合得到。(1)維表達(dá)式:TABLE語(yǔ)句由一至三個(gè)用逗號(hào)隔開(kāi)的維表達(dá)式和選項(xiàng)組成。三維:最左邊定義頁(yè),中間定義行,右邊定義列兩維:左邊定義行,右邊定義列一維:定義列維表達(dá)式由分類變量、分析變量、統(tǒng)計(jì)量等操作元素和操作符連接而成。如:tablepeople,

type,

amountoutputprofit;tabletype,

amountoutputprofit;tableamountoutputprofit;proc

tabulatedata=cjl.qiye;classpeopletype;varamountoutputprofit;tablepeople,type,amountoutputprofit;tabletype,amountoutputprofit;tableamountoutputprofit;run;(2)操作符星號(hào)(*):在維內(nèi)對(duì)操作元素進(jìn)行交叉連接,即復(fù)合分組。如:rigion*citisize

空格:空格對(duì)操作元素進(jìn)行并排連接。圓括號(hào)():對(duì)操作元素分組或規(guī)定先后順序如:Saletype*(quantityincome)逗號(hào)(,):當(dāng)兩個(gè)操作元素用“,”隔開(kāi)時(shí),表示分開(kāi)表的維數(shù)。<>:規(guī)定分母的定義。交叉連接是在第一個(gè)操作元素的每一個(gè)水平內(nèi)排列第二個(gè)操作元素的所有水平。如分類變量A和B,A有兩個(gè)水平,B有三個(gè)水平A*B產(chǎn)生的報(bào)表B*A產(chǎn)生的報(bào)表連接操作是把第二項(xiàng)的所有水平放在第一項(xiàng)的所有水平之后。AB產(chǎn)生的報(bào)表A*BC產(chǎn)生的報(bào)表A*(BC)產(chǎn)生的報(bào)表(3)統(tǒng)計(jì)量說(shuō)明:若沒(méi)有規(guī)定分析變量,則N或PCTN可作為統(tǒng)計(jì)量使用。若規(guī)定了分析變量,但沒(méi)有指定統(tǒng)計(jì)量,用SUM作為統(tǒng)計(jì)量。(4)全類變量ALL表示僅有一個(gè)值的特殊分類變量當(dāng)ALL嵌入某個(gè)交叉時(shí),ALL不考慮分類變量的水平,而用ALL來(lái)生成子集和及總和tabletypeall,amountoutputprofit;tabletype,(peopleall)*amount;(5)百分?jǐn)?shù):PCTN和PCTSUM一般格式:PCTN或PCTSUM<分母說(shuō)明>分母的選取有下面三種:1)行總和百分?jǐn)?shù)2)列總和百分?jǐn)?shù)3)某一變量值總和百分?jǐn)?shù)PCTN是頻數(shù)的百分?jǐn)?shù),用于沒(méi)有缺失的分析變量值的頻數(shù)或者分類變量的某個(gè)交叉的頻數(shù)。第一行分母為40=10+30;第二行分母為60=20+40(1)行總和百分?jǐn)?shù)

如果只有列維中的分類變量出現(xiàn)在分母中式,分母值為每行的總和。如tablea,b*(npctn<b>);(分母為每行的總和)(2)列總和百分?jǐn)?shù)如果只有行維中的分類變量出現(xiàn)在分母中時(shí),分母值為每列的總和。第一列分母為30=10+20;第二列分母為70=30+40如tablea,b*(npctn<a>);(分母為每列的總和)分母為type的所有水平的output的總和,即143+186+30.6=359.6分子為type的每一水平的profit(利潤(rùn))。3)某一變量Y值總和百分比PCTSUM是SUM的百分?jǐn)?shù),必須用于分析變量值的SUM。tabletype,outputprofit*(sumpctsum<type*output>);參考書(shū)P161TABULATE過(guò)程的應(yīng)用舉例5.2統(tǒng)計(jì)圖與SAS過(guò)程統(tǒng)計(jì)圖用點(diǎn)、線、面等圖形直觀地反映變量分布特征、內(nèi)部結(jié)構(gòu),變量間關(guān)系及其變化狀況。常見(jiàn)的統(tǒng)計(jì)圖有:直方圖、餅圖、柱狀圖、盒狀圖、散點(diǎn)圖、折線圖、曲線圖、星形圖等。直方圖:用來(lái)表示經(jīng)統(tǒng)計(jì)分組后各組的頻數(shù)分布狀況,其條形的高度代表各組的頻數(shù)或頻率。餅圖:用來(lái)反映事物的內(nèi)部結(jié)構(gòu),必須用相對(duì)數(shù),餅圖的每個(gè)扇面代表某一部分占總體的比重。柱狀圖:用來(lái)表示不同總體某一指標(biāo)的數(shù)量特征,一般用于不同時(shí)間、地點(diǎn)的某一指標(biāo)之間的對(duì)比。散點(diǎn)圖:用來(lái)考察兩個(gè)變量間的關(guān)系,可以形象的反映出兩個(gè)連續(xù)變量之間有無(wú)關(guān)系,是直線關(guān)系還是曲線關(guān)系。直方圖餅圖柱狀圖散點(diǎn)圖主要功能有:GPLOT過(guò)程用來(lái)繪制變量間的散點(diǎn)圖、折線圖及曲線圖。對(duì)圖形可做到以下幾點(diǎn):繪圖符號(hào)可以由用戶選擇;坐標(biāo)軸的刻度間隔及標(biāo)記可以選擇;圖的大小可以選擇,可以控制同一頁(yè)上圖表的數(shù)量。散點(diǎn)圖、折線圖與GPLOT過(guò)程GPLOT過(guò)程的一般格式PROC

GPLOT<option-list>;PLOTrequest-list</option-list>;BYvariable-list;SYMBOL<option-list>;(1)PROCGPLOT語(yǔ)句:一般形式:PROCTGPLOT<option-list>;選項(xiàng):(1)DATA=SAS-DATA-SET;(2)圖形坐標(biāo)軸選項(xiàng):UNIFORM:對(duì)BY組使用一致的刻度。NOMISS:刪去含有丟失值的觀測(cè)。(3)圖形大小選項(xiàng):VPERCENT=percent-list|VPCT=percent-list;規(guī)定產(chǎn)生的圖形在垂直方向占一頁(yè)中的比例。如:vpct=33,VPCT=502525HPERCENT=percent-list|HPCT=percent-list;規(guī)定產(chǎn)生的圖形在水平方向占一頁(yè)中的比例。(2)BY語(yǔ)句BYvariable-list;(3)PLOT語(yǔ)句

PLOTrequest-list</options>;根據(jù)BY變量定義的觀測(cè)組分別畫(huà)出散點(diǎn)圖當(dāng)使用BY語(yǔ)句時(shí),要求輸入數(shù)據(jù)集已按BY變量排序的次序排列。可以規(guī)定任意多個(gè)plot語(yǔ)句;在每個(gè)plot語(yǔ)句中可以要求繪制任意多個(gè)圖形。1)

垂直變量*水平變量:依次用A,B,C等作為作圖符號(hào)。y*x;2)垂直變量*水平變量=‘字符’:規(guī)定一個(gè)字符作為作圖符號(hào)。如y*x=‘+’3)垂直變量*水平變量=變量:如y*x=a;一般形式:plotrequest-list</option-list>;(1)request-list:規(guī)定作圖變量以及作圖字符。三種形式:dataone;setcjl.qiye;keepamountoutputprofit;run;proc

sortdata=one;byoutput;run;proc

gplotdata=one;plotamount*output;plotamount*output=‘A';plotamount*(outputprofit);run;(2)option-list:VAIXS(HAXIS)=tick-value-list<byn>;定義垂直或水平坐標(biāo)軸相等間隔的刻度標(biāo)記值。VREF(HREF)=value-list:要求在縱軸或橫軸的一些規(guī)定的數(shù)上作水平或垂直參照線如果希望兩張或多張圖重疊,可以選擇overlaydataone;setcjl.qiye;keepamountoutputprofit;run;proc

gplotdata=one;plotamount*output/haxis=0to50by5vaxis=0to40by4;run;proc

gplotdata=one;plotamount*output/href=15

vref=20;run;proc

gplotdata=one;plotamount*output='1'amount*profit='2'/overlay;run;(4)SYMBOL語(yǔ)句用來(lái)規(guī)定作圖的符號(hào)、顏色、大小以及散點(diǎn)之間的連接方式value=symbol|v=symbol:定義數(shù)據(jù)點(diǎn)的符號(hào)。symbol主要有:PLUS(+),STAR(*),SQARE,……I=interpolation:定義數(shù)據(jù)點(diǎn)間的連接方式。interpolation主要有:join(連接),spline(用光滑曲線),rl(作回歸直線),….width=value|w=value:定義連線的線寬,數(shù)字越大,線越寬。color=color|c=color:定義顏色:redgreenblueyellow….且其中CI表示連線的顏色,CV表示散點(diǎn)的顏色,CO表示置信帶的顏色。dataone;setcjl.qiye;keepamountoutputprofit;run;proc

sortdata=one;byoutput;run;proc

gplotdata=one;plotprofit*output;symbolvalue=stari=joinci=redcv=bluewidth=3;run;procgplotdata=one;plotprofit*outputamount*output/overlay;symbol1value=stari=rlci=redcv=bluewidth=3;symbol2value=stari=splinec=greenwidth=3;run;legend1label=noneposition=(middlecenteroutside);axis1order=(0to50by5)offset=(0,0)label=(j=r‘output’)major=(height=2)minor=(height=1);axis2order=(0to40by5)offset=(0,0)label=(j=l'profitandamount')major=(height=2)minor=(height=1);procgplotdata=one;plotprofit*outputamount*output/overlaylegend=legend1haxis=axis1vaxis=axis2;symbol1value=stari=rlci=redcv=bluewidth=3;symbol2value=stari=splinec=greenwidth=3;run;主要功能:可以產(chǎn)生條形圖、餅圖、柱狀圖,通過(guò)語(yǔ)句來(lái)選擇,VBAR表示垂直條形圖,HBAR表示水平條形圖,PIE表示餅形圖,BLOCK表示柱狀圖。每種圖形所代表的意義可以不同,可通過(guò)選擇統(tǒng)計(jì)量實(shí)現(xiàn)。TYPE=FREQ、PCT、CFREQ、SUM、MEAN。條形圖、餅圖、柱狀圖與GCHART過(guò)程每種圖形可以進(jìn)行多種形式的分組,由分組變量控制。常見(jiàn)的分組變量:Discrete;group;subgroup;midpoints;sumvar;GCHART的一般格式PROCGCHART<option-list>;BYvariable-list;VBAR…;HBAR…;PIE…;BLOCK…;見(jiàn)書(shū)P176VBAR語(yǔ)句、HBAR語(yǔ)句、PIE語(yǔ)句、BLOCK語(yǔ)句VBAR語(yǔ)句的一般格式:VBARvariable-list</standard-option-list><VBAR-specific-option-list>;variable-list:給定作垂直條形圖的變量,通常是字符型的,若是連續(xù)型,需在選項(xiàng)中規(guī)定discrete明確這是做每個(gè)離散值的圖形,否則系統(tǒng)根據(jù)需要調(diào)整圖形的個(gè)數(shù)。standard-option-list有以下幾類:

(1)坐標(biāo)軸選項(xiàng):

AXIS=tick-value-list(標(biāo)志值列表)|BYn(2)MIDPOINTS=value-list:規(guī)定每個(gè)圖形表示的區(qū)間中點(diǎn)。定義沿垂直坐標(biāo)軸的刻度標(biāo)記值。如:VAXIS=052050100;(3)LEVELS=number:作圖變量為連續(xù)變量時(shí),規(guī)定所作條形的個(gè)數(shù)。(4)SUMVAR=variable:規(guī)定用來(lái)匯總概括數(shù)據(jù)特征的均值、頻數(shù)或總和的變量。(5)TYPE=statistic:規(guī)定圖形所代表的統(tǒng)計(jì)量的值(mean,sum,percent等)。(6)GROUP=variable:用來(lái)產(chǎn)生并排的一些圖形。只能用在VBAR、HBAR、BLOCK語(yǔ)句中。(7)SUBGROUP=variable:用于產(chǎn)生對(duì)每個(gè)總量進(jìn)行細(xì)分。變量一般為字符型變量,如是數(shù)值型的,

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論