定量數(shù)據(jù)的統(tǒng)計(jì)描述課件_第1頁(yè)
定量數(shù)據(jù)的統(tǒng)計(jì)描述課件_第2頁(yè)
定量數(shù)據(jù)的統(tǒng)計(jì)描述課件_第3頁(yè)
定量數(shù)據(jù)的統(tǒng)計(jì)描述課件_第4頁(yè)
定量數(shù)據(jù)的統(tǒng)計(jì)描述課件_第5頁(yè)
已閱讀5頁(yè),還剩61頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

Means過(guò)程Summary過(guò)程Univariate過(guò)程定量數(shù)據(jù)統(tǒng)計(jì)指標(biāo)計(jì)算的三種過(guò)程Means過(guò)程定量數(shù)據(jù)統(tǒng)計(jì)指標(biāo)計(jì)算的三種過(guò)程1Means過(guò)程格式:Procmeans<數(shù)據(jù)集名><noprint><其它選項(xiàng)>;Var變量列表;(規(guī)定需要計(jì)算的數(shù)值變量及順序)Class變量名列表;(分組計(jì)算)Freq變量;(該語(yǔ)句指定一個(gè)數(shù)值型的變量,它的值表示輸入數(shù)據(jù)集中相應(yīng)觀測(cè)出現(xiàn)的頻數(shù)。該變量的值應(yīng)為正整數(shù)。若freq變量值<1或缺失,相應(yīng)的觀測(cè)不參加計(jì)算統(tǒng)計(jì)量;若這個(gè)值不是正整數(shù),取整數(shù)部分。)Weight變量;(該變量的值應(yīng)大于0,若<0或缺失,則假定該值為0.)Id變量名列表;(該語(yǔ)句對(duì)means過(guò)程產(chǎn)生的輸出數(shù)據(jù)集增加一個(gè)或幾個(gè)附加變量,目的在于識(shí)別輸出數(shù)據(jù)集里德觀測(cè))By變量名列表;(分組計(jì)算,注意一定要先排序)Output<out=數(shù)據(jù)集名字><輸出統(tǒng)計(jì)量列表>;Means過(guò)程Means過(guò)程格式:Means過(guò)程2Procmeans中的其它選項(xiàng)包括Maxdec=n;規(guī)定輸出結(jié)果中的小數(shù)部分的最大位數(shù)(0-8)。缺省時(shí)是2。Fw=n;給出該過(guò)程用來(lái)打印每個(gè)統(tǒng)計(jì)量的域?qū)挕H笔∈?2。Alpha=a;設(shè)置計(jì)算置信區(qū)間的置信水平a。a在0-1之間。假如,若規(guī)定a=0.05,則得到均值的95%的置信區(qū)間Missing要求該過(guò)程把class變量的缺失值作為有效分組值處理Means過(guò)程Procmeans中的其它選項(xiàng)包括Means過(guò)程3Procmeansdata=class;Varheight;Run;在上述用法中,沒(méi)有指定輸出的統(tǒng)計(jì)量,缺省的會(huì)對(duì)每個(gè)選定的變量計(jì)算有效記錄(N)、均值(Mean)、標(biāo)準(zhǔn)差(Std)、最大值(Maximum)和最小值(Minimum)五個(gè)統(tǒng)計(jì)量。Means過(guò)程最簡(jiǎn)單的用法Procmeansdata=class;Means過(guò)程最4可以用means過(guò)程計(jì)算的統(tǒng)計(jì)量分別用關(guān)鍵詞表示:可以用means過(guò)程5Procmeansdata=classmeanvarclmalpha=0.01maxdec=3fw=8;Varheightweight;Outputout=mclassmean=var=vhvwlclm=lcuclm=uc;Run;Means過(guò)程示例

該程序要求輸出的結(jié)果占8個(gè)字符,其中小數(shù)位為3。把運(yùn)行結(jié)果輸出到數(shù)據(jù)集mclass中,包括變量height(height的均值)weight(weight的均值)vh(height的方差)vw(weight的方差)Lc(置信度為99%的置信下限)uc(置信度為99%的置信上限)Procmeansdata=classmeanvar61、統(tǒng)計(jì)關(guān)鍵字=代表統(tǒng)計(jì)值的變量名稱(chēng)串Procmeansdata=class;Varheightweight;Classsex;Outputout=testmean=m_hm_w;Run;Output的四種方式這種界定方式自動(dòng)計(jì)算出var指令所列舉之所有變量的統(tǒng)計(jì)值。因此,等號(hào)右邊所列舉的變量,必須與var指令中所列舉的變量前后對(duì)應(yīng)而且數(shù)目相同。1、統(tǒng)計(jì)關(guān)鍵字=代表統(tǒng)計(jì)值的變量名稱(chēng)串Output的四種方式72、統(tǒng)計(jì)關(guān)鍵字(變量名稱(chēng)串)=代表統(tǒng)計(jì)值的變量名稱(chēng)串Procmeansdata=class;Varheightweight;Classsex;Outputout=testmean=m_hm_wstd(height)=v_h;Run;Output的四種方式這種界定方式將產(chǎn)生var指令所列舉之部分變量的統(tǒng)計(jì)值。例如,上例文件test中包括變量m_h,m_w和v_h。2、統(tǒng)計(jì)關(guān)鍵字(變量名稱(chēng)串)=代表統(tǒng)計(jì)值的變量名稱(chēng)串Outp83、統(tǒng)計(jì)關(guān)鍵字=Procmeansdata=class;Varheightweight;Classsex;Outputout=testmean=;Run;Output的四種方式這種表達(dá)方式在等號(hào)右邊是空白,未界定任何代表統(tǒng)計(jì)值的變量名稱(chēng)。因此,將以原變量的名稱(chēng)來(lái)代表。例如,在上例中,輸出文件test中變量height與weight分別代表相應(yīng)的均值。

須注意,若使用這種界定方式,則一個(gè)var變量,只能產(chǎn)生一種統(tǒng)計(jì)值,而不能同時(shí)產(chǎn)生其他統(tǒng)計(jì)值。這是因?yàn)橐粋€(gè)var變量的名稱(chēng)只能同時(shí)代表一種統(tǒng)計(jì)值。3、統(tǒng)計(jì)關(guān)鍵字=Output的四種方式這種表達(dá)方式在等號(hào)右邊94、統(tǒng)計(jì)關(guān)鍵字(變量名稱(chēng)串)=Procmeansdata=class;Varheightweight;Classsex;Outputout=testmean=m_hm_wmax(height)=;Run;Output的四種方式這種表達(dá)方式在等號(hào)右邊是空白,未界定任何代表統(tǒng)計(jì)值的變量名稱(chēng)。在等號(hào)左邊的括號(hào)內(nèi)列舉部分var指令中所提到的變量。因此,這些變量的統(tǒng)計(jì)值,仍以變量的原名表示。例如,在上例中,輸出文件test中變量m_h和m_w分別代表height與weight的均值,height代表height的最大值。

須注意,一個(gè)在var指令中界定的變量名稱(chēng)只能代表一種統(tǒng)計(jì)值。因此,使用這種界定方式時(shí),不要同一個(gè)變量重復(fù)界定在不同的統(tǒng)計(jì)值關(guān)鍵字之后。4、統(tǒng)計(jì)關(guān)鍵字(變量名稱(chēng)串)=Output的四種方式這種表達(dá)10Output語(yǔ)句中的統(tǒng)計(jì)關(guān)鍵字Output11頻數(shù)語(yǔ)句(freq語(yǔ)句):通過(guò)不同的sas過(guò)程被用來(lái)指定一個(gè)變量,這個(gè)變量的值表示在相應(yīng)的這個(gè)觀測(cè)中其他變量值出現(xiàn)的頻數(shù)。當(dāng)freq語(yǔ)句出現(xiàn)時(shí),過(guò)程處理這個(gè)數(shù)據(jù)集就好像每個(gè)觀測(cè)出現(xiàn)n次一樣,其中n是那個(gè)觀測(cè)中freq變量的值。如果在某個(gè)觀測(cè)中,freq變量的值小于1,這個(gè)觀測(cè)在分析中不使用;如果freq變量的值不是整數(shù),僅取整數(shù)部分使用。Freq語(yǔ)句頻數(shù)語(yǔ)句(freq語(yǔ)句):通過(guò)不同的sas過(guò)程被用來(lái)指定一個(gè)12Freq語(yǔ)句對(duì)40名麻疹易感兒童接種麻疹疫苗一個(gè)月后,測(cè)得其血凝抑制抗體滴度如下,求其平均滴度??贵w滴度1:41:81:161:321:641:1281:2561:512人數(shù)156271045Dataa;Inputfx@@;Cards;14586162327641012842565512;Procmeans;Varx;Freqf;Outputout=bmean(x)=m_x;Run;Freq語(yǔ)句對(duì)40名麻疹易感兒童接種麻疹疫苗一個(gè)月后,測(cè)得其13By與class的區(qū)別Classsexschool;的分組結(jié)果:組別

sexschool1

男和女重點(diǎn)和非重點(diǎn)男重點(diǎn)和非重點(diǎn)女重點(diǎn)和非重點(diǎn)男和女重點(diǎn)男和女非重點(diǎn)男重點(diǎn)男非重點(diǎn)女重點(diǎn)女非重點(diǎn)Bysexschool;的分組結(jié)果:組別

sexschool1

男重點(diǎn)男非重點(diǎn)女重點(diǎn)女非重點(diǎn)設(shè)有兩個(gè)分組變量:sex(分男,女)及school(下分重點(diǎn)和非重點(diǎn))By與class的區(qū)別Classsexschool;的分14By與class的區(qū)別Classsex;Byschool;的分組結(jié)果:組別

sexschool

男和女重點(diǎn)男重點(diǎn)女重點(diǎn)男和女非重點(diǎn)男非重點(diǎn)女非重點(diǎn)By與class的區(qū)別Classsex;15示例Proc

meansdata=class;Classsexage;varheightweight;outputout=class1mean=min=hw;Run;示例Procmeansdata=class;16types:對(duì)_type_進(jìn)行選擇輸出procmeansdata=class;varheight;classsexage;typessex*age;outputout=heightmean=;run;procprintdata=height;run;types:對(duì)_type_進(jìn)行選擇輸出procmeans17兩個(gè)過(guò)程類(lèi)似,都是用來(lái)對(duì)數(shù)值變量計(jì)算單個(gè)變量的基本統(tǒng)計(jì)量。而且這兩個(gè)過(guò)程使用的語(yǔ)句和選項(xiàng)都相同。它們的差別缺省時(shí),summary不打印輸出計(jì)算結(jié)果;means總是打印輸出計(jì)算的統(tǒng)計(jì)量,除非你在procmeans過(guò)程中明確規(guī)定選項(xiàng)noprint。如果使用summary過(guò)程時(shí)希望打印輸出統(tǒng)計(jì)量,必須在procsummary語(yǔ)句中規(guī)定選項(xiàng)print。若省略var語(yǔ)句,summary過(guò)程只給出觀測(cè)個(gè)數(shù)(Nobs);而means過(guò)程對(duì)輸入數(shù)據(jù)集中除用在by,Id,freq,class,weight語(yǔ)句之外的所有數(shù)值變量計(jì)算統(tǒng)計(jì)量means過(guò)程與summary過(guò)程的區(qū)別兩個(gè)過(guò)程類(lèi)似,都是用來(lái)對(duì)數(shù)值變量計(jì)算單個(gè)變量的基本統(tǒng)計(jì)量。而18ProcunivariateVarByFreqWeightIdOutputProbplotqqplotHistogram選項(xiàng)串;變量名稱(chēng)串;變量名稱(chēng)串;變量名稱(chēng);變量名稱(chēng);變量名稱(chēng)串;Out=統(tǒng)計(jì)值輸出文件名稱(chēng)/統(tǒng)計(jì)值關(guān)鍵字符串;<變量串></選項(xiàng)>;<變量串></選項(xiàng)>;<變量串></選項(xiàng)>;PROCUNIVARIATE過(guò)程Procunivariate選項(xiàng)串;PROCUNIVAR19Procunivariate選項(xiàng)串Data=sas數(shù)據(jù)集名NoprintFreq要求生成包括變量值,頻數(shù)、百分?jǐn)?shù)和累計(jì)頻數(shù)的頻數(shù)表Normal要求計(jì)算關(guān)于輸入數(shù)據(jù)服從正態(tài)分布的假的檢驗(yàn)統(tǒng)計(jì)量。Plot要求生成一個(gè)莖葉圖(或水平直方圖),一個(gè)盒形圖和一個(gè)正態(tài)概率圖Mu0=設(shè)定t檢驗(yàn)的樣本均值是否等于‘mu0=’,設(shè)置的值必須和var語(yǔ)句順序?qū)?yīng)Procunivariate選項(xiàng)串Data=sas數(shù)據(jù)集名20

Univariate的輸出(缺省)包括五個(gè)部分第一部分是矩統(tǒng)計(jì)量;第二部分為基本的位置和分散程度統(tǒng)計(jì)量,位置統(tǒng)計(jì)量包括均值、中位數(shù)、眾數(shù),分散程度統(tǒng)計(jì)量包括標(biāo)準(zhǔn)差、方差、極差、四分位間距;第三部分為關(guān)于均值等于零的三種檢驗(yàn)的結(jié)果,包括t檢驗(yàn)、符號(hào)檢驗(yàn)和符號(hào)秩檢驗(yàn);第四部分為各個(gè)重要的分位數(shù);第五部分是觀測(cè)數(shù)據(jù)的五個(gè)最低值和五個(gè)最高值。Univariate的輸出(缺?。┌ㄎ鍌€(gè)部分21

例如:Procunivariatedata=class<noprint><freq><normal><plot><mu0=>;Varheightweight;Classsex;Idname;Run;結(jié)果解釋見(jiàn)課本98頁(yè)例如:22ProbplotProc

univariatedata=class;Varheight;probplot/normal(mu=60.6sigma=5color=redL=2W=3)ctext=bluesquaregridpctlorder=1,5,10,15,20,25,30,35,40,45,50,55,60,65,70,75,80,85,90,95,99;insetmean='m(height)';labelheight='gaodu';title'height';footnote'h';Run;Color定義曲線(xiàn)的顏色;L和W分別定義線(xiàn)型和線(xiàn)的寬度;ctext=定義字體的顏色;Sqare畫(huà)個(gè)方塊把圖像包起來(lái);grid在每個(gè)橫坐標(biāo)上畫(huà)一個(gè)垂線(xiàn);pctlorder=指定橫坐標(biāo)的百分位數(shù),藍(lán)顏色的必須指定;Inset給圖形附加說(shuō)明,label給變量加標(biāo)簽。ProbplotProcunivariatedata=23Position=Height=font=ctext=分別指定插入文字說(shuō)明的位置、高度、字體及顏色Cframe=和cshadow=分別規(guī)定文字說(shuō)明框和陰影的顏色Position可取N,NE,E,SE,S,SW,W,NW常用字體見(jiàn)http://www.sfu.ca/sasdoc/sashtml/gref/z1onts.htm#zt-lists常用顏色:WHITEBLACKREDGREENBLUECYANMAGENTAGRAYPINKORANGEBROWNYELLOWInset語(yǔ)句選項(xiàng)Position=Height=font=ctext=24定量數(shù)據(jù)的統(tǒng)計(jì)描述課件25Qqplotprocunivariatedata=class;qqplotheight/normal(mu=estsigma=estcolor=green)squarectext=blue;insetmean='m(height)';title'height2';footnote'h2';Run;Qqplotprocunivariatedata=cl26Histogram

proc

univariatedata=classnoprint;histogramweight;insetn=‘Numberofobservations’mean=‘meanofweight’/position=ne;title'Meanofweight';footnote'Thisisafootnote';run;Inset中的position=ne;是來(lái)調(diào)整插入文字的位置,ne表示northeast,n表示north,其余類(lèi)似。Histogramprocunivariatedata27Histogramproc

univariatedata=class;histogramheight/normal(mu=estsigma=estcolor=red)midpoints=45

50

55

60

65

70

75

80

85

90ctext=blue;run;Histogramprocunivariatedata=28Output語(yǔ)句的選項(xiàng)串該語(yǔ)句要求創(chuàng)建一個(gè)包含指定統(tǒng)計(jì)量的輸出數(shù)據(jù)集。新數(shù)據(jù)集中的變量個(gè)數(shù)和名字用戶(hù)可以自己規(guī)定。使用該語(yǔ)句時(shí)要求有var語(yǔ)句。在一個(gè)單變量過(guò)程中可以使用多個(gè)output語(yǔ)句,每個(gè)output語(yǔ)句創(chuàng)建一個(gè)輸出數(shù)據(jù)集首先列出統(tǒng)計(jì)量的關(guān)鍵詞,接著是一個(gè)等號(hào),然后是包含統(tǒng)計(jì)量的一個(gè)或多個(gè)變量名。例如

outputout=newmean=ave1ave2var=vOutput語(yǔ)句的選項(xiàng)串該語(yǔ)句要求創(chuàng)建一個(gè)包含指定統(tǒng)計(jì)量的輸29Output語(yǔ)句示例Proc

univariatedata=class;Varheightweight;Outputout=testmean=m_hm_wvar=v_h;Run;

Univariate中的output選項(xiàng)不能用統(tǒng)計(jì)量(變量名)=名字;如上例中不能用

var(height)=v_h不可以用統(tǒng)計(jì)量(變量名)=;如上例不能用

var(height)或var=;Output語(yǔ)句示例Procunivariatedat30Output語(yǔ)句示例Proc

univariatedata=classmu0=62;Varheight;Outputout=t_testt=t_valueprobt=p_value;Run;對(duì)變量height的均值做t檢驗(yàn)(mu0=62

)Output語(yǔ)句示例Procunivariatedat31Output語(yǔ)句示例Proc

univariatedata=class;Varheightweight;Outputpctlpts=33.3

66.7pctlpre=hwpctlname=p33_3p66_6;Run;Pctlpts=百分位數(shù)規(guī)定在過(guò)程中不能自動(dòng)提供而用戶(hù)又希望計(jì)算的百分位數(shù)。比如想計(jì)算33%的分位數(shù),必須由此選項(xiàng)。Pctlpre=前綴名列表該選項(xiàng)規(guī)定pctlpts=要求計(jì)算的百分位數(shù)的輸出變量名的前綴Pctlname=后綴名列表該選項(xiàng)規(guī)定pctlpts=要求計(jì)算的百分位數(shù)的輸出變量名的后綴Output語(yǔ)句示例Procunivariatedat32Means/Summary與Univariate對(duì)比Means/Summary與Univariate對(duì)比33Means過(guò)程Summary過(guò)程Univariate過(guò)程定量數(shù)據(jù)統(tǒng)計(jì)指標(biāo)計(jì)算的三種過(guò)程Means過(guò)程定量數(shù)據(jù)統(tǒng)計(jì)指標(biāo)計(jì)算的三種過(guò)程34Means過(guò)程格式:Procmeans<數(shù)據(jù)集名><noprint><其它選項(xiàng)>;Var變量列表;(規(guī)定需要計(jì)算的數(shù)值變量及順序)Class變量名列表;(分組計(jì)算)Freq變量;(該語(yǔ)句指定一個(gè)數(shù)值型的變量,它的值表示輸入數(shù)據(jù)集中相應(yīng)觀測(cè)出現(xiàn)的頻數(shù)。該變量的值應(yīng)為正整數(shù)。若freq變量值<1或缺失,相應(yīng)的觀測(cè)不參加計(jì)算統(tǒng)計(jì)量;若這個(gè)值不是正整數(shù),取整數(shù)部分。)Weight變量;(該變量的值應(yīng)大于0,若<0或缺失,則假定該值為0.)Id變量名列表;(該語(yǔ)句對(duì)means過(guò)程產(chǎn)生的輸出數(shù)據(jù)集增加一個(gè)或幾個(gè)附加變量,目的在于識(shí)別輸出數(shù)據(jù)集里德觀測(cè))By變量名列表;(分組計(jì)算,注意一定要先排序)Output<out=數(shù)據(jù)集名字><輸出統(tǒng)計(jì)量列表>;Means過(guò)程Means過(guò)程格式:Means過(guò)程35Procmeans中的其它選項(xiàng)包括Maxdec=n;規(guī)定輸出結(jié)果中的小數(shù)部分的最大位數(shù)(0-8)。缺省時(shí)是2。Fw=n;給出該過(guò)程用來(lái)打印每個(gè)統(tǒng)計(jì)量的域?qū)?。缺省?2。Alpha=a;設(shè)置計(jì)算置信區(qū)間的置信水平a。a在0-1之間。假如,若規(guī)定a=0.05,則得到均值的95%的置信區(qū)間Missing要求該過(guò)程把class變量的缺失值作為有效分組值處理Means過(guò)程Procmeans中的其它選項(xiàng)包括Means過(guò)程36Procmeansdata=class;Varheight;Run;在上述用法中,沒(méi)有指定輸出的統(tǒng)計(jì)量,缺省的會(huì)對(duì)每個(gè)選定的變量計(jì)算有效記錄(N)、均值(Mean)、標(biāo)準(zhǔn)差(Std)、最大值(Maximum)和最小值(Minimum)五個(gè)統(tǒng)計(jì)量。Means過(guò)程最簡(jiǎn)單的用法Procmeansdata=class;Means過(guò)程最37可以用means過(guò)程計(jì)算的統(tǒng)計(jì)量分別用關(guān)鍵詞表示:可以用means過(guò)程38Procmeansdata=classmeanvarclmalpha=0.01maxdec=3fw=8;Varheightweight;Outputout=mclassmean=var=vhvwlclm=lcuclm=uc;Run;Means過(guò)程示例

該程序要求輸出的結(jié)果占8個(gè)字符,其中小數(shù)位為3。把運(yùn)行結(jié)果輸出到數(shù)據(jù)集mclass中,包括變量height(height的均值)weight(weight的均值)vh(height的方差)vw(weight的方差)Lc(置信度為99%的置信下限)uc(置信度為99%的置信上限)Procmeansdata=classmeanvar391、統(tǒng)計(jì)關(guān)鍵字=代表統(tǒng)計(jì)值的變量名稱(chēng)串Procmeansdata=class;Varheightweight;Classsex;Outputout=testmean=m_hm_w;Run;Output的四種方式這種界定方式自動(dòng)計(jì)算出var指令所列舉之所有變量的統(tǒng)計(jì)值。因此,等號(hào)右邊所列舉的變量,必須與var指令中所列舉的變量前后對(duì)應(yīng)而且數(shù)目相同。1、統(tǒng)計(jì)關(guān)鍵字=代表統(tǒng)計(jì)值的變量名稱(chēng)串Output的四種方式402、統(tǒng)計(jì)關(guān)鍵字(變量名稱(chēng)串)=代表統(tǒng)計(jì)值的變量名稱(chēng)串Procmeansdata=class;Varheightweight;Classsex;Outputout=testmean=m_hm_wstd(height)=v_h;Run;Output的四種方式這種界定方式將產(chǎn)生var指令所列舉之部分變量的統(tǒng)計(jì)值。例如,上例文件test中包括變量m_h,m_w和v_h。2、統(tǒng)計(jì)關(guān)鍵字(變量名稱(chēng)串)=代表統(tǒng)計(jì)值的變量名稱(chēng)串Outp413、統(tǒng)計(jì)關(guān)鍵字=Procmeansdata=class;Varheightweight;Classsex;Outputout=testmean=;Run;Output的四種方式這種表達(dá)方式在等號(hào)右邊是空白,未界定任何代表統(tǒng)計(jì)值的變量名稱(chēng)。因此,將以原變量的名稱(chēng)來(lái)代表。例如,在上例中,輸出文件test中變量height與weight分別代表相應(yīng)的均值。

須注意,若使用這種界定方式,則一個(gè)var變量,只能產(chǎn)生一種統(tǒng)計(jì)值,而不能同時(shí)產(chǎn)生其他統(tǒng)計(jì)值。這是因?yàn)橐粋€(gè)var變量的名稱(chēng)只能同時(shí)代表一種統(tǒng)計(jì)值。3、統(tǒng)計(jì)關(guān)鍵字=Output的四種方式這種表達(dá)方式在等號(hào)右邊424、統(tǒng)計(jì)關(guān)鍵字(變量名稱(chēng)串)=Procmeansdata=class;Varheightweight;Classsex;Outputout=testmean=m_hm_wmax(height)=;Run;Output的四種方式這種表達(dá)方式在等號(hào)右邊是空白,未界定任何代表統(tǒng)計(jì)值的變量名稱(chēng)。在等號(hào)左邊的括號(hào)內(nèi)列舉部分var指令中所提到的變量。因此,這些變量的統(tǒng)計(jì)值,仍以變量的原名表示。例如,在上例中,輸出文件test中變量m_h和m_w分別代表height與weight的均值,height代表height的最大值。

須注意,一個(gè)在var指令中界定的變量名稱(chēng)只能代表一種統(tǒng)計(jì)值。因此,使用這種界定方式時(shí),不要同一個(gè)變量重復(fù)界定在不同的統(tǒng)計(jì)值關(guān)鍵字之后。4、統(tǒng)計(jì)關(guān)鍵字(變量名稱(chēng)串)=Output的四種方式這種表達(dá)43Output語(yǔ)句中的統(tǒng)計(jì)關(guān)鍵字Output44頻數(shù)語(yǔ)句(freq語(yǔ)句):通過(guò)不同的sas過(guò)程被用來(lái)指定一個(gè)變量,這個(gè)變量的值表示在相應(yīng)的這個(gè)觀測(cè)中其他變量值出現(xiàn)的頻數(shù)。當(dāng)freq語(yǔ)句出現(xiàn)時(shí),過(guò)程處理這個(gè)數(shù)據(jù)集就好像每個(gè)觀測(cè)出現(xiàn)n次一樣,其中n是那個(gè)觀測(cè)中freq變量的值。如果在某個(gè)觀測(cè)中,freq變量的值小于1,這個(gè)觀測(cè)在分析中不使用;如果freq變量的值不是整數(shù),僅取整數(shù)部分使用。Freq語(yǔ)句頻數(shù)語(yǔ)句(freq語(yǔ)句):通過(guò)不同的sas過(guò)程被用來(lái)指定一個(gè)45Freq語(yǔ)句對(duì)40名麻疹易感兒童接種麻疹疫苗一個(gè)月后,測(cè)得其血凝抑制抗體滴度如下,求其平均滴度??贵w滴度1:41:81:161:321:641:1281:2561:512人數(shù)156271045Dataa;Inputfx@@;Cards;14586162327641012842565512;Procmeans;Varx;Freqf;Outputout=bmean(x)=m_x;Run;Freq語(yǔ)句對(duì)40名麻疹易感兒童接種麻疹疫苗一個(gè)月后,測(cè)得其46By與class的區(qū)別Classsexschool;的分組結(jié)果:組別

sexschool1

男和女重點(diǎn)和非重點(diǎn)男重點(diǎn)和非重點(diǎn)女重點(diǎn)和非重點(diǎn)男和女重點(diǎn)男和女非重點(diǎn)男重點(diǎn)男非重點(diǎn)女重點(diǎn)女非重點(diǎn)Bysexschool;的分組結(jié)果:組別

sexschool1

男重點(diǎn)男非重點(diǎn)女重點(diǎn)女非重點(diǎn)設(shè)有兩個(gè)分組變量:sex(分男,女)及school(下分重點(diǎn)和非重點(diǎn))By與class的區(qū)別Classsexschool;的分47By與class的區(qū)別Classsex;Byschool;的分組結(jié)果:組別

sexschool

男和女重點(diǎn)男重點(diǎn)女重點(diǎn)男和女非重點(diǎn)男非重點(diǎn)女非重點(diǎn)By與class的區(qū)別Classsex;48示例Proc

meansdata=class;Classsexage;varheightweight;outputout=class1mean=min=hw;Run;示例Procmeansdata=class;49types:對(duì)_type_進(jìn)行選擇輸出procmeansdata=class;varheight;classsexage;typessex*age;outputout=heightmean=;run;procprintdata=height;run;types:對(duì)_type_進(jìn)行選擇輸出procmeans50兩個(gè)過(guò)程類(lèi)似,都是用來(lái)對(duì)數(shù)值變量計(jì)算單個(gè)變量的基本統(tǒng)計(jì)量。而且這兩個(gè)過(guò)程使用的語(yǔ)句和選項(xiàng)都相同。它們的差別缺省時(shí),summary不打印輸出計(jì)算結(jié)果;means總是打印輸出計(jì)算的統(tǒng)計(jì)量,除非你在procmeans過(guò)程中明確規(guī)定選項(xiàng)noprint。如果使用summary過(guò)程時(shí)希望打印輸出統(tǒng)計(jì)量,必須在procsummary語(yǔ)句中規(guī)定選項(xiàng)print。若省略var語(yǔ)句,summary過(guò)程只給出觀測(cè)個(gè)數(shù)(Nobs);而means過(guò)程對(duì)輸入數(shù)據(jù)集中除用在by,Id,freq,class,weight語(yǔ)句之外的所有數(shù)值變量計(jì)算統(tǒng)計(jì)量means過(guò)程與summary過(guò)程的區(qū)別兩個(gè)過(guò)程類(lèi)似,都是用來(lái)對(duì)數(shù)值變量計(jì)算單個(gè)變量的基本統(tǒng)計(jì)量。而51ProcunivariateVarByFreqWeightIdOutputProbplotqqplotHistogram選項(xiàng)串;變量名稱(chēng)串;變量名稱(chēng)串;變量名稱(chēng);變量名稱(chēng);變量名稱(chēng)串;Out=統(tǒng)計(jì)值輸出文件名稱(chēng)/統(tǒng)計(jì)值關(guān)鍵字符串;<變量串></選項(xiàng)>;<變量串></選項(xiàng)>;<變量串></選項(xiàng)>;PROCUNIVARIATE過(guò)程Procunivariate選項(xiàng)串;PROCUNIVAR52Procunivariate選項(xiàng)串Data=sas數(shù)據(jù)集名NoprintFreq要求生成包括變量值,頻數(shù)、百分?jǐn)?shù)和累計(jì)頻數(shù)的頻數(shù)表Normal要求計(jì)算關(guān)于輸入數(shù)據(jù)服從正態(tài)分布的假的檢驗(yàn)統(tǒng)計(jì)量。Plot要求生成一個(gè)莖葉圖(或水平直方圖),一個(gè)盒形圖和一個(gè)正態(tài)概率圖Mu0=設(shè)定t檢驗(yàn)的樣本均值是否等于‘mu0=’,設(shè)置的值必須和var語(yǔ)句順序?qū)?yīng)Procunivariate選項(xiàng)串Data=sas數(shù)據(jù)集名53

Univariate的輸出(缺省)包括五個(gè)部分第一部分是矩統(tǒng)計(jì)量;第二部分為基本的位置和分散程度統(tǒng)計(jì)量,位置統(tǒng)計(jì)量包括均值、中位數(shù)、眾數(shù),分散程度統(tǒng)計(jì)量包括標(biāo)準(zhǔn)差、方差、極差、四分位間距;第三部分為關(guān)于均值等于零的三種檢驗(yàn)的結(jié)果,包括t檢驗(yàn)、符號(hào)檢驗(yàn)和符號(hào)秩檢驗(yàn);第四部分為各個(gè)重要的分位數(shù);第五部分是觀測(cè)數(shù)據(jù)的五個(gè)最低值和五個(gè)最高值。Univariate的輸出(缺?。┌ㄎ鍌€(gè)部分54

例如:Procunivariatedata=class<noprint><freq><normal><plot><mu0=>;Varheightweight;Classsex;Idname;Run;結(jié)果解釋見(jiàn)課本98頁(yè)例如:55ProbplotProc

univariatedata=class;Varheight;probplot/normal(mu=60.6sigma=5color=redL=2W=3)ctext=bluesquaregridpctlorder=1,5,10,15,20,25,30,35,40,45,50,55,60,65,70,75,80,85,90,95,99;insetmean='m(height)';labelheight='gaodu';title'height';footnote'h';Run;Color定義曲線(xiàn)的顏色;L和W分別定義線(xiàn)型和線(xiàn)的寬度;ctext=定義字體的顏色;Sqare畫(huà)個(gè)方塊把圖像包起來(lái);grid在每個(gè)橫坐標(biāo)上畫(huà)一個(gè)垂線(xiàn);pctlorder=指定橫坐標(biāo)的百分位數(shù),藍(lán)顏色的必須指定;Inset給圖形附加說(shuō)明,label給變量加標(biāo)簽。ProbplotProcunivariatedata=56Position=Height=font=ctext=分別指定插入文字說(shuō)明的位置、高度、字體及顏色Cframe=和cshadow=分別規(guī)定文字說(shuō)明框和陰影的顏色Position可取N,NE,E,SE,S,SW,W,NW常用字體見(jiàn)http://www.sfu.ca/sasdoc/sashtml/gref/z1onts.htm#zt-lists常用顏色:WHITEBLACKREDGREENBLUECYANMAGENTAGRAYPINKORANGEBROWNYELLOWInset語(yǔ)句選項(xiàng)Position=Height=font=ctext=57定量數(shù)據(jù)的統(tǒng)計(jì)描述課件58Qqplotprocunivariatedata=class;qqplotheight/normal(mu=estsigma=estcolor=green)squarectext=blue;insetmean='m(height)';title'height2';footnote'h2

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論