版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
SAS基礎(chǔ)與金融計(jì)算1本節(jié)講授內(nèi)容SAS圖表過程Procchart過程Procgchart過程2統(tǒng)計(jì)圖對統(tǒng)計(jì)資料圖形化處理就形成統(tǒng)計(jì)圖,運(yùn)用統(tǒng)計(jì)圖形能直觀地描述統(tǒng)計(jì)分布的特征和變量之間的關(guān)系。統(tǒng)計(jì)圖有多種表現(xiàn)形式:1、直方圖2、餅圖3、折線圖4、曲線圖3回顧Procunivariatedata=studentplot;varheight;Run;獲得三個(gè)圖:1、莖葉圖2、箱線圖3、正態(tài)概率圖4統(tǒng)計(jì)分組的相關(guān)概念根據(jù)統(tǒng)計(jì)研究的目的和客觀現(xiàn)象的內(nèi)在特點(diǎn),按某個(gè)標(biāo)志或幾個(gè)標(biāo)志把被研究的總體劃分為若干個(gè)不同性質(zhì)的組,稱為統(tǒng)計(jì)分組。分組的性質(zhì)來看:兼有分和合雙重含義。5統(tǒng)計(jì)分組的步驟1.確定數(shù)據(jù)的全距(R):R=xmax-xmin(即最大變量值與最小變量值之差)2.確定組限、組距和組數(shù)(1)組限分為上限和下限,上限是各組的最大變量值,下限是各組的最小變量值。(2)各組上限與下限之差稱為該組的組距。(3)組數(shù)是指某個(gè)變量數(shù)列劃分為多少個(gè)組。說明:組數(shù)的多少與組距的大小成反比關(guān)系,組距越大,則可分的組就越少。6分組,應(yīng)注意如下兩個(gè)問題:首先,分組時(shí)各組數(shù)量界限的確定必須能反映事物質(zhì)的差別——體現(xiàn)量變到質(zhì)變的轉(zhuǎn)化。其次,應(yīng)根據(jù)被研究的現(xiàn)象總體的數(shù)量特征,采用適當(dāng)?shù)姆纸M形式,確定相宜的組距、組限——主要解決分多少組的問題。7組數(shù)的確定:與組距大小成反比以下是美國學(xué)者斯特杰斯經(jīng)驗(yàn)公式:
n=1+3.322lgN
(n:組數(shù);N:總體單位數(shù))
d=R/n=(Xmax-Xmin)/n(n為組數(shù),d為組距,R為全距)8根據(jù)上述公式,可以得出如下的組數(shù)參考標(biāo)準(zhǔn):分組組數(shù)參考表N15-2425-4445-8990-179180-359n56789上述數(shù)據(jù)僅供參考,不能生搬硬套,實(shí)際分組時(shí)要依所研究資料的性質(zhì)而定。9SAS制圖過程SAS統(tǒng)計(jì)制圖過程均可以實(shí)現(xiàn)對樣本分布特征的圖形表示,一般情況下可以使用的有chart過程、plot過程、gchart過程和gplot過程。前兩個(gè)和后兩個(gè)只有一個(gè)字母“g”(代表graph)的差別,其實(shí)它們之間(只差一個(gè)字母g的過程之間)的統(tǒng)計(jì)描述功能是相同的,區(qū)別僅在于繪制出的圖形的復(fù)雜和美觀程度。10此外,還有一些較為復(fù)雜的制圖命令,如運(yùn)用G3D過程繪制曲面圖,運(yùn)用GCONTOUR過程繪制曲面對應(yīng)的等高線圖。例如,我們想繪制一個(gè)二維正態(tài)分布曲面的圖形,假設(shè)(X,Y)服從聯(lián)合正態(tài)分布,其均值都是0,方差分別為1和a,相關(guān)系數(shù)為r。11chart(或plot)與gchart(或gplot)chart過程和plot過程繪制的圖形類似于我們用文本字符堆積起來的圖形,只能概括地反映出資料分布的大體形狀,實(shí)際上這兩個(gè)過程繪制的圖形并不能稱之為圖形,因?yàn)樗鼪]有涉及一般意義上圖形的任何一種元素(如顏色、分辨率等)。而gchart過程和gplot過程給出的是真正意義上的圖形,可以用很多的語句和選項(xiàng)來控制圖形的各方面的性質(zhì)和特征。
12Chart(或gchart)與plot(或gplot)
chart和gchart過程可以繪制出的圖形主要有條形圖(包括橫條和豎條)、圓圖、環(huán)形圖和星形圖等;plot和gplot過程通常用一個(gè)記錄中的兩個(gè)變量值表示點(diǎn)的坐標(biāo)來繪制圖形,如散點(diǎn)圖和線圖等。13gchart過程的一般格式
Procgchart選項(xiàng)列表;圖形關(guān)鍵詞變量名稱/選項(xiàng)列表;
Run;此過程格式簡單,復(fù)雜的地方在于圖形關(guān)鍵字(每個(gè)圖形關(guān)鍵字對應(yīng)一種圖形類型)所引導(dǎo)的語句,它是控制圖形類型及圖形要素的地方,涉及到眾多的關(guān)鍵字和選項(xiàng)。14gchart過程可以使用的圖形關(guān)鍵字及其所繪制的圖形類型見下表:
15圖形關(guān)鍵字后的變量名用以指定進(jìn)行圖形描述時(shí)的分組變量,可以是數(shù)值型的(此時(shí)以各組的組中值為分組的標(biāo)志),也可以是字符型的。選項(xiàng)列表中比較重要的有:(1)type=統(tǒng)計(jì)量關(guān)鍵字,表示圖形對變量(sumvar所指定的變量)的哪一種統(tǒng)計(jì)量進(jìn)行描述,比如頻數(shù)(freq)、均數(shù)(mean)、總計(jì)(sum)、頻數(shù)百分比(percentage)等;16(2)subgroup=變量名(分組變量),指定要進(jìn)行分組(各組內(nèi)再分組)的變量;(3)sumvar=變量名(數(shù)值變量),指定要進(jìn)行統(tǒng)計(jì)計(jì)算的變量,也就是“type=統(tǒng)計(jì)量關(guān)鍵字”選項(xiàng)中統(tǒng)計(jì)量的計(jì)算所依據(jù)的變量。17下表為長沙市某大學(xué)160名正常成年女子2006年體檢資料中的血清甘油三酯的測量結(jié)果(mmol/L)試以直方圖來表示上述資料的分布特征。
18例1:單變量數(shù)據(jù)第一步:建立數(shù)據(jù)集;datatest;inputx@@;cards;0.910.88 1.41 0.96 1.48 1.46 0.91 1.101.261.69 1.14 1.24 0.98 0.68 0.83 1.77……………1.491.02 1.17 0.99 0.61 1.33 0.79 0.951.051.65 1.20 1.24 0.84 1.40 0.72 1.06;Run;雙尾符,它表示為了執(zhí)行下一個(gè)input語句,保持指針在這個(gè)輸入的記錄行上。比較有加雙尾符和沒加雙尾符的區(qū)別。19第二步,進(jìn)行初步的統(tǒng)計(jì)分析,確定分組的個(gè)數(shù)。Procunivariatedata=test;varx;Run;20所有160個(gè)觀測值中,最大的為1.77,最小的為0.51,如果以0.1為組距,將所有觀測值歸入13個(gè)組。如果根據(jù)前面的斯特杰斯經(jīng)驗(yàn)公式,則應(yīng)將所有觀測值歸入8組。
TheMEANSProcedureAnalysisVariable:xNMeanStdDevMinimumMaximum1601.13120.29450.51001.770021第三步,畫圖。procgchartdata=test;
vbarx/type=freqlevels=13inside=freqspace=0width=6;run;Vbar語句表示我們要做的是豎立的條形圖,其后跟的是作圖所要依據(jù)的分類變量,這里我們以變量x來做直方圖。斜杠后的內(nèi)容是對所做條形圖進(jìn)行控制的選項(xiàng),本段程序所涉及的各選項(xiàng)的含義和功能見下表。22各選項(xiàng)的含義和功能
23Procgchartdata=test;
vbarx/type=freqlevels=13sumvar=x
inside=freqspace=0width=6;Run;24Procgchartdata=test;
vbarx/type=freqlevels=8
sumvar=x
inside=freqspace=0width=6;Run;25Procgchartdata=test;
vbarx/type=freqlevels=13sumvar=xinside=mean
space=0width=6;Run;26Procgchartdata=test;
vbarx/type=freqlevels=13sumvar=xinside=mean
space=5
width=6;Run;27Procgchartdata=test;
vbarx/type=freqlevels=13sumvar=xinside=mean
space=0width=9;Run;28比較Procgchart與Procchart;比較vbar和hbar;Vbar用來列出用戶想要畫的垂直條形圖的那些變量,每個(gè)圖表變量對應(yīng)一張垂直條形圖;Hbar對列出的每個(gè)圖變量生成水平的條形圖。比較直方圖與餅圖。29Procgchartdata=test;
hbarx/type=freqlevels=13;Run;30Procgchartdata=test;
piex/type=freqlevels=13;Run;31Procgchartdata=test;
piex/type=meansumvar=x
levels=13;Run;32Procgchartdata=test;
piex/type=meansumvar=x
levels=5;Run;33例2:
分組數(shù)據(jù)下表是財(cái)政系問卷設(shè)計(jì)資料匯總34第一步,建立數(shù)據(jù)集;Datascore;inputsubject$sex$num1num2;Cards;………
;
Run;Datascore;setscore;
labelsubject='專業(yè)'sex='性別'num1='人數(shù)'num2='題量';Run;35Group語句Proc
gchart;
vbarsubject/group=sexsumvar=num2type=mean;run;Num2表示題量。上述語句意思是:先按性別分兩組,接著在每組中按專業(yè)進(jìn)一步分三組,最后再將每組設(shè)計(jì)的題量的平均數(shù)列示出來。36Proc
gchart;
vbarsubject/group=sextype=freq;run;Num2表示題量。上述語句意思是:先按性別分組,接著在每組中按專業(yè)進(jìn)一步分組,最后再將每組包含的單位數(shù)列示出來。37Proc
gchart;
vbarsex/group=subjectsumvar=num2type=mean;run;Num2表示題量。上述語句意思是:先按專業(yè)分三組,接著在每組中按性別分別分兩組,最后再將每組設(shè)計(jì)的題量的平均數(shù)列示出來。38By語句Proc
gchart;
vbarsubject/sumvar=num2type=mean;
bysex;run;上述語句將得到由by變量定義的幾個(gè)觀測組分別畫出的圖表。39Subgroup語句Proc
gchart;
vbarsex/subgroup=subjecttype=freq;run;上述語句意思是:先按性別分兩組,接著在每組中按專業(yè)進(jìn)一步分三組,最后再將每組包含的單位數(shù)列示出來。40Proc
gchart;
vbarsubject/subgroup=sextype=freq;run;上述語句意思是:先按專業(yè)分三組,接著在每組中按專業(yè)進(jìn)一步分兩組,最后再將每組包含的單位數(shù)列示出來。41Block語句該語名列出用戶想要畫的塊形圖的變量。Proc
gchart;
blocksex/gr
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度智能倉儲物流系統(tǒng)采購合同3篇
- 2024英語角活動(dòng)贊助商借條編制說明6篇
- 2025年度戶外用品攤位租賃與戶外運(yùn)動(dòng)合作協(xié)議3篇
- 2024年銷售團(tuán)隊(duì)業(yè)績承諾及客戶滿意度保障協(xié)議3篇
- 2025年度碼頭集裝箱堆場租賃合同范本3篇
- 一次函數(shù)與二元一次方程組教學(xué)設(shè)計(jì)
- 年產(chǎn)100萬只塑料托盤建設(shè)項(xiàng)目可行性研究報(bào)告
- 2023屆高三生物一輪復(fù)習(xí)易錯(cuò)點(diǎn)講義基因自由組合定律的特殊分離比分析-
- 醫(yī)院保潔員工作崗位職責(zé)與工作(3篇)
- 2024物業(yè)經(jīng)營托管合同模板
- 球罐腳手架施工方案
- 關(guān)于化工企業(yè)崗位人才及職業(yè)能力需求的調(diào)研
- 工作計(jì)劃進(jìn)度表模板
- 份公司年安全環(huán)保工作任務(wù)清單
- 美國特種設(shè)備安全管理綜述
- 最新教科版五年級英語下冊(廣州版)全冊完整課件
- 醫(yī)用耗材評估管理制度
- 【小米公司財(cái)務(wù)共享服務(wù)中心的構(gòu)建與運(yùn)行探究8200字(論文)】
- 成人癌性疼痛護(hù)理-中華護(hù)理學(xué)會團(tuán)體標(biāo)準(zhǔn)2019
- 勞動(dòng)保障監(jiān)察條例
- 國家免疫規(guī)劃疫苗兒童免疫程序說明-培訓(xùn)課件
評論
0/150
提交評論