版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
Stata統(tǒng)計分析命令Preparedon24November2020Stata統(tǒng)計分析常用命令匯總一、winsorize極端值處理范圍:一般在1%和99%分位做極端值處理,對于小于1%的數用1%的值賦值,對于大于99%的數用99%的值賦值。1、Stata中的單變量極端值處理:stata,在命令窗口輸入“finditwin后r”系統(tǒng)彈出一個窗口,安裝winsor模塊安裝好模塊之后,就可以調用winsor命令,命令格式:winsorvar1,gen(newvar)p或者在命令窗口中輸入:sscinstallwinsor安裝winsor命令。winsor命令不能進行批量處理。2、批量進行winsorize極端值處理:打開鏈接:,找到winsorizeJ,點擊右鍵,另存為到stata中的ado/plus/目錄下即可。命令格式:winsorizeJvar1var2var3,suffix(w)即可,這樣會生成三個新變量,var1wvar2wvar3w,而且默認的是上下1%winsorize。如果要修改分位點,則寫成如下格式:winsorizeJvar1var2var3,suffix(w)cuts(595)3、Excel中的極端值處理:(略)winsor2命令使用說明簡介:winsor2winsorizeortrim(iftrimoptionisspecified)thevariablesinvarlistatparticularpercentilesspecifiedbyoptioncuts(##).Indefult,newvariableswillbegeneratedwithasuffix"_w"or"_tr",whichcanbechangedbyspecifyingsuffix()option.Thereplaceoptionreplacesthevariableswiththeirwinsorizedortrimmedones.相比于winsor命令的改進:(1)可以批量處理多個變量;(2)不僅可以winsor,也可以trimming;⑶附加了by()選項,可以分組winsor或trimming;(4)增加了replace選項,可以不必生成新變量,直接替換原變量。范例:*-winsorat(plp99),getnewvariable"wage_w".sysusenlsw88,clear.winsor2wage*-left-trimmingat2thpercentile.winsor2wage,cuts(2100)trim*-winsorvariablesby(industrysouth),overwritetheoldvariables.winsor2wagehours,replaceby(industrysouth)使用方法:請將和放置于stata12\ado\base\w文件夾下;輸入helpwinsor2可以查看幫助文件;二、描述性統(tǒng)計1、summarize命令格式:su、sum或者summarize[varlist][if][in][weight][,options]如果summarize或sum后不加任何變量,則默認對數據中的所有變量進行描述統(tǒng)計options選項:detail表示產生更加詳細的統(tǒng)計變量Separator(n)表示每n個變量畫一條分界線,n=0表示禁止使用分界線Summarize描述統(tǒng)計輸出表中包含:樣本容量、平均數、標準差、最小值和最大值2、tabstat命令格式:tabstat[varlist][if][in][weight][,options]options選項:stat(statname)表示設定所需要的統(tǒng)計量col(stat)或c(s)表示將結果報表轉置統(tǒng)計量:mean:平均數count/n:觀測值數目sum:加總max/min:最大值/最小值range:極差sd:標準差cv:變異系數semean:平均標準誤差skewness:偏度var:方差kurtosis:峰度median/p50:中位數p#:#%百分位數例如:tabstat[varlist],stat(countmeansdmedianminmaxrange)col(stat)3、描述性統(tǒng)計結果輸出到word或Excel用sum做的描述性統(tǒng)計:logout,save(miaoshutongji)wordreplace:sum用tabstat做的描述性統(tǒng)計:logout,save(miaoshutongji)wordreplace:tabstat[varlist],stat(countmeansdmedianminmaxrange)col(stat)分組描述:bysortvar:三、相關性分析(一)相關性分析1、Pearson相關系數命令格式:correlate(簡寫:cor或corr)[varlist][if][in][weight][,options]2、spearman相關系數命令格式:spearman[varlist],stats(rhop)3、在Stata中,命令corr用于計算一組變量間的協(xié)方差或相關系數矩陣;4、命令pwcorr可用于計算一組變量中兩兩變量的相關系數,同時還可以對相關系數的顯著性進行檢驗;option選項中加上sig可顯示顯著性水平:pwcorr[varlist],sig5、命令pcorr用于計算一組變量中兩兩變量的偏相關系數并進行顯著性檢驗。6、Spearman和Pearson檢驗同在一個表的命令:corrtbl[varlist],corrvars([varlist])輸出結果中,上三角為Spearman相關系數和顯著水平,下三角為Pearson系數和顯著水平。(二)輸出相關系數表到word或Excel中例如:logout,save(mytable)wordreplace:pwcorr_apricempgrep78headroomtrunk,startstar5star10、截面數據單方程線性回歸模型的Stata實現命令格式:regress(簡寫:reg)depvarindepvars[if][in][weigh][option](depvar表示因變量,indepvars表示自變量)五、異方差的檢驗與處理1、檢驗異方差命令格式:hettest2、判斷異方差的標準:看P值的大小來判斷,如果P值小于,則不能排除異方差的可能,上圖中P值等于>,因此,可以排除異方差的可能性。3、處理異方差命令格式:在reg命令后加上“,r”或者“,robust”即可。經異方差處理后的回歸不顯示調整后的R2(adj-R2),如果要查看調整后的R2,再輸入命令:die(r2_a)六、多重共線性(自變量之間高度相關)命令格式:vif(一)判斷多重共線性的標準(兩個標準必須同時滿足):1、最大的vif大于10;2、平均的vif大于1。(二)多重共線性的修正1、采用逐步回歸進行修正,命令格式:swregdepvarindepvar,pr2、對于含二次項的,使用“對中”的方法,既可以保留二次項,又可以在一定程度上克服多重共線性的問題:先定義兩個變量,分別為該變量減去其均值和該變量的平方,命令如下:sumvargenvar1=var-r(mean)genvar2=varA2再用新變量代替原來的變量進行回歸處理七、內生性的檢驗與處理(內生性是指自變量與誤差項之間有關系)1、內生性的檢驗:ovtest看P值的大小來判斷,如果P值小于,則不能排除內生性的可能,上圖中P值等于>,因此,可以排除內生性的可能。2、內生性的處理:使用工具變量法:ivreg內生性的三個來源:測量誤差、遺漏變量和雙向因果。1、變量的內生性。這個是沒有辦法單獨檢驗的。當有合適工具變量時候,是可以檢驗的,就是hausman檢驗2、工具變量的外生性。這個也是沒辦法檢驗的。當有很多工具變量時候,可以檢驗是否有不是外生的,就是“過度識別”問題3、工具變量的相關性。這個可以說成是“弱工具變量”問題,檢驗可以通過一階段的F值。還可以利用PartialR2。4、估計方法stata里面有這么幾個2sls,2slssmal、liml、gmm,各自適用情況:small適合小樣本;liml適合弱工具變量;gmm適合異方差?!纠印縲ebusehsng2*Fitaregressionvia2SLS,requestingsmall-samplestatisticsivregress2slsrentpcturban(hsngval=faminciregion),small*FitaregressionusingtheLIMLestimatorivregresslimlrentpcturban(hsngval=faminciregion)*FitaregressionviaGMMusingthedefaultheteroskedasticity-robustweightmatrixivregressgmmrentpcturban(hsngval=faminciregion)*FitaregressionviaGMMusingaheteroskedasticity-robustweightmatrix,requestingnonrobuststandarderrorsivregressgmmrentpcturban(hsngval=faminciregion),vce(unadjusted)*檢驗estatafirststage,allforcenonrobust\\\可以查看第一階段F值,已經partialR2estatoverid\\\查看是否過度識別estatendogenous\\\查看是否異方差regress2slsrentpcturbanhsngvaleststorem1ivregress2slsrentpcturban(hsngval=faminciregion)eststorem2hausmanm1m2\\\內生檢驗八、線性方程組的回歸分析命令格式:sureg(depvar1varlist1)(depvar2varlist2)...(depvarNvarlistN)[if][in][weigh]九、聯(lián)立方程組命令格式:reg3(depvar1varlist1)(depvar2varlist2).(depvarNvarlistN)[if][in][weigh]十、面板數據的固定效應和隨機效應Xtset固定效應命令格式:xtregdepvarindepvars[if][in],fe[FE_options]隨機效應命令格式:xtregdepvarindepvars[if][in],re[FE_options]hausman檢驗固定效應還是隨機效應【例子】xtregyvarlvar2var3,feeststorefextregyvarlvar2var3,reeststorerehausmanfere,sigmamorehausmanfere,sigmaless*sigmamore利用有效估計量方差,即re*sigmaless利用一致估計量方差,即fe十一:Stata回歸結果的導出1、在命令窗口中輸入:sscinstallesttab,安裝命令esttab2、reg回歸3、esttabusing將以word形式輸出回歸結果,后綴改成.xls或者.CSV則以Excel格式輸出,輸出內容為變量名稱和相應的回歸系數,t值,顯著性水平標識。系統(tǒng)默認顯著性水平是,和,若要改成,和,則輸出esttabmlm2using,star(*O4、批量輸出回歸結果:每運行一個regression,存起來:eststoreml。ml是你要改的,第一個model所以我叫ml,第二個的話指令就變成eststorem2,依次類推,最后運行指令:esttabmlm2...using。esttabmlllllusing,star(******b(%6.4f)5、outreg2可以將回歸結果導入word、excle、latex等,而且可以根據自己需要改變格式:sscinstalloutreg2useauto,clear[varlist]eststoremloutreg2[ml]using,replace十二、合并樣本(將關鍵詞相同的多個樣本合并為一個)命令格式:duplicatesdropvarlist,force例如將同一企業(yè)在同一天發(fā)生的多起并購合為一起,可根據證券代碼和公告日期關鍵詞,將其合并,命令:duplicatesdropcompany_idevent_date,force十三、均值t檢驗命令格式:ttestCAR1==CAR2,unpaired十四、中位數Z檢驗(非參數Wilcoxon秩和檢驗)命令格式:ranksumvar,by(groupvar)groupvar為分組變量十五、檢驗兩組均值的顯著性差異,在t檢驗的后面數值上面加星號可以用ttest命令執(zhí)行檢驗,它會直接報告星號。亦可采用外部命令meantab執(zhí)行檢驗,自己根據t值大小標注星號。helpmeantab李春濤cond(x>2,50,70))returns.ifxismissing,returns50ifx>2,andreturns70ifx<2十七、中心化處理與標準化處理1、安裝命令:finditcenter2、中心'化:centervarlist(注:生成的新變量默認加前置”c_”,可一次對多個變量進行處理)或:centervar,g(newvar)(注:只能對一個變量進行中心化,并生成給定名稱的新變量)3、標準化:centervarlist,prefix(z_)standardize(注:生成的新變量加前置”z_",可多個,可更改)十八、恢復數據命令preserve(處理數據前使用該命令,否則沒有數據可恢復)dropvar1-var100(處理數據)restore(恢復數據)十九、genicv產生交叉項【問題】有時候,想生成很多交叉項,但是又不愿意一個一個寫。有時候,想看一個交叉項,但是又不愿意生成?!痉椒ā縢enicv可以一鍵生成很多交叉項##可以直接表示交叉項?!纠印縮scinstallgenicvsysuseauto,cleargenicvlengthweightforeign41DFHYitKitLH122612246232302732764IS.532062354178262503431794011201007705868023159ITS.562695304184055371574767060190Bl129357914520789191242417101277375222iO11279061413479798S&.51248629260i23.51376127622567亂9.514125195133566911010"12.0fC=3,C2=6returnsx(not".")ifxismissing,meaningthatceil(.a)=.a(x),returnstheuniqueintegernsuchthatn<=x<n+1,returnsx(not".”)ifxismissing,meaningthatfloor(.a)=.a(x),returnstheintegerobtainedbytruncatingxtoward0;thus,int=5,int=-5,returnsx(not".”)ifxismissing,meaningthatint(.a)=.a。Onewaytoobtaintheclosestintegertoxisint(x+sign(x)/2),whichsimplifiestoint(x+forx0.However,useoftheround()functionispreferred任何兩種軟件之間的數據轉換,有一種方法是人擋殺人,佛擋殺佛。那就是:先在A軟件里面將其另存為文本格式,然后在B軟件里面里面以文本文件導入,再保存為B軟件的文件格式。文本格式,我一般習慣將其存為.csv格式,即變量數據間以逗號分隔,也可以以制表符分隔或、空格分隔或是固定列寬。伍德里奇《橫截面與面板數據的經濟計量分析》下面簡要地分享一下安裝步驟或過程(這里演示的是WIN7_32):二、選擇并點擊next,再選擇并點擊“l(fā)acceptthelicenseagreement",再選擇并點擊“anyonewhousesthiscomputer"或“onlyforme”,然后,就進入到以下界面,給你4個選擇:32-bitMP,32-bitSE,32-bitIC,32-bitSmall。這里,注
意,請選擇32-bitSE(這里演示的是WIN7_32,若你的系統(tǒng)是64位的,則選擇64-bitSE)。說明一下,STATA的最高級的版本是MP。SE的版本級別僅次于MP。MP與SE的唯一區(qū)別在于,前者designedforparallelprocessing,而后者沒有。言下之意,前者可以通過同時運行多處理器或內核來加快運算速度,兩者在功能上完全沒有區(qū)別,只是在大數據處理時,MP要占優(yōu)。因此,我們通常的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 《實驗室消毒滅菌》課件
- 《病媒生物控制》課件
- 單位管理制度合并選集人事管理篇
- 《倉庫管理的認識》課件
- 單位管理制度分享合集【人事管理篇】十篇
- 單位管理制度范例匯編【人事管理】十篇
- 做情緒的主人 高一上學期心理健康教育課
- 2024年農業(yè)年終工作總結
- 2024年協(xié)輔警個人總結
- 《山東膠州秧歌》課件
- 倉庫安全培訓考試題及答案
- (正式版)SH∕T 3548-2024 石油化工涂料防腐蝕工程施工及驗收規(guī)范
- (高清版)JTG 3370.1-2018 公路隧道設計規(guī)范 第一冊 土建工程
- 2024年中國雄安集團招聘筆試參考題庫含答案解析
- 軟件開發(fā)含演示評分細則100分
- 工程竣工保修期滿移交書
- 急診科烏頭堿中毒課件
- 2013天津中考滿分作文
- 高等數學同濟大學第7版 課后習題答案解析完整版
- 單模光纜檢驗報告
- 公共政策分析簡答題
評論
0/150
提交評論