下載本文檔
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、調(diào)整變量格式:format x1 % 將 x1的列寬固定為10,小數(shù)點(diǎn)后取三位format x1 % 將 x1的列寬固定為10,有效數(shù)字取三位format x1 % 將 x1的列寬固定為10,采用科學(xué)計(jì)數(shù)法format x1 % 將 x1的列寬固定為10,小數(shù)點(diǎn)后取三位,加入千分位分隔符format x1 % 將 x1的列寬固定為10,有效數(shù)字取三位,加入千分位分隔符format x1 % 將 x1的列寬固定為10,有效數(shù)字取三位,加入千分位分隔符,加入“-”表示左對(duì)齊合并數(shù)據(jù):桌面 , clear桌面 將 1999 和 2006 的數(shù)據(jù)按照樣本( observation )排列的自然順序合并
2、起來(lái)桌面 , clear桌面 ,unique sort 將 1999 和 2006建議采用第一種方法。對(duì)樣本進(jìn)行隨機(jī)篩選:的數(shù)據(jù)按照唯一的(unique)變量id 來(lái)合并,在合并時(shí)對(duì)id 進(jìn)行排序(sort )sample 50在觀測(cè)案例中隨機(jī)選取50% 的樣本,其余刪除sample 50,count在觀測(cè)案例中隨機(jī)選取50 個(gè)樣本,其余刪除查看與編輯數(shù)據(jù):browse x1 x2 if x33(按所列變量與條件打開(kāi)數(shù)據(jù)查看器)edit x1 x2 if x33(按所列變量與條件打開(kāi)數(shù)據(jù)編輯器)數(shù)據(jù)合并(merge)與擴(kuò)展(append )merge表示樣本量不變,但增加了一些新變量;appe
3、nd表示樣本總量增加了,但變量數(shù)目不變。one-to-one merge:數(shù)據(jù)源自 stata tutorial第一步:將exampw1中的 exampw1按 v001 v003和 exampw2這三個(gè)編碼排序,并建立臨時(shí)數(shù)據(jù)庫(kù)tempw1clearuse t:statatutsu summarize的簡(jiǎn)寫sort v001 v002 v003save tempw1第二步:對(duì)exampw2做同樣的處理clearuse t:statatutsusort v001 v002 v003save tempw2第三步:使用tempw1 數(shù)據(jù)庫(kù),將其與tempw2 合并:clearuse tempw1me
4、rge v001 v002 v003 using tempw2第四步:查看合并后的數(shù)據(jù)狀況:ta _merge tabulate _merge的簡(jiǎn)寫su第五步:清理臨時(shí)數(shù)據(jù)庫(kù),并刪除_merge ,以免日后合并新變量時(shí)出錯(cuò)eraseerasedrop _merge數(shù)據(jù)擴(kuò)展 append :數(shù)據(jù)源自 stata tutorial中的 fac19 和 newfacclearuse t:statatutta regionappend using t:statatutnewfacta region合并后樣本量增加,但變量數(shù)不變莖葉圖:stem x1,line(2)(做 x1 的莖葉圖,每一個(gè)十分位的樹(shù)
5、莖都被拆分成兩段來(lái)顯示,前半段為04 ,后半段為 59)stem x1,width(2) (做 x1 的莖葉圖,每一個(gè)十分位的樹(shù)莖都被拆分成五段來(lái)顯示,每個(gè)小樹(shù)莖的組距為2 )stem x1,round(100)(將 x1 除以 100 后再做 x1 的莖葉圖)直方圖采用 auto 數(shù)據(jù)庫(kù)histogram mpg, discrete frequency normal xlabel(1(1)5)(discrete 表示變量不連續(xù),frequency表示顯示頻數(shù),normal 加入正太分布曲線,xlabel 設(shè)定 x 軸, 1 和5 為極端值, (1) 為單位)histogram price,
6、fraction norm(fraction 表示 y 軸顯示小數(shù),除了frequency和 fraction 這兩個(gè)選擇之外,該命令可替換為“percent 百”分比,和 “density 密”度;未加上discrete 就表示將 price 當(dāng)作連續(xù)變量來(lái)繪圖)histogram price, percent by(foreign)(按照變量 “foreign的”分類,將不同類樣本的“price繪”制出來(lái),兩個(gè)圖分左右排布)histogram mpg, discrete by(foreign, col(1)(按照變量 “foreign的”分類,將不同類樣本的“mpg”繪制出來(lái),兩個(gè)圖分上下
7、排布)histogram mpg, discrete percent by(foreign, total) norm(按照變量 “foreign的”分類,將不同類樣本的“mpg”繪制出來(lái),同時(shí)繪出樣本整體的“總”直方圖)二變量圖:graph twoway lfit price weight | scatter price weight(作出 price 和 weight 的回歸線圖 “ lfit,然”后與price 和 weight 的散點(diǎn)圖相疊加)twoway scatter price weight,mlabel(make)(做 price 和 weight 的散點(diǎn)圖,并在每個(gè)點(diǎn)上標(biāo)注“m
8、ake”,即廠商的取值)twoway scatter price weight | lfit price weight,by(foreign)(按照變量foreign 的分類,分別對(duì)不同類樣本的price 和 weight 做散點(diǎn)圖和回歸線圖的疊加,兩圖呈左右分布)twoway scatter price weight | lfit price weight,by(foreign,col(1)(按照變量foreign 的分類,分別對(duì)不同類樣本的price 和 weight做散點(diǎn)圖和回歸線圖的疊加,兩圖呈上下分布)twoway scatter price weight fweight= disp
9、lacement,msymbol(oh)(畫出price和weight的散點(diǎn)圖, “msybol(oh) ”示每個(gè)點(diǎn)均為中空的圓圈,表fweight= displacement表示每個(gè)點(diǎn)的大小與displacement的取值大小成比例)twoway connected y1 time,yaxis(1) | y2 time,yaxis(2)(畫出y1和 y2這兩個(gè)變量的時(shí)間點(diǎn)線圖,并將它們疊加在一個(gè)圖中,左邊“yaxis(1) 為”y1的度量,右邊“ yaxis(2)為 ”y2的)twoway line y1 time,yaxis(1) | y2 time,yaxis(2)(與上圖基本相同,就是
10、沒(méi)有點(diǎn),只顯示曲線)graph twoway scatter var1 var4 | scatter var2 var4 | scatter var3 var4(做三個(gè)點(diǎn)圖的疊加)graph twoway line var1 var4 | line var2 var4 | line var3 var4(做三個(gè)線圖的疊加)graph twoway connected var1 var4 | connected var2 var4 | connected var3 var4 (疊加三個(gè)點(diǎn)線相連圖)更多變量:graph matrix a b c y(畫出一個(gè)散點(diǎn)圖矩陣,顯示各變量之間所有可能的兩兩相
11、互散點(diǎn)圖)graph matrix a b c d,half(生成散點(diǎn)圖矩陣,只顯示下半部分的三角形區(qū)域)用auto數(shù)據(jù)集:graph matrix price mpg weight length,half by( foreign,total col(1) )(根據(jù)foreign變量的不同類型繪制price等四個(gè)變量的散點(diǎn)圖矩陣,要求繪出總圖,并上下排列】=具)其他圖形:graph box y,over(x) yline(.22)(對(duì)應(yīng)x 的每一個(gè)取值構(gòu)建y 的箱型圖,并在y 軸的處劃一條水平線)graph bar (mean) y,over(x)對(duì)應(yīng) x 的每一個(gè)取值, 顯示 y 的平均數(shù)的
12、條形圖。括號(hào)中的 “mean”也可換成 median 、sum 、sd 、p25 、p75等graph bar a1 a2,over(b) stack(對(duì)應(yīng)在b 的每一個(gè)取值,顯示a1和 a2 的條形圖,a1和 a2是疊放成一根條形柱。若不寫入“stack,”則a1和a2顯示為兩個(gè)并排的條形柱)graph dot (median)y,over(x)(畫點(diǎn)圖,沿著水平刻度,在x 的每一個(gè)取值水平所對(duì)應(yīng)的y 的中位數(shù)上打點(diǎn))qnorm x(畫出一幅分位- 正態(tài)標(biāo)繪圖)rchart a1 a2 a2(畫出質(zhì)量控制R 圖,顯示a1 到 a3 的取值范圍)簡(jiǎn)單統(tǒng)計(jì)量的計(jì)算:ameans x(計(jì)算變量x
13、的算術(shù)平均值、幾何平均值和簡(jiǎn)單調(diào)和平均值,均顯示樣本量和置信區(qū)間)mean var1 pweight = var2(求取分組數(shù)據(jù)的平均值和標(biāo)準(zhǔn)誤,var1 為各組的賦值,var2 為每組的頻數(shù))summarize y x1 x2,detail(可以獲得各個(gè)變量的百分比數(shù)、最大最小值、樣本量、平均數(shù)、標(biāo)準(zhǔn)差、方差、峰度、偏度)*注意 *stata 中 summarize 所計(jì)算出來(lái)的峰度 skewness 和偏度 kurtosis 有問(wèn)題,與 ECELL 和 SPSS 有較大差異,建議不采用 stata 的結(jié)果。summarize var1 aweight = var2, detail(求取分組
14、數(shù)據(jù)的統(tǒng)計(jì)量,var1 為各組的賦值,var2 為每組的頻數(shù))tabstat X1,stats(mean n q max min sd var cv)(計(jì)算變量X1 的算術(shù)平均值、樣本量、四分位線、最大最小值、標(biāo)準(zhǔn)差、方差和變異系數(shù))概率分布的計(jì)算:(1 )貝努利概率分布測(cè)試:webuse quickbitest quick=,detail(假設(shè)每次得到成功案例1的概率等于,計(jì)算在變量quick所顯示的二項(xiàng)分布情況下,各種累計(jì)概率和單個(gè)概率是多少)bitesti 10,3,detail(計(jì)算當(dāng)每次成功的概率為時(shí),十次抽樣中抽到三次成功案例的概率:低于或高于三次成功的累計(jì)概率和恰好三次成功概率)
15、(2 )泊松分布概率:display poisson(7,6).(計(jì)算均值為7 ,成功案例小于等于6 個(gè)的泊松概率)display poissonp(7,6).(計(jì)算均值為7 ,成功案例恰好等于6 個(gè)的泊松概率)display poissontail(7,6).(計(jì)算均值為7 ,成功案例大于等于6 個(gè)的泊松概率)(3 )超幾何分布概率:display hypergeometricp(10,3,4,2).3(計(jì)算在樣本總量為10 ,成功案例為3 的樣本總體中, 不重置地抽取4 個(gè)樣本, 其中恰好有2 個(gè)為成功案例的概率)display hypergeometric(10,3,4,2).(計(jì)算在樣
16、本總量為10 ,成功案例為3 的樣本總體中, 不重置地抽取4 個(gè)樣本, 其中有小于或等于2 個(gè)為成功案例的概率)檢驗(yàn)極端值的步驟:常見(jiàn)命令: tabulate 、 stem 、codebook 、summarize 、list 、histogram 、graph box 、gragh matrix step1. 用 codebook 、summarize 、histogram 、graph boxs 、graph matrix 、stem 看檢驗(yàn)數(shù)據(jù)的總體情況: codebook y x1 x2summarize y x1 x2,detailhistogram x1,norm(正態(tài)直方圖)gr
17、aph box x1 (箱圖)graph matrix y x1 x2,half(畫出各個(gè)變量的兩兩x-y 圖)stem x1 (做 x1 的莖葉圖)可以看出數(shù)據(jù)分布狀況,尤其是最大、最小值step2. 用 tabulate 、 list 細(xì)致尋找極端值tabulate code if x1= 極端值(作出x1 等于極端值時(shí) code 的頻數(shù)分布表, code 表示地區(qū)、年份等序列變量,這樣便可找出那些地區(qū)的數(shù)值出現(xiàn)了錯(cuò)誤)list code if x1= 極端值(直接列出x1 等于極端值時(shí) code 的值,當(dāng) x1 的錯(cuò)誤過(guò)多時(shí), 不建議使用該命令)list in -20/l (l 表示 l
18、ast one ,-20表示倒數(shù)第 20 個(gè)樣本,該命令列出了從倒數(shù)第20 個(gè)到倒數(shù)第一個(gè)樣本的各變量值)step3. 用 replace 命令替換極端值replace x1=? if x1= 極端值去除極端值:keep if y1000對(duì)數(shù)據(jù)排序:sort xgsort +x(對(duì)數(shù)據(jù)按x 進(jìn)行升序排列)gsort -x(對(duì)數(shù)據(jù)按x 進(jìn)行降序排列)gsort -x, generate(id) mfirst(對(duì)數(shù)據(jù)按x 進(jìn)行降序排列,缺失值排最前,生成反映位次的變量id)對(duì)變量進(jìn)行排序:order y x3 x1 x2(將變量按照y 、x3、 x1、 x2 的順序排列)生成新變量:gen log
19、x1=log(x1)(得出 x1 的對(duì)數(shù))gen x1=exp(logx1)(將 logx1反對(duì)數(shù)化)gen r61_100=1 if rank=61&rankx2,x1,x2) (若 x1x2 成立,則取 x1,若 x1x2不成立,則取 x2)sort xgen gx=group(n)(將經(jīng)過(guò)排序的變量 x 分為盡量等規(guī)模的n 個(gè)組)egen zx1=std(x1)(得出 x1的標(biāo)準(zhǔn)值,就是用(x1-avgx1)/sdx1 )egen zx1=std(x1),m(0) s(1)(得出 x1 的標(biāo)準(zhǔn)分,標(biāo)準(zhǔn)分的平均值為0,標(biāo)準(zhǔn)差為1)egen sdx1=sd(x1) (得出 x1 的標(biāo)準(zhǔn)差)e
20、gen meanx1=mean(x1) (得出 x1 的平均值)egen maxx1=max(x1)(最大值)egen minx1=min(x1)(最小值)egen medx1=med(x1)(中數(shù))egen modex1=mode(x1) (眾數(shù))egen totalx1=total(x1)(得出 x1 的總數(shù))egen rowsd=sd(x1 x2 x3) (得出 x1、x2 和 x3聯(lián)合的標(biāo)準(zhǔn)差)egen rowmean=mean(x1 x2 x3)(得出 x1、x2和 x3 聯(lián)合的平均值)egen rowmax=max(x1 x2 x3)(聯(lián)合最大值)egen rowmin=min(x
21、1 x2 x3)(聯(lián)合最小值)egen rowmed=med(x1 x2 x3)(聯(lián)合中數(shù))egen rowmode=mode(x1 x2 x3)(聯(lián)合眾數(shù))egen rowtotal=total(x1 x2 x3)(聯(lián)合總數(shù))egen xrank=rank(x)(在不改變變量 x 各個(gè)值排序的情況下,獲得反映x 值大小排序的xrank )數(shù)據(jù)計(jì)算器 display命令:display x12 (顯示 x 的第十二個(gè)觀察值)display chi2(n,x)(自由度為 n 的累計(jì)卡方分布)display chi2tail(n,x)(自由度為 n 的反向累計(jì)卡方分布, chi2tail(n,x)
22、=1-chi2(n,x))display invchi2(n,p)(卡方分布的逆運(yùn)算,若chi2(n,x)=p,那么 invchi2(n,p)=x )display invchi2tail(n,p)(chi2tail 的逆運(yùn)算)display F(n1,n2,f)(分子、分母自由度分別為n1 和 n2 的累計(jì) F 分布)display Ftail(n1,n2,f)(分子、分母自由度分別為n1 和 n2 的反向累計(jì) F 分布)display invF(n1,n2,P)(F 分布的逆運(yùn)算,若 F(n1,n2,f)=p,那么 invF(n1,n2,p)=f)display invFtail(n1,n
23、2,p) ( Ftail 的逆運(yùn)算)display tden(n,t)(自由度為 n 的 t 分布)display ttail(n,t) (自由度為 n 的反向累計(jì) t 分布)display invttail(n,p)( ttail 的逆運(yùn)算)給數(shù)據(jù)庫(kù)和變量做標(biāo)記:label data (對(duì)現(xiàn)用的數(shù)據(jù)庫(kù)做標(biāo)記, 就是標(biāo)記,可自行填寫)label variable x (對(duì)變量 x 做標(biāo)記)label values x label1(賦予變量 x 一組標(biāo)簽 :label1 )label define label1 1 a1 2 a2(定義標(biāo)簽的具體內(nèi)容:當(dāng)x=1 時(shí),標(biāo)記為 a1 ,當(dāng) x=2
24、時(shí),標(biāo)記為a2 )頻數(shù)表:tabulate x1,sorttab1 x1-x7,sort(做 x1 到 x7 的頻數(shù)表,并按照頻數(shù)以降序顯示行)table c1,c ( n x1 mean x1 sd x1)(在分類變量c1 的不同水平上列出x1 的樣本量和平均值)二維交互表:auto 數(shù)據(jù)庫(kù):table rep78 foreign, c(n mpg mean mpg sd mpg median mpg) center row col(rep78 ,foreign 均為分類變量, rep78 為行變量, foreign 為列變量, center 表示結(jié)果顯示在單元格中間,row 表示計(jì)算行變量
25、整體的統(tǒng)計(jì)量,col 表示計(jì)算列變量整體的統(tǒng)計(jì)量)tabulate x1 x2,all(做 x1 和 x2 的二維交互表,要求顯示獨(dú)立性檢驗(yàn)chi2 、似然比卡方獨(dú)立性檢驗(yàn)lrchi2 、對(duì)定序變量適用的等級(jí)相關(guān)系數(shù) gamma 和 taub 、以及對(duì)名義變量適用的V )tabulate x1 x2,column chi2(做 x1和 x2 的二維交互表,要求顯示列百分比和行變量和列變量的獨(dú)立性檢驗(yàn) 零假設(shè)為變量之間獨(dú)立無(wú)統(tǒng)計(jì)關(guān)系)tab2 x1-x7,all nofreq (對(duì) x1 到 x7 這七個(gè)變量?jī)蓛傻刈龆S交互表,不顯示頻數(shù):nofreq )三維交互表:by x3,sort:tab
26、ulate x1 x2,nofreq col chi2(同時(shí)進(jìn)行 x3的每一個(gè)取值內(nèi)的 x1和 x2 的二維交互表,不顯示頻數(shù)、顯示列百分比和獨(dú)立性檢驗(yàn))四維交互表:table x1 x2 x3,c(ferq mean x1 mean x2 mean x3) by(x4)tabstat X1 X2,by(X3) stats(mean n q max min sd var cv) col(stats)tabstat X1 X2,by(X3) stats(mean range q sd var cv p5 p95 median),aw=X4(以 X4 為權(quán)重求 X1 、X2 的均值,標(biāo)準(zhǔn)差、方差等
27、)ttest X1=1count if X1=0count if X1=0gen X2=1 if X1=0corr x1 x2 x3(做 x1、 x2、 x3的相關(guān)系數(shù)表)swilk x1 x2 x3(用 Shapiro-Wilk W test對(duì) x1、 x2、 x3進(jìn)行正太性分析)sktest x1 x2 x3 (對(duì) x1、 x2、 x3 進(jìn)行正太性分析,可以求出峰度和偏度)ttest x1=x2 (對(duì) x1、x2 的均值是否相等進(jìn)行T 檢驗(yàn))ttest x1,by(x2) unequal (按 x2的分組方式對(duì)x1 進(jìn)行 T 檢驗(yàn),假設(shè)方差不齊性)sdtest x1=x2(方差齊性檢驗(yàn))s
28、dtest x1 ,by(x2) (按 x2的分組方式對(duì)x1 進(jìn)行方差齊性檢驗(yàn))聚類分析:cluster kmeans y x1 x2 x3, k(3) 依據(jù) y 、x1、 x2、 x3,將樣本分為 n 類,聚類的核為隨機(jī)選取cluster kmeans y x1 x2 x3, k(3) measure(L1) start(everykth) start 用于確定聚類的核, everykth 表示將通過(guò)構(gòu)造三組樣本獲得聚類核:構(gòu)造方法為將樣本 id 為 1、1+3 、1+32、 1+3 3分為一組、將樣本id 為 2、2+3 、 2+32、 2+3 3分為第二組,以此類推,將這三組的均值作為聚
29、類的核;measure 用 于計(jì)算相似性和相異性的方法,L1 表示采用歐式距離的絕對(duì)值,也直接可采用歐式距離 (L2 )和歐式距離的平方 (L2squared )。PS :這個(gè)方法 所得的結(jié)果與 SPSS 所得結(jié)果相同。sort c1 c2 (對(duì) c1 和 c2by c1 c2 :reg y x1 x2 x3兩個(gè)分類變量排序)(在 c1、 c2 的各個(gè)水平上分別進(jìn)行回歸)bysort c1 c2:reg y x1 x2 x3 if c3=1(逗號(hào)前面相當(dāng)于將上面兩步驟合一,既排序又回歸, 逗號(hào)后面的 “ if c3=1”表示只有在c3=1的情況下才進(jìn)行回歸)stepwise, pr(.2):
30、reg y x1 x2 x3(使用 Backward selection,去除 P 值大于時(shí)變量 )stepwise, pe(.2): reg y x1 x2 x3(使用 forward selection ,去除 P 值小于時(shí)變量 )stepwise, pr(.2) pe(.01):reg y x1 x2 x3(使用 backward-stepwise selection,取 P 值在和之間的變量)stepwise, pe(.2) forward: reg y x1 x2 x3(使用 forward-stepwise selection)reg y x1 x2 x3predict Yhat,
31、xbpredict u,residpredict ustd,stdr(獲得殘差的標(biāo)準(zhǔn)誤)predict std,stdp(獲得 y 估計(jì)值的標(biāo)準(zhǔn)誤)predict stdf,stdf(獲得 y 預(yù)測(cè)值的標(biāo)準(zhǔn)誤)predict e,e(1,12)(獲得 y 在 1到 12之間的估計(jì)值)predict p,pr(1 , 12)(獲得 y 在 1 到 12 之間的概率)predict rstu,rstudent(獲得 student的 t 值)predict lerg,leverage(獲得杠桿值)predict ckd,cooksd(獲得 cooksd )reg y x1 x2 x3 c1 c2a
32、djust x1 x2 x3,se(使得變量x1、 x2 和 x3 等于其均值,求 y 的預(yù)測(cè)值和標(biāo)準(zhǔn)誤)adjust x1 x2 x3,stdf ci (使得變量 x1、 x2 和 x3 等于其均值,求 y 的預(yù)測(cè)值,預(yù)測(cè)標(biāo)準(zhǔn)誤和置信區(qū)間)adjust x1 x2,by(c1) seci(控制變量x1 、 x2,亦即取它們的均值,在分類變量c1 的不同水平上求y 預(yù)測(cè)值,標(biāo)準(zhǔn)誤和置信區(qū)間)adjust x1 x2 x3,by(c1) stdf ci (控制變量x1、x2、x3,亦即取它們的均值,在分類變量c1 的不同水平上求y 預(yù)測(cè)值,預(yù)測(cè)標(biāo)準(zhǔn)誤和置信區(qū)間)adjust x1 x2,by(c
33、1 c2) se ci (控制變量x1、 x2,在分類變量c1 、c2的不同水平上求y 的預(yù)測(cè)值,標(biāo)準(zhǔn)誤和置信區(qū)間)adjust x1 x2 x3,by(c1 c2) stdf ci (控制變量 x1、x2、x3,在分類變量c1、c2 的不同水平上求 y 的預(yù)測(cè)值,預(yù)測(cè)標(biāo)準(zhǔn)誤和置信區(qū)間)adjust x1=a x2=b x3=c, se ci (當(dāng) x1=a 、 x2=b 、 x3=c 時(shí),求 y 的預(yù)測(cè)值、標(biāo)準(zhǔn)誤和置信區(qū)間)adjust x1=a x2=b x3=c, by(c1) se ci(當(dāng) x1=a 、 x2=b 、 x3=c 時(shí),在分類變量c1 的不同水平上,求y 的預(yù)測(cè)值、標(biāo)準(zhǔn)誤
34、和置信區(qū)間)adjust x1=a x2=b c1=1, by(c1) se ci(當(dāng) x1=a 、x2=b ,并假設(shè)所有的樣本均為c1=1 ,求在分類變量 c1的不同水平上,因?yàn)樽兞縳3 的均值不同,而導(dǎo)致的y 的不同的預(yù)測(cè)值 )mvreg Y1 Y2 : X1 X2 X3 (多元回歸)mvreg y1 y2 y3: x1 x3 x3(多元回歸分析, y1 y2 y3為因變量, x1 x3 x3 為自變量)以下命令只有在進(jìn)行了mvreg 之后才能進(jìn)行test y1 (測(cè)試對(duì) y1 的回歸系數(shù)聯(lián)合為0 )test y1: x1 x2 (測(cè)試對(duì)y1 的回歸中 x1、 x2 的系數(shù)為 0)test
35、 x1 x2 x3(測(cè)試在所有的回歸中,x1、 x2、x3 的系數(shù)均為0)test y1=y2(對(duì) y1 的回歸和對(duì) y2 的回歸系數(shù)相等)test y1=y2: x1 x2 x3, mtest (對(duì) y1 和 y2 的回歸中, 分別測(cè)試x1、x2、x3 的系數(shù)是否相等,若沒(méi)有mtest這個(gè)命令,則測(cè)試他們的聯(lián)和統(tǒng)計(jì))test y1=y2=y3 (三個(gè)回歸的系數(shù)是否相等,可加mtest 以分別測(cè)試)test y1=y2=y3: x1 x2(測(cè)試三個(gè)回歸中的 x1、x2是否相等,可加mtest )est 命令的用法:(1 )儲(chǔ)存回歸結(jié)果:reg y x1 x2 x3 (不限于reg,也可儲(chǔ)存iv
36、reg 、mvreg 、reg3 )est store A(2 )重現(xiàn)回歸結(jié)果:est replay A(3 )對(duì)回歸結(jié)果進(jìn)行進(jìn)一步分析est for A:sum (對(duì) A 回歸結(jié)果中的各個(gè)變量運(yùn)行sum 命令)異方差問(wèn)題:獲得穩(wěn)健性標(biāo)準(zhǔn)誤reg y x1 x2 x3 if c1=1(當(dāng)分類變量c1=1 時(shí),進(jìn)行reg y x1 x2 x3,robust(回歸后顯示各個(gè)自變量的異方差estat vif (回歸之后獲得VIF )estat hettest,mtest(異方差檢驗(yàn))y 和諸 x 的回歸)-穩(wěn)健性標(biāo)準(zhǔn)誤)異方差檢驗(yàn)的套路:( 1 )Breusch-pagan 法:reg y x1 x
37、2 x3predict u,residgen usq=u2reg usq x1 x2 x3求 F 值display R/(1-R)*n2/n1(n1display Ftail()表示分子除數(shù),n2表示分母除數(shù))求 LM值display R*n (n 表示總樣本量)display chi2tail()( 2 )white 法:reg y x1 x2 x3predict u,residgen usq=u2predict ygen ysq=y2reg usq y ysq求 F 值display R/(1-R)*n2/n1(n1display Ftail()表示分子除數(shù),n2表示分母除數(shù))求 LM值d
38、isplay R*n (n 表示總樣本量)display chi2tail()(3 )必要補(bǔ)充F 值和 LM 值轉(zhuǎn)換為 P 值的命令:display Ftail(n1,n2,a)(利用 F 值求 p 值, n1 表示分子除數(shù),n2 表示分母除數(shù),display chi2tail(n3,b)(利用 LM 值求 p 值, n3 表示自由度的損失量,一般等于異方差的糾正 WLS ( weighted least square estimator)a 為 F 值) n1 ,b 為 LM值)(1 )基本思路:reg y x1 x2 x3 aw=x1(將 x1 作為異方差的來(lái)源,對(duì)方程進(jìn)行修正)上式相當(dāng)于
39、:reg y/(x1 1/(x1 x1/(x1 x2/(x1 x3/(x1,noconstant(2 )糾正異方差的常用套路(構(gòu)造h 值)reg y x1 x2 x3predict u,residgen usq=u2gen logusq=log(usq)reg logusq x1 x2 x3predict ggen h=exp(g)reg y x1 x2 x3 aw=1/h異方差 hausman檢驗(yàn):reg y x1 x2 x3est store A (將上述回歸結(jié)果儲(chǔ)存到reg y x1 x2 x3 aw=1/hest store Bhausman A BA 中)當(dāng)因變量為對(duì)數(shù)形式時(shí)(log
40、(y) )如何預(yù)測(cè)yreg logy x1 x2 x3predict kgen m=exp(k)reg y m,noconstantm 的系數(shù)為iy 的預(yù)測(cè)值=i exp(k)方差分析:一元方差分析anova y g1 / g1|g2 /( g*表示不同分類變量,計(jì)算g1和交互項(xiàng)/ g1|g2 /這兩種分類的y 值是否存在組內(nèi)差異)anova y d1 d2 d1*d2(d* 表示虛擬變量,計(jì)算d1 、d2 和 d1*d2 的這三種分類的anova y d1 d2 x1 d2*x1, continuous(x1)(x*表示連續(xù)的控制變量)y 值是否有組內(nèi)差異)多元方差分析webuse jawm
41、anova y1 y2 y3 = gender fracture gender*fracture(按性別、是否骨折及二者的交互項(xiàng)對(duì)y1、 y2 和y3進(jìn)行方差分析)manova y1 = gender fracture gender*fracture(相當(dāng)于一元方差分析,以y1 為因變量)webuse nobetweengen mycons = 1manova test1 test2 test3 = mycons, noconstantmat c = (1,0,-1 0,1,-1)manovatest mycons, ytransform(c)進(jìn)行多元回歸的方法:多元回歸分析:(與mvreg相
42、同)foreach vname in y1 y2 y3 (確定 y 變量組 vname )reg vname x1 x2 x3(將y 變量組中的各個(gè)變量與諸x 變量進(jìn)行回歸分析,注意vname的標(biāo)點(diǎn)符號(hào))上式等價(jià)于:mvreg y1 y2 y3 = x1 x2 x3reg3命令:(1 )簡(jiǎn)單用法:reg3 (y1 = x1 x2 x3) (y2 = x1 x3 x4) (y3 = x1 x2 x5)測(cè)試 y1 coefs = 0test y1測(cè)試不同回歸中相同變量的系數(shù):test y1=y2=y3, commontest (y1=y2) (y1=y3), common constant(con
43、stant表示包含截距項(xiàng))(2 )用 reg3 進(jìn)行 2SLSreg3 (y1 = y2 x1 x2) (y2 = y1 x4),2sls(2 )用 reg3 進(jìn)行 OLSreg3 (y1 = y2 x1 x2) (y2 = y1 x4),ols對(duì)兩個(gè)回歸結(jié)果進(jìn)行hausman檢驗(yàn):reg3 (y1=x1 x2 x3)(y2=y1 x4),2slsest store twoslsreg3 (y1=x1 x2 x3)(y2=y1 x4),olsest store olshausman twosls ols,equations(1:1)(對(duì)兩次回歸中的方程1,即 “ y1=x1 x2 x3 進(jìn)”行 hausman 檢驗(yàn))hausman twosls ols,equations(2:2)(對(duì)兩次回歸中的方程2,即 “ y2=y1 x4 進(jìn)”行 hausman 檢驗(yàn))hausman twosls ols,alleqs(對(duì)所有方程一起進(jìn)行檢驗(yàn))檢驗(yàn)忽略變量(模型的RESET ):reg y x1 x2 x3estat ovtest滯后變量的制取對(duì)變量 y 滯后一期:gen y_l1=y_n-1滯后兩期:
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 塑膠跑道產(chǎn)品供應(yīng)鏈分析
- 二手奢侈品交易電商行業(yè)市場(chǎng)調(diào)研分析報(bào)告
- 藥柜市場(chǎng)發(fā)展前景分析及供需格局研究預(yù)測(cè)報(bào)告
- 舌頭清潔刷項(xiàng)目運(yùn)營(yíng)指導(dǎo)方案
- 皮制書皮項(xiàng)目營(yíng)銷計(jì)劃書
- 農(nóng)業(yè)作物收獲技術(shù)行業(yè)經(jīng)營(yíng)分析報(bào)告
- 葡萄柚樹(shù)修剪器市場(chǎng)發(fā)展前景分析及供需格局研究預(yù)測(cè)報(bào)告
- 彩色皺紋紙產(chǎn)品供應(yīng)鏈分析
- 冷藏倉(cāng)儲(chǔ)行業(yè)市場(chǎng)調(diào)研分析報(bào)告
- 醫(yī)用呼吸裝置產(chǎn)品供應(yīng)鏈分析
- 2023-2024學(xué)年天津市經(jīng)開(kāi)區(qū)國(guó)際學(xué)校八年級(jí)(上)期末物理試卷
- DB23T 3842-2024 一般化工企業(yè)安全生產(chǎn)標(biāo)準(zhǔn)化評(píng)定規(guī)范
- 期中模擬押題卷(1-3單元)(試題)-2024-2025學(xué)年蘇教版數(shù)學(xué)六年級(jí)上冊(cè)
- 環(huán)氧樹(shù)脂項(xiàng)目可行性研究報(bào)告項(xiàng)目報(bào)告
- 2024-2025學(xué)年人教版數(shù)學(xué)三年級(jí)上冊(cè) 第三單元 測(cè)量 單元測(cè)試卷(含答案)
- 2024新信息科技三年級(jí)第四單元:創(chuàng)作數(shù)字作品大單元整體教學(xué)設(shè)計(jì)
- 第一單元達(dá)標(biāo)練習(xí)(單元練習(xí))-2024-2025學(xué)年語(yǔ)文一年級(jí)上冊(cè)(統(tǒng)編版)
- 2024年水電暖安裝合同模板
- 三年級(jí)語(yǔ)文《那次玩得真高興:記一次游戲的感受》說(shuō)課課件
- 2023-2024學(xué)年廣東省深圳市龍崗區(qū)滬教牛津版(深圳用)六年級(jí)上冊(cè)期中英語(yǔ)試卷(無(wú)答案)
- 2024年統(tǒng)編版新教材語(yǔ)文小學(xué)一年級(jí)上冊(cè)第五單元檢測(cè)題及答案
評(píng)論
0/150
提交評(píng)論