




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
中級(jí)社會(huì)統(tǒng)計(jì)第十三講複迴歸分析?Ming-chiChenPage.1社會(huì)統(tǒng)計(jì)中級(jí)社會(huì)統(tǒng)計(jì)第十三講?Ming-chiChenPage.1複迴歸分析前面我們學(xué)到只有一個(gè)自變項(xiàng)的簡(jiǎn)單迴歸分析我們知道一個(gè)地區(qū)的人均病床數(shù)會(huì)影響到該地區(qū)的平均餘命我們也知道一個(gè)地區(qū)的人均教育支出會(huì)影響該地區(qū)的平均餘命但是如果教育支出相等的條件下,醫(yī)療資源的多寡會(huì)不會(huì)影響平均壽命??jī)烧呤胼p孰重?控制的概念(在其他條件不變的情況下)?Ming-chiChen2社會(huì)統(tǒng)計(jì)複迴歸分析前面我們學(xué)到只有一個(gè)自變項(xiàng)的簡(jiǎn)單迴歸分析?Ming複迴歸分析研究?jī)蓚€(gè)或兩個(gè)以上的IV對(duì)DV的影響的分析方式,稱為複迴歸分析(multipleregressionanalysis)又稱多元迴歸分析迴歸方程式?Ming-chiChen3社會(huì)統(tǒng)計(jì)複迴歸分析研究?jī)蓚€(gè)或兩個(gè)以上的IV對(duì)DV的影響的分析方式,稱多元迴歸MultipleRegressionModels統(tǒng)計(jì)成績(jī)與努力(所花時(shí)間)的關(guān)係如下:觀念?Ming-chiChen4社會(huì)統(tǒng)計(jì)多元迴歸MultipleRegressionModels多元迴歸MultipleRegressionModels兩者的迴歸線:觀念?Ming-chiChen5社會(huì)統(tǒng)計(jì)多元迴歸MultipleRegressionModels多元迴歸MultipleRegressionModels將學(xué)生對(duì)於數(shù)理科目的興趣納入考量發(fā)現(xiàn):觀念x2=30x2=20x2=10?Ming-chiChen6社會(huì)統(tǒng)計(jì)多元迴歸MultipleRegressionModels多元迴歸MultipleRegressionModels如果我們針對(duì)具有相同興趣水準(zhǔn)的學(xué)生來(lái)考量努力與成績(jī)的關(guān)係,則可以分別用三個(gè)迴歸線來(lái)表達(dá):觀念?Ming-chiChen7社會(huì)統(tǒng)計(jì)多元迴歸MultipleRegressionModels多元迴歸MultipleRegressionModels這三條線的斜率似乎沒(méi)有原本迴歸線來(lái)得大,表示努力與成績(jī)的關(guān)係有一部份是受到興趣的干擾(confounding):有興趣的學(xué)生通?;ū容^多的時(shí)間觀念?Ming-chiChen8社會(huì)統(tǒng)計(jì)多元迴歸MultipleRegressionModels多元迴歸MultipleRegressionModels此時(shí)利用多元迴歸比簡(jiǎn)單迴歸可以算出三條簡(jiǎn)單迴歸的「平均斜率」。觀念?Ming-chiChen9社會(huì)統(tǒng)計(jì)多元迴歸MultipleRegressionModels多元迴歸MultipleRegressionModels多元迴歸用來(lái)分析一個(gè)以上自變數(shù)對(duì)於依變數(shù)的影響,可以看出「其他變數(shù)不變(常數(shù))」的條件下,某一個(gè)變數(shù)對(duì)於依變數(shù)產(chǎn)生的「淨(jìng)」影響為何?觀念?Ming-chiChen10社會(huì)統(tǒng)計(jì)多元迴歸MultipleRegressionModelsPartialDerivative偏微分觀念觀念經(jīng)濟(jì)學(xué)說(shuō)我們對(duì)於某商品的需求量與價(jià)格及所得有關(guān):在所得不變的條件下,商品價(jià)格x1變動(dòng),對(duì)於需求量y有何影響??Ming-chiChen11社會(huì)統(tǒng)計(jì)PartialDerivative偏微分觀念觀念經(jīng)濟(jì)學(xué)說(shuō)我PartialDerivative偏微分觀念觀念假設(shè)所得固定為100,因?yàn)閮r(jià)格變動(dòng)所造成的商品需求變動(dòng)可以表為:帶入原來(lái)的函數(shù):?Ming-chiChen12社會(huì)統(tǒng)計(jì)PartialDerivative偏微分觀念觀念假設(shè)所得固PartialDerivative偏微分觀念觀念如果我們將x1切割成很小的單位,則每個(gè)極小單為的變動(dòng)所造成的q變動(dòng)為:在x2不變(保持恆定)的情況下,x1的變動(dòng)所造成y的變動(dòng)?Ming-chiChen13社會(huì)統(tǒng)計(jì)PartialDerivative偏微分觀念觀念如果我們將PartialDerivative偏微分觀念觀念X2所得X1價(jià)格y需求三個(gè)以上的自變數(shù)在三度空間上無(wú)法表達(dá)。二個(gè)自變數(shù)的多元迴歸分析在於設(shè)法找出最合適資料分佈的一個(gè)平面。?Ming-chiChen14社會(huì)統(tǒng)計(jì)PartialDerivative偏微分觀念觀念X2所得X多元迴歸的參數(shù)推估求多元迴歸x1與x2的係數(shù)?我們可以將所有的觀察值y視為x1與x2的線性函數(shù)加上誤差值e多元迴歸的預(yù)測(cè)值可以表為:?Ming-chiChen15社會(huì)統(tǒng)計(jì)多元迴歸的參數(shù)推估求多元迴歸x1與x2的係數(shù)?我們可以將所有TheNormalEquation觀念X2所得X1價(jià)格y需求求使e2最小的平面?Ming-chiChen16社會(huì)統(tǒng)計(jì)TheNormalEquation觀念X2所得X1價(jià)格yTheNormalEquation觀念求MinimumQ?將(1)式分別對(duì)a,b1,b2做偏微分,再將所得之方程式設(shè)為零,然後求解聯(lián)立方程式即可求得最小值。?Ming-chiChen17社會(huì)統(tǒng)計(jì)TheNormalEquation觀念求MinimumTheNormalEquation觀念e總和為零e與x1及x2不相關(guān)(uncorrelated)?Ming-chiChen18社會(huì)統(tǒng)計(jì)TheNormalEquation觀念e總和為零e與x1BasicRulesforDifferentiationRule8:thechainrule複習(xí)?Ming-chiChen19社會(huì)統(tǒng)計(jì)BasicRulesforDifferentiatioExampleofchainrule複習(xí)?Ming-chiChen20社會(huì)統(tǒng)計(jì)Exampleofchainrule複習(xí)?Ming-c微分求迴歸係數(shù)?Ming-chiChen21社會(huì)統(tǒng)計(jì)微分求迴歸係數(shù)?Ming-chiChen21社會(huì)統(tǒng)計(jì)?Ming-chiChen22社會(huì)統(tǒng)計(jì)?Ming-chiChen22社會(huì)統(tǒng)計(jì)TheNormalEquation觀念?Ming-chiChen23社會(huì)統(tǒng)計(jì)TheNormalEquation觀念?Ming-chiTheNormalEquation觀念SumAverage?Ming-chiChen24社會(huì)統(tǒng)計(jì)TheNormalEquation觀念SumAveragTheNormalEquation觀念SumAverage?Ming-chiChen25社會(huì)統(tǒng)計(jì)TheNormalEquation觀念SumAveragTheNormalEquation觀念迴歸平面通過(guò)中心點(diǎn):?Ming-chiChen26社會(huì)統(tǒng)計(jì)TheNormalEquation觀念迴歸平面通過(guò)中心點(diǎn)NormalEquationsinReducedForm觀念若將所有變數(shù)都以「離均值」來(lái)表示求b1,b2等於:?Ming-chiChen27社會(huì)統(tǒng)計(jì)NormalEquationsinReducedFoNormalEquationsinReducedForm觀念解聯(lián)立方程式:?Ming-chiChen28社會(huì)統(tǒng)計(jì)NormalEquationsinReducedFoNormalEquationsinReducedForm觀念解聯(lián)立方程式:?Ming-chiChen29社會(huì)統(tǒng)計(jì)NormalEquationsinReducedFo觀念?Ming-chiChen30社會(huì)統(tǒng)計(jì)觀念?Ming-chiChen30社會(huì)統(tǒng)計(jì)一般化迴歸模型的假設(shè)條件依變數(shù)Yi為隨機(jī)變數(shù),自變數(shù)(Xi,i=1,…,k)為預(yù)先選定的變數(shù)。ZeroMean:E(ei)=0Homoscedasticity:e2isthesameforallvalueofindependentvariable.Normality:ei為常態(tài)分配Noserialcorrelation:E(eiej)=0,ijIndependentofeiandxij:E(eixij)=0?Ming-chiChen31社會(huì)統(tǒng)計(jì)一般化迴歸模型的假設(shè)條件依變數(shù)Yi為隨機(jī)變數(shù),自變數(shù)(Xi,一般化迴歸模型的假設(shè)條件Noperfectmulticollinearity:itisnotpossibletofindasetofnumbersc0,c1,…cksuchthat?樣本數(shù)n>k+1,在複迴歸模型若有k個(gè)自變數(shù),則有k+1(包括截距α)個(gè)迴歸參數(shù),此時(shí)利用樣本來(lái)估計(jì)迴歸參數(shù)時(shí),樣本數(shù)必須大於k+1個(gè)。?Ming-chiChen32社會(huì)統(tǒng)計(jì)一般化迴歸模型的假設(shè)條件NoperfectmulticoTheGeneralMultipleRegressionModelb0,b1,…bkaretheleast-squaresestimatesofβ0,β1,…βkthatminimizetheresidualsumofsquares:TheGauss-MarkovTheorem:Ifthebasicassumptionshold:
b0,b1,…bkaretheunbiasedestimatesofβ0,β1,…,βkb0,b1,…bkhavetheminimumvariancesamongtheclassoflinearunbiasedestimators母體迴歸線樣本迴歸線?Ming-chiChen33社會(huì)統(tǒng)計(jì)TheGeneralMultipleRegressioEstimatedStandardErrorofRegression如同在簡(jiǎn)單迴歸中,為了要做假設(shè)檢定,我們必須要估計(jì)e2。在簡(jiǎn)單迴歸中,我們知道S2e=SSE/(n-2)為e2的不偏估計(jì)式。同理,在複迴歸中,S2e=SSE/(n-(K+1))為e2的不偏估計(jì)式。其中n為樣本數(shù),(K+1)為所欲估計(jì)的未知數(shù)(即K個(gè)自變數(shù)加上一個(gè)常數(shù)項(xiàng))。
?Ming-chiChen34社會(huì)統(tǒng)計(jì)EstimatedStandardErrorofReEstimatedStandardErrorofRegressionSSE的一般性公式:?Ming-chiChen35社會(huì)統(tǒng)計(jì)EstimatedStandardErrorofRePartitionofTotalSumofSquares觀念多元迴歸中,SST=SSR+SSE仍然成立e與x1及x2不相關(guān)?Ming-chiChen36社會(huì)統(tǒng)計(jì)PartitionofTotalSumofSquaPartitionofTotalSumofSquares觀念SST=SSE+SSR?Ming-chiChen37社會(huì)統(tǒng)計(jì)PartitionofTotalSumofSquaSumofSquareduetoRegression觀念代入以大寫(xiě)字母來(lái)表示與平均值間的差異。?Ming-chiChen38社會(huì)統(tǒng)計(jì)SumofSquareduetoRegressioSumofSquareduetoRegression觀念?Ming-chiChen39社會(huì)統(tǒng)計(jì)SumofSquareduetoRegressioCoefficientofDeterminationR2判定係數(shù)用來(lái)衡量迴歸方程式的配合度或解釋力?Ming-chiChen40社會(huì)統(tǒng)計(jì)CoefficientofDeterminationRAdjustedRsquare如果樣本數(shù)小或自變項(xiàng)個(gè)數(shù)增加,會(huì)使自由度變小,因此判定係數(shù)R2會(huì)高估。亦即在複迴歸模型中若不斷加入與模型無(wú)關(guān)的解釋變數(shù)時(shí),R2會(huì)提高一些,不能代表迴歸模型的解釋能力。需要調(diào)整複判定係數(shù)(adjustedcoefficientofmultipledetermination)主要調(diào)整的是自由度?Ming-chiChen41社會(huì)統(tǒng)計(jì)AdjustedRsquare如果樣本數(shù)小或自變項(xiàng)個(gè)數(shù)增AdjustedRsquare?Ming-chiChen42社會(huì)統(tǒng)計(jì)AdjustedRsquare?Ming-chiCheAdjustedRsquare?Ming-chiChen43社會(huì)統(tǒng)計(jì)AdjustedRsquare?Ming-chiCheAdjustedRsquare?Ming-chiChen44社會(huì)統(tǒng)計(jì)AdjustedRsquare?Ming-chiCheMeasuringGoodnessoffit在複迴歸中,可利用F檢定迴歸方程式中所有的自變數(shù)對(duì)於依變數(shù)Y是否有聯(lián)合的解釋能力: H0:迴歸方程式無(wú)解釋能力β0=β1=β2=…=βK=0 H1:迴歸方程式有解釋能力(β不全為零)?Ming-chiChen45社會(huì)統(tǒng)計(jì)MeasuringGoodnessoffit在複迴歸中MeasuringGoodnessoffitReject?Ming-chiChen46社會(huì)統(tǒng)計(jì)MeasuringGoodnessoffitRejec?Ming-chiChen47社會(huì)統(tǒng)計(jì)?Ming-chiChen47社會(huì)統(tǒng)計(jì)部分迴歸係數(shù)的F檢定檢定新增的IV對(duì)DV是否有影響設(shè)原複迴歸模型有k個(gè)IV,新增Q個(gè)IV,欲檢定新增的Q個(gè)IV是否對(duì)DV有影響,H0:βk+1=βk+2=…=βk+Q=0H1:H0不為真?Ming-chiChen48社會(huì)統(tǒng)計(jì)部分迴歸係數(shù)的F檢定檢定新增的IV對(duì)DV是否有影響?Ming個(gè)別迴歸參數(shù)的檢定由樣本估計(jì)出來(lái)的迴歸係數(shù)必須接受統(tǒng)計(jì)檢定,以了解母體參數(shù)的真實(shí)性質(zhì)(從樣本得到這樣的係數(shù),是否意味著母體參數(shù)不為零)。若母體迴歸變異數(shù)σ2已知,則利用Z分配進(jìn)行檢定或區(qū)間估計(jì)。但如果σ2未知,用樣本變異數(shù)S2Y|XZ(也就是Se2)來(lái)代替,進(jìn)行t檢定。?Ming-chiChen49社會(huì)統(tǒng)計(jì)個(gè)別迴歸參數(shù)的檢定由樣本估計(jì)出來(lái)的迴歸係數(shù)必須接受統(tǒng)計(jì)檢定,樣本誤差值變異數(shù)Se2?Ming-chiChen50社會(huì)統(tǒng)計(jì)樣本誤差值變異數(shù)Se2?Ming-chiChen50社會(huì)統(tǒng)二元迴歸係數(shù)的變異數(shù)?Ming-chiChen51社會(huì)統(tǒng)計(jì)二元迴歸係數(shù)的變異數(shù)?Ming-chiChen51社會(huì)統(tǒng)計(jì)假設(shè)檢定迴歸係數(shù)檢定所要檢定的假設(shè)?Ming-chiChen52社會(huì)統(tǒng)計(jì)假設(shè)檢定迴歸係數(shù)檢定所要檢定的假設(shè)?Ming-chiChe迴歸係數(shù)的t檢定?Ming-chiChen53社會(huì)統(tǒng)計(jì)迴歸係數(shù)的t檢定?Ming-chiChen53社會(huì)統(tǒng)計(jì)Stata複迴歸結(jié)果===///?Ming-chiChen54社會(huì)統(tǒng)計(jì)Stata複迴歸結(jié)果===///?Ming-chiChenConfidenceIntervalsandtestsofhypotheses每一個(gè)β之95%信賴區(qū)間:自變數(shù)個(gè)數(shù)?Ming-chiChen55社會(huì)統(tǒng)計(jì)ConfidenceIntervalsandtestsStata複迴歸結(jié)果?Ming-chiChen56社會(huì)統(tǒng)計(jì)Stata複迴歸結(jié)果?Ming-chiChen56社會(huì)統(tǒng)計(jì)複迴歸分析的統(tǒng)計(jì)預(yù)測(cè):預(yù)測(cè)母體依變項(xiàng)的平均值信賴區(qū)間?Ming-chiChen57社會(huì)統(tǒng)計(jì)複迴歸分析的統(tǒng)計(jì)預(yù)測(cè):預(yù)測(cè)母體依變項(xiàng)的平均值信賴區(qū)間?Min複迴歸分析的統(tǒng)計(jì)預(yù)測(cè):預(yù)測(cè)母體依變項(xiàng)的信賴區(qū)間?Ming-chiChen58社會(huì)統(tǒng)計(jì)複迴歸分析的統(tǒng)計(jì)預(yù)測(cè):預(yù)測(cè)母體依變項(xiàng)的信賴區(qū)間?Ming-cStata求預(yù)測(cè)值?Ming-chiChen59社會(huì)統(tǒng)計(jì)Stata求預(yù)測(cè)值?Ming-chiChen59社會(huì)統(tǒng)計(jì)Stata求預(yù)測(cè)值?Ming-chiChen60社會(huì)統(tǒng)計(jì)Stata求預(yù)測(cè)值?Ming-chiChen60社會(huì)統(tǒng)計(jì)預(yù)測(cè)母體依變項(xiàng)平均值的信賴區(qū)間?在Stata裡用predict新變數(shù)名稱,stdp這個(gè)指令來(lái)求對(duì)應(yīng)數(shù)值。?predictstderr,stdp?Ming-chiChen61社會(huì)統(tǒng)計(jì)預(yù)測(cè)母體依變項(xiàng)平均值的信賴區(qū)間?在Stata裡用predi母體預(yù)測(cè)值平均E(Y|X)或μy的95%信賴區(qū)間先求出t值,要知道自由度在31-3=28下,α=0.05的t值。在Stata中,用invttail(28,.05/2)generateyhatll=yhat-stderr*invttail(28,.05/2)這是信賴下界generateyhatul=yhat+stderr*invttail(28,.05/2)這是信賴上界?Ming-chiChen社會(huì)統(tǒng)計(jì)?Ming-chiChen62社會(huì)統(tǒng)計(jì)母體預(yù)測(cè)值平均E(Y|X)或μy的95%信賴區(qū)間先求出t值,Stata中求對(duì)應(yīng)特定Xp預(yù)測(cè)母體值的標(biāo)準(zhǔn)差?Ming-chiChen社會(huì)統(tǒng)計(jì)?
在Stata裡用predict新變數(shù)名稱,stdf這個(gè)指令來(lái)求對(duì)應(yīng)數(shù)值。這裡和前面略有不同。?predictstderrf,stdf?Ming-chiChen63社會(huì)統(tǒng)計(jì)Stata中求對(duì)應(yīng)特定Xp預(yù)測(cè)母體值的標(biāo)準(zhǔn)差?Ming-ch母體預(yù)測(cè)值Y-hat的95%信賴區(qū)間先求出t值,要知道自由度在31-3=28下,α=0.05的t值。在Stata中,用invttail(28,.05/2)generateyhatllf=yhat-stderrf*invttail(28,.05/2)這是信賴下界Generateyhatulf=yhat+stderrf*invttail(28,.05/2)這是信賴上界?Ming-chiChen社會(huì)統(tǒng)計(jì)?Ming-chiChen64社會(huì)統(tǒng)計(jì)母體預(yù)測(cè)值Y-hat的95%信賴區(qū)間先求出t值,要知道自由度複迴歸模型中解釋變數(shù)的相對(duì)重要性複迴歸模型中,各個(gè)IV的相對(duì)重要性國(guó)家在教育上的投入(0.0045)還是人口數(shù)目(0.00049)對(duì)中國(guó)各省市的平均餘命的影響比較重要?迴歸係數(shù)不能直接比較。因?yàn)閱挝徊煌?Ming-chiChen65社會(huì)統(tǒng)計(jì)複迴歸模型中解釋變數(shù)的相對(duì)重要性複迴歸模型中,各個(gè)IV的相對(duì)複迴歸模型中解釋辨識(shí)的相對(duì)重要性我們可以用標(biāo)準(zhǔn)差來(lái)把迴歸係數(shù)化成同樣單位標(biāo)準(zhǔn)化的迴歸係數(shù)又稱為beta-coefficientsIV變動(dòng)一個(gè)標(biāo)準(zhǔn)差,DV變動(dòng)的標(biāo)準(zhǔn)差數(shù)。?Ming-chiChen66社會(huì)統(tǒng)計(jì)複迴歸模型中解釋辨識(shí)的相對(duì)重要性我們可以用標(biāo)準(zhǔn)差來(lái)把迴歸係數(shù)Stata求標(biāo)準(zhǔn)化迴歸係數(shù)?Ming-chiChen67社會(huì)統(tǒng)計(jì)Stata求標(biāo)準(zhǔn)化迴歸係數(shù)?Ming-chiChen67社Stata求標(biāo)準(zhǔn)化迴歸係數(shù)哪一個(gè)IV影響比較大??Ming-chiChen68社會(huì)統(tǒng)計(jì)Stata求標(biāo)準(zhǔn)化迴歸係數(shù)哪一個(gè)IV影響比較大??Ming-虛擬變數(shù)DummyVariables在迴歸方程式中,我們假設(shè)所有的變數(shù)皆為連續(xù)變數(shù)。如果遇到名目尺度變數(shù),我們可以用虛擬變數(shù)來(lái)進(jìn)行分析。虛擬變數(shù)(D)又稱為類別變數(shù)(categoricalvariables),通常以(0,1)來(lái)區(qū)別類別。如男性D=1,女性D=0觀念?Ming-chiChen69社會(huì)統(tǒng)計(jì)虛擬變數(shù)DummyVariables在迴歸方程式中,我們假虛擬變數(shù)DummyVariables虛擬變數(shù)可以用來(lái)比較下列效果:Temporaleffect時(shí)間效果:戰(zhàn)時(shí)vs.平時(shí),顛峰vs.非顛峰,假日vs.週間Spatialeffects地區(qū)效果:都市vs.鄉(xiāng)村Qaulitativevariables質(zhì)性變數(shù):已婚vs.未婚,男性vs.女性,白人vs.非白人Broadgroupingsofqualitativevariables化約變數(shù)。觀念?Ming-chiChen70社會(huì)統(tǒng)計(jì)虛擬變數(shù)DummyVariables虛擬變數(shù)可以用來(lái)比較下虛擬變數(shù)DummyVariablesBasecase比較基底(或referencegroup參考組)當(dāng)虛擬變數(shù)為0時(shí)的所有觀察值。因此虛擬變數(shù)的迴歸係數(shù)衡量比較基底與非比較基底兩群樣本之間的差異。觀念?Ming-chiChen71社會(huì)統(tǒng)計(jì)虛擬變數(shù)DummyVariablesBasecase比較虛擬變數(shù)DummyVariables觀念?Ming-chiChen72社會(huì)統(tǒng)計(jì)虛擬變數(shù)DummyVariables觀念?Ming-chi虛擬變數(shù)DummyVariables觀念當(dāng)D=0時(shí),當(dāng)D=1時(shí),?Ming-chiChen73社會(huì)統(tǒng)計(jì)虛擬變數(shù)DummyVariables觀念當(dāng)D=0時(shí),當(dāng)D=虛擬變數(shù)DummyVariablesYX教育年數(shù)家務(wù)時(shí)數(shù)?Ming-chiChen74社會(huì)統(tǒng)計(jì)虛擬變數(shù)DummyVariablesYX教育年數(shù)家務(wù)時(shí)數(shù)?Stata與虛擬變數(shù)打開(kāi)85q1-family.dta依變項(xiàng)為j2,注意缺失值定義和每週家務(wù)工作168小時(shí)的轉(zhuǎn)換(=112小時(shí))在Stata裡產(chǎn)生虛擬變數(shù)以a1受訪者的性別為例taba1,gen(sex)這裡逗點(diǎn)之後的gen就是要求Stata從a1來(lái)產(chǎn)生一個(gè)名叫sex1(原本是a1=1男生)和sex2這兩個(gè)虛擬變數(shù)當(dāng)然我們只需要用到sex1,而把女生當(dāng)作對(duì)照組還有用婚姻狀態(tài)a5產(chǎn)生wed1(未婚)這個(gè)虛擬變數(shù)(把a(bǔ)5=3定義為缺失)我另外用eduy這個(gè)關(guān)於教育年數(shù)(小學(xué)及以下為6,初中9,高中12,大專及以上16)的連續(xù)變數(shù)。作法是generateeduy=6ifb1==1…?Ming-chiChen75社會(huì)統(tǒng)計(jì)Stata與虛擬變數(shù)打開(kāi)85q1-family.dta?MiStata與虛擬變數(shù)sex1=1為男生,sex1=0是對(duì)照組女生?Ming-chiChen76社會(huì)統(tǒng)計(jì)Stata與虛擬變數(shù)sex1=1為男生,sex1=0是對(duì)照Stata與虛擬變數(shù)?Ming-chiChen77社會(huì)統(tǒng)計(jì)Stata與虛擬變數(shù)?Ming-chiChen77社會(huì)統(tǒng)計(jì)虛擬變數(shù)的推論統(tǒng)計(jì)包括男性這個(gè)虛擬變數(shù)在內(nèi)的所有變數(shù)的迴歸係數(shù)都顯著,可以拒絕虛無(wú)假設(shè)(係數(shù)等於零)?Ming-chiChen78社會(huì)統(tǒng)計(jì)虛擬變數(shù)的推論統(tǒng)計(jì)包括男性這個(gè)虛擬變數(shù)在內(nèi)的所有變數(shù)的迴歸係虛擬變數(shù)DummyVariables觀念當(dāng)男性=0時(shí)(女性)當(dāng)男性=1時(shí)(男性)?Ming-chiChen79社會(huì)統(tǒng)計(jì)虛擬變數(shù)DummyVariables觀念當(dāng)男性=0時(shí)(女性虛擬變數(shù)DummyVariables?Ming-chiChen80社會(huì)統(tǒng)計(jì)虛擬變數(shù)DummyVariables?Ming-chiC兩個(gè)虛擬變數(shù)的迴歸?Ming-chiChen81社會(huì)統(tǒng)計(jì)兩個(gè)虛擬變數(shù)的迴歸?Ming-chiChen81社會(huì)統(tǒng)計(jì)兩個(gè)虛擬變數(shù)的迴歸未婚男性未婚女性已婚男性已婚女性?Ming-chiChen82社會(huì)統(tǒng)計(jì)兩個(gè)虛擬變數(shù)的迴歸未婚男性未婚女性已婚男性已婚女性?Ming兩個(gè)以上類別的虛擬變數(shù)當(dāng)所欲比較的類別超過(guò)兩個(gè)時(shí),必須在迴歸方程式中加入K-1個(gè)虛擬變數(shù),K為類別數(shù)。?Ming-chiChen83社會(huì)統(tǒng)計(jì)兩個(gè)以上類別的虛擬變數(shù)當(dāng)所欲比較的類別超過(guò)兩個(gè)時(shí),必須在迴歸兩個(gè)以上類別的虛擬變數(shù)當(dāng)所有的類別虛擬變數(shù)為0時(shí),為比較基底組(參考組)的迴歸線。?Ming-chiChen84社會(huì)統(tǒng)計(jì)兩個(gè)以上類別的虛擬變數(shù)當(dāng)所有的類別虛擬變數(shù)為0時(shí),為比較基底族群虛擬變數(shù)的推論統(tǒng)計(jì)族群的虛擬變數(shù)都未達(dá)顯著水準(zhǔn),可見(jiàn)得對(duì)家務(wù)時(shí)數(shù)沒(méi)有影響。?Ming-chiChen85社會(huì)統(tǒng)計(jì)族群虛擬變數(shù)的推論統(tǒng)計(jì)族群的虛擬變數(shù)都未達(dá)顯著水準(zhǔn),可見(jiàn)得對(duì)比較基底組的選擇究竟哪一組當(dāng)作比較基底最好沒(méi)有一定的答案,一般的選擇原則為:(1)最大人數(shù)組為基底。(2)不要以「其他」類別為基底。(3)人數(shù)過(guò)少的組別不要當(dāng)基底。(4)同質(zhì)性最高的為基底,即標(biāo)準(zhǔn)差最小的組。?Ming-chiChen86社會(huì)統(tǒng)計(jì)比較基底組的選擇究竟哪一組當(dāng)作比較基底最好沒(méi)有一定的答案,一Interactionwithdummyvariable另外一種常見(jiàn)的非線性關(guān)係稱為交互作用(interaction)。在線性迴歸模型中,每一個(gè)自變數(shù)對(duì)於依變數(shù)的影響為固定的,每單位X1的變動(dòng),永遠(yuǎn)造成B1單位Y的變動(dòng)。但有時(shí)候x在不同情況下,可能對(duì)Y的影響大小並不同。?Ming-chiChen87社會(huì)統(tǒng)計(jì)InteractionwithdummyvariablInteractionwithdummyvariable所謂交互作用,指的是x1對(duì)y的影響,決定於x2的數(shù)值?;蛘哒f(shuō)在不同的x2水準(zhǔn)下,x1對(duì)Y有不同的影響?,F(xiàn)實(shí)世界中常有類似的交互作用出現(xiàn):例如學(xué)歷對(duì)於收入的影響決定與個(gè)人的聰明才智(聰明人較能發(fā)揮學(xué)歷的效用)年資對(duì)於薪資的影響在公務(wù)員、醫(yī)生、農(nóng)人等不同職業(yè)類別中並不相同。?Ming-chiChen88社會(huì)統(tǒng)計(jì)InteractionwithdummyvariablInteractionwithdummyvariable欲測(cè)試x1,x2是否存在交互作用,僅需將x1及x2兩變數(shù)相乘後放入模型中即可。若x1,x2存在交互作用,則B3的統(tǒng)計(jì)檢定會(huì)顯著不同於零。?Ming-chiChen89社會(huì)統(tǒng)計(jì)Interactionwithdummyvariabl虛擬變數(shù)DummyVariables+交叉觀念當(dāng)D=0時(shí),當(dāng)D=1時(shí),?Ming-chiChen90社會(huì)統(tǒng)計(jì)虛擬變數(shù)DummyVariables+交叉觀念當(dāng)D=0虛擬變數(shù)DummyVariables+交叉產(chǎn)生交互作用項(xiàng)到達(dá)顯著水準(zhǔn)?Ming-chiChen91社會(huì)統(tǒng)計(jì)虛擬變數(shù)DummyVariables+交叉產(chǎn)生交互作用男女不同的教育效果?Ming-chiChen92社會(huì)統(tǒng)計(jì)男女不同的教育效果?Ming-chiChen92社會(huì)統(tǒng)計(jì)男女不同的教育效果斜率和截距都有所不同?Ming-chiChen93社會(huì)統(tǒng)計(jì)男女不同的教育效果斜率和截距都有所不同?Ming-chiCModelsinvolvingpolynomials在迴歸方程式中,有時(shí)自變數(shù)以二次項(xiàng)(parabola)或三次項(xiàng)(cubicpolynomial)的型態(tài)出現(xiàn)。X年資收入?Ming-chiChen94社會(huì)統(tǒng)計(jì)Modelsinvolvingpolynomials在迴Modelsinvolvingpolynomials?Ming-chiChen95社會(huì)統(tǒng)計(jì)Modelsinvolvingpolynomials?M中級(jí)社會(huì)統(tǒng)計(jì)第十三講複迴歸分析?Ming-chiChenPage.96社會(huì)統(tǒng)計(jì)中級(jí)社會(huì)統(tǒng)計(jì)第十三講?Ming-chiChenPage.1複迴歸分析前面我們學(xué)到只有一個(gè)自變項(xiàng)的簡(jiǎn)單迴歸分析我們知道一個(gè)地區(qū)的人均病床數(shù)會(huì)影響到該地區(qū)的平均餘命我們也知道一個(gè)地區(qū)的人均教育支出會(huì)影響該地區(qū)的平均餘命但是如果教育支出相等的條件下,醫(yī)療資源的多寡會(huì)不會(huì)影響平均壽命??jī)烧呤胼p孰重?控制的概念(在其他條件不變的情況下)?Ming-chiChen97社會(huì)統(tǒng)計(jì)複迴歸分析前面我們學(xué)到只有一個(gè)自變項(xiàng)的簡(jiǎn)單迴歸分析?Ming複迴歸分析研究?jī)蓚€(gè)或兩個(gè)以上的IV對(duì)DV的影響的分析方式,稱為複迴歸分析(multipleregressionanalysis)又稱多元迴歸分析迴歸方程式?Ming-chiChen98社會(huì)統(tǒng)計(jì)複迴歸分析研究?jī)蓚€(gè)或兩個(gè)以上的IV對(duì)DV的影響的分析方式,稱多元迴歸MultipleRegressionModels統(tǒng)計(jì)成績(jī)與努力(所花時(shí)間)的關(guān)係如下:觀念?Ming-chiChen99社會(huì)統(tǒng)計(jì)多元迴歸MultipleRegressionModels多元迴歸MultipleRegressionModels兩者的迴歸線:觀念?Ming-chiChen100社會(huì)統(tǒng)計(jì)多元迴歸MultipleRegressionModels多元迴歸MultipleRegressionModels將學(xué)生對(duì)於數(shù)理科目的興趣納入考量發(fā)現(xiàn):觀念x2=30x2=20x2=10?Ming-chiChen101社會(huì)統(tǒng)計(jì)多元迴歸MultipleRegressionModels多元迴歸MultipleRegressionModels如果我們針對(duì)具有相同興趣水準(zhǔn)的學(xué)生來(lái)考量努力與成績(jī)的關(guān)係,則可以分別用三個(gè)迴歸線來(lái)表達(dá):觀念?Ming-chiChen102社會(huì)統(tǒng)計(jì)多元迴歸MultipleRegressionModels多元迴歸MultipleRegressionModels這三條線的斜率似乎沒(méi)有原本迴歸線來(lái)得大,表示努力與成績(jī)的關(guān)係有一部份是受到興趣的干擾(confounding):有興趣的學(xué)生通?;ū容^多的時(shí)間觀念?Ming-chiChen103社會(huì)統(tǒng)計(jì)多元迴歸MultipleRegressionModels多元迴歸MultipleRegressionModels此時(shí)利用多元迴歸比簡(jiǎn)單迴歸可以算出三條簡(jiǎn)單迴歸的「平均斜率」。觀念?Ming-chiChen104社會(huì)統(tǒng)計(jì)多元迴歸MultipleRegressionModels多元迴歸MultipleRegressionModels多元迴歸用來(lái)分析一個(gè)以上自變數(shù)對(duì)於依變數(shù)的影響,可以看出「其他變數(shù)不變(常數(shù))」的條件下,某一個(gè)變數(shù)對(duì)於依變數(shù)產(chǎn)生的「淨(jìng)」影響為何?觀念?Ming-chiChen105社會(huì)統(tǒng)計(jì)多元迴歸MultipleRegressionModelsPartialDerivative偏微分觀念觀念經(jīng)濟(jì)學(xué)說(shuō)我們對(duì)於某商品的需求量與價(jià)格及所得有關(guān):在所得不變的條件下,商品價(jià)格x1變動(dòng),對(duì)於需求量y有何影響??Ming-chiChen106社會(huì)統(tǒng)計(jì)PartialDerivative偏微分觀念觀念經(jīng)濟(jì)學(xué)說(shuō)我PartialDerivative偏微分觀念觀念假設(shè)所得固定為100,因?yàn)閮r(jià)格變動(dòng)所造成的商品需求變動(dòng)可以表為:帶入原來(lái)的函數(shù):?Ming-chiChen107社會(huì)統(tǒng)計(jì)PartialDerivative偏微分觀念觀念假設(shè)所得固PartialDerivative偏微分觀念觀念如果我們將x1切割成很小的單位,則每個(gè)極小單為的變動(dòng)所造成的q變動(dòng)為:在x2不變(保持恆定)的情況下,x1的變動(dòng)所造成y的變動(dòng)?Ming-chiChen108社會(huì)統(tǒng)計(jì)PartialDerivative偏微分觀念觀念如果我們將PartialDerivative偏微分觀念觀念X2所得X1價(jià)格y需求三個(gè)以上的自變數(shù)在三度空間上無(wú)法表達(dá)。二個(gè)自變數(shù)的多元迴歸分析在於設(shè)法找出最合適資料分佈的一個(gè)平面。?Ming-chiChen109社會(huì)統(tǒng)計(jì)PartialDerivative偏微分觀念觀念X2所得X多元迴歸的參數(shù)推估求多元迴歸x1與x2的係數(shù)?我們可以將所有的觀察值y視為x1與x2的線性函數(shù)加上誤差值e多元迴歸的預(yù)測(cè)值可以表為:?Ming-chiChen110社會(huì)統(tǒng)計(jì)多元迴歸的參數(shù)推估求多元迴歸x1與x2的係數(shù)?我們可以將所有TheNormalEquation觀念X2所得X1價(jià)格y需求求使e2最小的平面?Ming-chiChen111社會(huì)統(tǒng)計(jì)TheNormalEquation觀念X2所得X1價(jià)格yTheNormalEquation觀念求MinimumQ?將(1)式分別對(duì)a,b1,b2做偏微分,再將所得之方程式設(shè)為零,然後求解聯(lián)立方程式即可求得最小值。?Ming-chiChen112社會(huì)統(tǒng)計(jì)TheNormalEquation觀念求MinimumTheNormalEquation觀念e總和為零e與x1及x2不相關(guān)(uncorrelated)?Ming-chiChen113社會(huì)統(tǒng)計(jì)TheNormalEquation觀念e總和為零e與x1BasicRulesforDifferentiationRule8:thechainrule複習(xí)?Ming-chiChen114社會(huì)統(tǒng)計(jì)BasicRulesforDifferentiatioExampleofchainrule複習(xí)?Ming-chiChen115社會(huì)統(tǒng)計(jì)Exampleofchainrule複習(xí)?Ming-c微分求迴歸係數(shù)?Ming-chiChen116社會(huì)統(tǒng)計(jì)微分求迴歸係數(shù)?Ming-chiChen21社會(huì)統(tǒng)計(jì)?Ming-chiChen117社會(huì)統(tǒng)計(jì)?Ming-chiChen22社會(huì)統(tǒng)計(jì)TheNormalEquation觀念?Ming-chiChen118社會(huì)統(tǒng)計(jì)TheNormalEquation觀念?Ming-chiTheNormalEquation觀念SumAverage?Ming-chiChen119社會(huì)統(tǒng)計(jì)TheNormalEquation觀念SumAveragTheNormalEquation觀念SumAverage?Ming-chiChen120社會(huì)統(tǒng)計(jì)TheNormalEquation觀念SumAveragTheNormalEquation觀念迴歸平面通過(guò)中心點(diǎn):?Ming-chiChen121社會(huì)統(tǒng)計(jì)TheNormalEquation觀念迴歸平面通過(guò)中心點(diǎn)NormalEquationsinReducedForm觀念若將所有變數(shù)都以「離均值」來(lái)表示求b1,b2等於:?Ming-chiChen122社會(huì)統(tǒng)計(jì)NormalEquationsinReducedFoNormalEquationsinReducedForm觀念解聯(lián)立方程式:?Ming-chiChen123社會(huì)統(tǒng)計(jì)NormalEquationsinReducedFoNormalEquationsinReducedForm觀念解聯(lián)立方程式:?Ming-chiChen124社會(huì)統(tǒng)計(jì)NormalEquationsinReducedFo觀念?Ming-chiChen125社會(huì)統(tǒng)計(jì)觀念?Ming-chiChen30社會(huì)統(tǒng)計(jì)一般化迴歸模型的假設(shè)條件依變數(shù)Yi為隨機(jī)變數(shù),自變數(shù)(Xi,i=1,…,k)為預(yù)先選定的變數(shù)。ZeroMean:E(ei)=0Homoscedasticity:e2isthesameforallvalueofindependentvariable.Normality:ei為常態(tài)分配Noserialcorrelation:E(eiej)=0,ijIndependentofeiandxij:E(eixij)=0?Ming-chiChen126社會(huì)統(tǒng)計(jì)一般化迴歸模型的假設(shè)條件依變數(shù)Yi為隨機(jī)變數(shù),自變數(shù)(Xi,一般化迴歸模型的假設(shè)條件Noperfectmulticollinearity:itisnotpossibletofindasetofnumbersc0,c1,…cksuchthat?樣本數(shù)n>k+1,在複迴歸模型若有k個(gè)自變數(shù),則有k+1(包括截距α)個(gè)迴歸參數(shù),此時(shí)利用樣本來(lái)估計(jì)迴歸參數(shù)時(shí),樣本數(shù)必須大於k+1個(gè)。?Ming-chiChen127社會(huì)統(tǒng)計(jì)一般化迴歸模型的假設(shè)條件NoperfectmulticoTheGeneralMultipleRegressionModelb0,b1,…bkaretheleast-squaresestimatesofβ0,β1,…βkthatminimizetheresidualsumofsquares:TheGauss-MarkovTheorem:Ifthebasicassumptionshold:
b0,b1,…bkaretheunbiasedestimatesofβ0,β1,…,βkb0,b1,…bkhavetheminimumvariancesamongtheclassoflinearunbiasedestimators母體迴歸線樣本迴歸線?Ming-chiChen128社會(huì)統(tǒng)計(jì)TheGeneralMultipleRegressioEstimatedStandardErrorofRegression如同在簡(jiǎn)單迴歸中,為了要做假設(shè)檢定,我們必須要估計(jì)e2。在簡(jiǎn)單迴歸中,我們知道S2e=SSE/(n-2)為e2的不偏估計(jì)式。同理,在複迴歸中,S2e=SSE/(n-(K+1))為e2的不偏估計(jì)式。其中n為樣本數(shù),(K+1)為所欲估計(jì)的未知數(shù)(即K個(gè)自變數(shù)加上一個(gè)常數(shù)項(xiàng))。
?Ming-chiChen129社會(huì)統(tǒng)計(jì)EstimatedStandardErrorofReEstimatedStandardErrorofRegressionSSE的一般性公式:?Ming-chiChen130社會(huì)統(tǒng)計(jì)EstimatedStandardErrorofRePartitionofTotalSumofSquares觀念多元迴歸中,SST=SSR+SSE仍然成立e與x1及x2不相關(guān)?Ming-chiChen131社會(huì)統(tǒng)計(jì)PartitionofTotalSumofSquaPartitionofTotalSumofSquares觀念SST=SSE+SSR?Ming-chiChen132社會(huì)統(tǒng)計(jì)PartitionofTotalSumofSquaSumofSquareduetoRegression觀念代入以大寫(xiě)字母來(lái)表示與平均值間的差異。?Ming-chiChen133社會(huì)統(tǒng)計(jì)SumofSquareduetoRegressioSumofSquareduetoRegression觀念?Ming-chiChen134社會(huì)統(tǒng)計(jì)SumofSquareduetoRegressioCoefficientofDeterminationR2判定係數(shù)用來(lái)衡量迴歸方程式的配合度或解釋力?Ming-chiChen135社會(huì)統(tǒng)計(jì)CoefficientofDeterminationRAdjustedRsquare如果樣本數(shù)小或自變項(xiàng)個(gè)數(shù)增加,會(huì)使自由度變小,因此判定係數(shù)R2會(huì)高估。亦即在複迴歸模型中若不斷加入與模型無(wú)關(guān)的解釋變數(shù)時(shí),R2會(huì)提高一些,不能代表迴歸模型的解釋能力。需要調(diào)整複判定係數(shù)(adjustedcoefficientofmultipledetermination)主要調(diào)整的是自由度?Ming-chiChen136社會(huì)統(tǒng)計(jì)AdjustedRsquare如果樣本數(shù)小或自變項(xiàng)個(gè)數(shù)增AdjustedRsquare?Ming-chiChen137社會(huì)統(tǒng)計(jì)AdjustedRsquare?Ming-chiCheAdjustedRsquare?Ming-chiChen138社會(huì)統(tǒng)計(jì)AdjustedRsquare?Ming-chiCheAdjustedRsquare?Ming-chiChen139社會(huì)統(tǒng)計(jì)AdjustedRsquare?Ming-chiCheMeasuringGoodnessoffit在複迴歸中,可利用F檢定迴歸方程式中所有的自變數(shù)對(duì)於依變數(shù)Y是否有聯(lián)合的解釋能力: H0:迴歸方程式無(wú)解釋能力β0=β1=β2=…=βK=0 H1:迴歸方程式有解釋能力(β不全為零)?Ming-chiChen140社會(huì)統(tǒng)計(jì)MeasuringGoodnessoffit在複迴歸中MeasuringGoodnessoffitReject?Ming-chiChen141社會(huì)統(tǒng)計(jì)MeasuringGoodnessoffitRejec?Ming-chiChen142社會(huì)統(tǒng)計(jì)?Ming-chiChen47社會(huì)統(tǒng)計(jì)部分迴歸係數(shù)的F檢定檢定新增的IV對(duì)DV是否有影響設(shè)原複迴歸模型有k個(gè)IV,新增Q個(gè)IV,欲檢定新增的Q個(gè)IV是否對(duì)DV有影響,H0:βk+1=βk+2=…=βk+Q=0H1:H0不為真?Ming-chiChen143社會(huì)統(tǒng)計(jì)部分迴歸係數(shù)的F檢定檢定新增的IV對(duì)DV是否有影響?Ming個(gè)別迴歸參數(shù)的檢定由樣本估計(jì)出來(lái)的迴歸係數(shù)必須接受統(tǒng)計(jì)檢定,以了解母體參數(shù)的真實(shí)性質(zhì)(從樣本得到這樣的係數(shù),是否意味著母體參數(shù)不為零)。若母體迴歸變異數(shù)σ2已知,則利用Z分配進(jìn)行檢定或區(qū)間估計(jì)。但如果σ2未知,用樣本變異數(shù)S2Y|XZ(也就是Se2)來(lái)代替,進(jìn)行t檢定。?Ming-chiChen144社會(huì)統(tǒng)計(jì)個(gè)別迴歸參數(shù)的檢定由樣本估計(jì)出來(lái)的迴歸係數(shù)必須接受統(tǒng)計(jì)檢定,樣本誤差值變異數(shù)Se2?Ming-chiChen145社會(huì)統(tǒng)計(jì)樣本誤差值變異數(shù)Se2?Ming-chiChen50社會(huì)統(tǒng)二元迴歸係數(shù)的變異數(shù)?Ming-chiChen146社會(huì)統(tǒng)計(jì)二元迴歸係數(shù)的變異數(shù)?Ming-chiChen51社會(huì)統(tǒng)計(jì)假設(shè)檢定迴歸係數(shù)檢定所要檢定的假設(shè)?Ming-chiChen147社會(huì)統(tǒng)計(jì)假設(shè)檢定迴歸係數(shù)檢定所要檢定的假設(shè)?Ming-chiChe迴歸係數(shù)的t檢定?Ming-chiChen148社會(huì)統(tǒng)計(jì)迴歸係數(shù)的t檢定?Ming-chiChen53社會(huì)統(tǒng)計(jì)Stata複迴歸結(jié)果===///?Ming-chiChen149社會(huì)統(tǒng)計(jì)Stata複迴歸結(jié)果===///?Ming-chiChenConfidenceIntervalsandtestsofhypotheses每一個(gè)β之95%信賴區(qū)間:自變數(shù)個(gè)數(shù)?Ming-chiChen150社會(huì)統(tǒng)計(jì)ConfidenceIntervalsandtestsStata複迴歸結(jié)果?Ming-chiChen151社會(huì)統(tǒng)計(jì)Stata複迴歸結(jié)果?Ming-chiChen56社會(huì)統(tǒng)計(jì)複迴歸分析的統(tǒng)計(jì)預(yù)測(cè):預(yù)測(cè)母體依變項(xiàng)的平均值信賴區(qū)間?Ming-chiChen152社會(huì)統(tǒng)計(jì)複迴歸分析的統(tǒng)計(jì)預(yù)測(cè):預(yù)測(cè)母體依變項(xiàng)的平均值信賴區(qū)間?Min複迴歸分析的統(tǒng)計(jì)預(yù)測(cè):預(yù)測(cè)母體依變項(xiàng)的信賴區(qū)間?Ming-chiChen153社會(huì)統(tǒng)計(jì)複迴歸分析的統(tǒng)計(jì)預(yù)測(cè):預(yù)測(cè)母體依變項(xiàng)的信賴區(qū)間?Ming-cStata求預(yù)測(cè)值?Ming-chiChen154社會(huì)統(tǒng)計(jì)Stata求預(yù)測(cè)值?Ming-chiChen59社會(huì)統(tǒng)計(jì)Stata求預(yù)測(cè)值?Ming-chiChen155社會(huì)統(tǒng)計(jì)Stata求預(yù)測(cè)值?Ming-chiChen60社會(huì)統(tǒng)計(jì)預(yù)測(cè)母體依變項(xiàng)平均值的信賴區(qū)間?在Stata裡用predict新變數(shù)名稱,stdp這個(gè)指令來(lái)求對(duì)應(yīng)數(shù)值。?predictstderr,stdp?Ming-chiChen156社會(huì)統(tǒng)計(jì)預(yù)測(cè)母體依變項(xiàng)平均值的信賴區(qū)間?在Stata裡用predi母體預(yù)測(cè)值平均E(Y|X)或μy的95%信賴區(qū)間先求出t值,要知道自由度在31-3=28下,α=0.05的t值。在Stata中,用invttail(28,.05/2)generateyhatll=yhat-stderr*invttail(28,.05/2)這是信賴下界generateyhatul=yhat+stderr*invttail(28,.05/2)這是信賴上界?Ming-chiChen社會(huì)統(tǒng)計(jì)?Ming-chiChen157社會(huì)統(tǒng)計(jì)母體預(yù)測(cè)值平均E(Y|X)或μy的95%信賴區(qū)間先求出t值,Stata中求對(duì)應(yīng)特定Xp預(yù)測(cè)母體值的標(biāo)準(zhǔn)差?Ming-chiChen社會(huì)統(tǒng)計(jì)?
在Stata裡用predict新變數(shù)名稱,stdf這個(gè)指令來(lái)求對(duì)應(yīng)數(shù)值。這裡和前面略有不同。?predictstderrf,stdf?Ming-chiChen158社會(huì)統(tǒng)計(jì)Stata中求對(duì)應(yīng)特定Xp預(yù)測(cè)母體值的標(biāo)準(zhǔn)差?Ming-ch母體預(yù)測(cè)值Y-hat的95%信賴區(qū)間先求出t值,要知道自由度在31-3=28下,α=0.05的t值。在Stata中,用invttail(28,.05/2)generateyhatllf=yhat-stderrf*invttail(28,.05/2)這是信賴下界Generateyhatulf=yhat+stderrf*invttail(28,.05/2)這是信賴上界?Ming-chiChen社會(huì)統(tǒng)計(jì)?Ming-chiChen159社會(huì)統(tǒng)計(jì)母體預(yù)測(cè)值Y-hat的95%信賴區(qū)間先求出t值,要知道自由度複迴歸模型中解釋變數(shù)的相對(duì)重要性複迴歸模型中,各個(gè)IV的相對(duì)重要性國(guó)家在教育上的投入(0.0045)還是人口數(shù)目(0.00049)對(duì)中國(guó)各省市的平均餘命的影響比較重要?迴歸係數(shù)不能直接比較。因?yàn)閱挝徊煌?Ming-chiChen160社會(huì)統(tǒng)計(jì)複迴歸模型中解釋變數(shù)的相對(duì)重要性複迴歸模型中,各個(gè)IV的相對(duì)複迴歸模型中解釋辨識(shí)的相對(duì)重要性我們可以用標(biāo)準(zhǔn)差來(lái)把迴歸係數(shù)化成同樣單位標(biāo)準(zhǔn)化的迴歸係數(shù)又稱為beta-coefficientsIV變動(dòng)一個(gè)標(biāo)準(zhǔn)差,DV變動(dòng)的標(biāo)準(zhǔn)差數(shù)。?Ming-chiChen161社會(huì)統(tǒng)計(jì)複迴歸模型中解釋辨識(shí)的相對(duì)重要性我們可以用標(biāo)準(zhǔn)差來(lái)把迴歸係數(shù)Stata求標(biāo)準(zhǔn)化迴歸係數(shù)?Ming-chiChen162社會(huì)統(tǒng)計(jì)Stata求標(biāo)準(zhǔn)化迴歸係數(shù)?Ming-chiChen67社Stata求標(biāo)準(zhǔn)化迴歸係數(shù)哪一個(gè)IV影響比較大??Ming-chiChen163社會(huì)統(tǒng)計(jì)Stata求標(biāo)準(zhǔn)化迴歸係數(shù)哪一個(gè)IV影響比較大??Ming-虛擬變數(shù)DummyVariables在迴歸方程式中,我們假設(shè)所有的變數(shù)皆為連續(xù)變數(shù)。如果遇到名目尺度變數(shù),我們可以用虛擬變數(shù)來(lái)進(jìn)行分析。虛擬變數(shù)(D)又稱為類別變數(shù)(categoricalvariables),通常以(0,1)來(lái)區(qū)別類別。如男性D=1,女性D=0觀念?Ming-chiChen164社會(huì)統(tǒng)計(jì)虛擬變數(shù)DummyVariables在迴歸方程式中,我們假虛擬變數(shù)DummyVariables虛擬變數(shù)可以用來(lái)比較下列效果:Temporaleffect時(shí)間效果:戰(zhàn)時(shí)vs.平時(shí),顛峰vs.非顛峰,假日vs.週間Spatialeffects地區(qū)效果:都市vs.鄉(xiāng)村Qaulitativevariables質(zhì)性變數(shù):已婚vs.未婚,男性vs.女性,白人vs.非白人Broadgroupingsofqualitativevariables化約變數(shù)。觀念?Ming-chiChen165社會(huì)統(tǒng)計(jì)虛擬變數(shù)DummyVariables虛擬變數(shù)可以用來(lái)比較下虛擬變數(shù)DummyVariablesBasecase比較基底(或referencegroup參考組)當(dāng)虛擬變數(shù)為0時(shí)的所有觀察值。因此虛擬變數(shù)的迴歸係數(shù)衡量比較基底與非比較基底兩群樣本之間的差異。觀念?Ming-chiChen166社會(huì)統(tǒng)計(jì)虛擬變數(shù)DummyVariablesBasecase比較虛擬變數(shù)DummyVariables觀念?Ming-chiChen167社會(huì)統(tǒng)計(jì)虛擬變數(shù)DummyVariables觀念?Ming-chi虛擬變數(shù)DummyVariables觀念當(dāng)D=0時(shí),當(dāng)D=1時(shí),?Ming-chiChen168社會(huì)統(tǒng)計(jì)虛擬變數(shù)DummyVariables觀念當(dāng)D=0時(shí),當(dāng)D=虛擬變數(shù)DummyVariablesYX教育年數(shù)家務(wù)時(shí)數(shù)?Ming-chiChen169社會(huì)統(tǒng)計(jì)虛擬變數(shù)DummyVariablesYX教育年數(shù)家務(wù)時(shí)數(shù)?Stata與虛擬變數(shù)打開(kāi)85q1-family.dta依變項(xiàng)為j2,注意缺失值定義和每週家務(wù)工作168小時(shí)的轉(zhuǎn)換(=112小時(shí))在Stata裡產(chǎn)生虛擬變數(shù)以a1受訪者的性別為例taba1,gen(sex)這裡逗點(diǎn)之後的gen就是要求Stata從a1來(lái)產(chǎn)生一個(gè)名叫sex1(原本是a1=1男生)和sex2這兩個(gè)虛擬變數(shù)當(dāng)然我們只需要用到s
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 整幢房屋買賣合同
- 公司向個(gè)人汽車租賃合同
- 無(wú)人機(jī)航拍與測(cè)繪服務(wù)合同
- 大學(xué)特聘教授聘任合同
- 封陽(yáng)臺(tái)合同協(xié)議書(shū)
- 建設(shè)工程合同管理復(fù)習(xí)指導(dǎo)
- 環(huán)??萍籍a(chǎn)業(yè)園區(qū)運(yùn)營(yíng)合同
- 吉首大學(xué)張家界學(xué)院《慧眼識(shí)雜草喂鹿尋童趣》2023-2024學(xué)年第二學(xué)期期末試卷
- 第12講 澳大利亞 極地地區(qū) 第2課時(shí) 教學(xué)設(shè)計(jì) 2023-2024學(xué)年高二下學(xué)期
- 廣西制造工程職業(yè)技術(shù)學(xué)院《機(jī)械設(shè)備安全學(xué)》2023-2024學(xué)年第二學(xué)期期末試卷
- 三年級(jí)體育下冊(cè)全冊(cè)教案
- 2024年八年級(jí)語(yǔ)文下冊(cè)《經(jīng)典常談》第一章《說(shuō)文解字》練習(xí)題卷附答案
- 小學(xué)科學(xué)試卷分析及改進(jìn)措施(通用6篇)
- 脫硫塔內(nèi)部(玻璃鱗片防腐涂層)維修工程施工、組織、設(shè)計(jì)方案(附:質(zhì)量、安全、環(huán)境保護(hù)措施與技術(shù)交底)
- 視頻號(hào)運(yùn)營(yíng)方案
- 發(fā)育生物學(xué)1-9章全
- (研究生)商業(yè)倫理與會(huì)計(jì)職業(yè)道德ppt教學(xué)課件(完整版)
- 中醫(yī)學(xué)課件:第三章 藏象學(xué)說(shuō)
- 山西省煤炭運(yùn)銷集團(tuán)有限公司王家?guī)X煤礦井筒工程施工組織設(shè)計(jì)
- 三年級(jí)數(shù)學(xué)下冊(cè)單元計(jì)劃【9個(gè)單元全】
- 火力發(fā)電廠水汽化學(xué)監(jiān)督導(dǎo)則
評(píng)論
0/150
提交評(píng)論