多元統(tǒng)計分析及R語言建??荚囋嚲韄第1頁
多元統(tǒng)計分析及R語言建模考試試卷_第2頁
多元統(tǒng)計分析及R語言建??荚囋嚲韄第3頁
多元統(tǒng)計分析及R語言建??荚囋嚲韄第4頁
多元統(tǒng)計分析及R語言建??荚囋嚲韄第5頁
已閱讀5頁,還剩11頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

多元統(tǒng)計分析及R語言建??荚囋嚲碚n程名稱:課程名稱: 多元統(tǒng)計分析 課程類別必修[]]選修教授課教師姓名: 王斌會 [師考試方式考試時間:__年 月 日填寫[]]閉卷試卷類別(A、B)[A]共8頁考學(xué)院(校)專業(yè)班(級)生填姓名學(xué)號寫題號題號一二三四五六七八九十總分得分得分評閱人一、簡答題〔5630得分評閱人常用的多元統(tǒng)計分析方法有哪些多元正態(tài)分布檢驗多元方差-協(xié)方差分析聚類分析判別分析主成分分析因子分析對應(yīng)分析典型相關(guān)性分析〔9〕定性數(shù)據(jù)建模分析路徑分析〔又稱多重回歸、聯(lián)立方程〕構(gòu)造方程模型聯(lián)合分析多變量圖表示法多維標度法簡潔相關(guān)分析、復(fù)相關(guān)分析和典型相關(guān)分析有何不同并舉例說明之。關(guān)關(guān)系的一種統(tǒng)計方法。例如,以X、Y分別記小學(xué)生的數(shù)學(xué)與語文成績,感興XY。復(fù)相關(guān)分析;爭論一個變量x0(x1,x2,…,xn)之間的相關(guān)程度。例如,職業(yè)聲望同時受到一系列因素〔收入、文化、權(quán)力……〕的影響,那么這一系列因素的總和與職業(yè)聲望之間的關(guān)系,就是復(fù)相關(guān)。復(fù)相關(guān)系數(shù)…n的測定,可先求出x0對一組變量x1,x2,…,xn的回歸直線,再計算x0與用n的取值范圍為0≤…n≤1。復(fù)相關(guān)系數(shù)值愈大,變量間的關(guān)系愈親熱。典型相關(guān)分析就是利用綜合變量對之間的相關(guān)關(guān)系來反映兩組指標之間的之間的相關(guān)關(guān)系,分別在兩組變量中提取有代表性的兩個綜合變量U1和V1〔分別為兩個變量組中各變量的線性組合,利用這兩個綜合變量之間的相關(guān)關(guān)系來反映兩組指標之間的整體相關(guān)性。試說明主成分分析和因子分析不同點和一樣之處。主成分分析和因子分析的一樣之處都可以降維、分析多個變量的根本構(gòu)造的因子分析,是因子分析的特列都是利用變量之間的相關(guān)性將它們進展分類關(guān)、特別因子之間不相關(guān)、公因子與特別因子之間不相關(guān)主成分分析和因子分析的區(qū)分1、因子分析中是把變量表示成各因子的線性組合,而主成分分析中則是把主成分表示成個變量的線性組合。2、主成分分析的重點在于解釋個變量的總方差,而因子分析則把重點放在解釋各變量之間的協(xié)方差。3、主成分分析中不需要有假設(shè)(assumptions),因子分析則需要一些假設(shè)?!瞫pecificfactor〕之間也不相關(guān),共同因子和特別因子之間也不相關(guān)。4、主成分分析中,當給定的協(xié)方差矩陣或者相關(guān)矩陣的特征值是唯一的時的因子。1、因子分析中是把變量表示成各因子的線性組合,而主成分分析中則是把主成分表示成個變量的線性組合。判別分析以及Fisher判別和Bayes判別的根本思想是什么判別分析:依據(jù)判別中的組數(shù),可以分為兩組判別分析和多組判別分析;依據(jù)判別函數(shù)的形式,可以分為線性判別和非線性判別;依據(jù)判別式處理變量的方法不同,可以分為逐步判別、序貫判別等;依據(jù)判別標準不同,可以分為距離判別、Fisher判別、Bayes判別法等Fisher判別法;通過將多維數(shù)據(jù)投影到某一方向上,使得投影之后類與類之間盡可能分開,然后再查找適宜的判別準則。Bayes后驗概率,由后驗概率作出判別。指出綜合評價中指標的標準化方法及其優(yōu)缺點和有哪些綜合評價方法。標準化方法主成分分析法。主成分分析是多元統(tǒng)計分析的一個分支。是將其重量相關(guān)的原隨機向量,借助于一個正交變換,轉(zhuǎn)化成其重量不相關(guān)的隨機向量,并函數(shù),進一步做系統(tǒng)轉(zhuǎn)化。DEA模型——CRDEA分析各決策單元非DE有效的緣由及其改進方向,從而為決策者供給重要的治理決策信息。模糊評價法。模糊評價法奠基于模糊數(shù)學(xué)。它不僅可對評價對象按綜合去評定對象的等級。綜合評價方法1、計分法2、綜合指數(shù)法3、Topsis4、秩和比(RSR)法5、層次分析(AHP)法6、模糊評價方法7、多元統(tǒng)計分析方法8、灰色系統(tǒng)評價方法得分評閱人二、證明題〔120得分評閱人設(shè)y=ax+ax+…+ax ax,其中a=(a,a,…,a),x=(x,11 22 pp 1 2 p 1x,…,x),求主成分就是查找x的線性函數(shù)a x使相應(yīng)的方差到達最大,2 p即Var(a x)=a a到達最大,且a a=1,此處為x的協(xié)方差陣。設(shè)的特征根為 。試證明下面性質(zhì):〔1〕y=Ux,UU=IUx的協(xié)方差陣的特征向量〔單位化的〕組成的正交陣?!?〕y的各重量之間是互不相關(guān)的。〔3〕yp個重量是按方差大小、由大到小排列的。〔4〕y的協(xié)方差陣為對角陣。〔5〕

ii

,這里i

=( )iippi1 i1〔6〕證明〔1〔2〔3:U=(u,u,…,uUU=IU為一正交陣,且1 2 p=UU=Udiag(,,

)U=puu1 2 pp

i iii1p

p因此a

a uu

(a u)(au =

(a u)2i ii i i i) i ii1 i1 i1于是a a

(a u)2=

(a

=a UUa=aa=1應(yīng)取au

時,u

ii1u=u

i 1 u=

) 1 11 1 1 1 1 1 1yu1

x就是第一主成分,其方差最大,Var(y)=Var(u x)=1 1 1同理,Var(y)=Var(u x)=i i i另外,Cov(y

y)=Cov(u

x,u

x)=u

u=

u=0,i, ji

i j i

j i j j j i jx的主成分是以主成分y的p〔1〕〔2〔3〕得證。性質(zhì)〔4〕可有〔1〔2〔3〕證明性質(zhì)〔5:U(uu,1 2

u,則有p=UU于是p tr

trUU

trUU

tr

p=(iii1

)=(

)=

)=

)=ii1證明性質(zhì)〔6〔6〕由前面的證明得知var(y)

, var(x

) i i j jj令e=(0, ,0,1,0, ,0j )

為單位向量,則x=ex,y=u xj j i i所以,Cov(yxCov(u

x,ex)=e

D(x)ue

u e u=i, juij

i j jvar(y) var(x)i juvar(y) var(x)i juij ijj

i= j

i=i j i i故 a(y,x)i j

i j 性質(zhì)〔6〕得證得分評閱人三、運算題〔320得分評閱人陣,7154154321x15x2727123324655665x 43213 4 5 6 7x1〔10〕Rx1x2Rx1=c(5,7,3,6,6);x1x2=c(7,1,2,5,6);x2寫出繪制上面散點圖的R命令:x1=c(5,7,3,6,6);x1x2=c(7,1,2,5,6);x2plot(x1,x2)寫出繪制系統(tǒng)聚類圖的R命令:X=(x1,x2);XD=dist(X,diag=TRUE,upper=TRUE);Dhc=hclust(D,”complete”);hcplot(hc)25分〕(1)寫出計算下面確定距離陣的Rx1=c(5,7,3,6,6)x2=c(7,1,2,5,6)X=(x1,x2);XD=dist(X,diag=TRUE,upper=TRUE,p=1);D1 2 3 4 51 0 8 7 3 22 8 0 5 5 63 7 5 0 6 74 3 5 6 0 15 2 6 7 1 0〔2〕試在圖中標出這些距離3.〔5分〕試用最長距離法對其進展聚類分析,畫出聚類圖,并按二類、三類進展分類第一步:計算距離陣X=(x1,x2);XD=dist(X,diag=TRUE,upper=TRUE);D其次步:進展系統(tǒng)聚類〔最長距離法〕hc=hclust(D,”complete”);hc第三步:畫出聚類圖按二類進展分類plot(hc);(hc,2)ClusterDendrogram2323145543iH321Dhclust(*,“complete“)按三類進展分類plot(hc);(hc,3)ClusterDendrogram2323145543iH321Dhclust(*,“complete“)得分評閱人四、案例分析題〔共230得分評閱人我們知道,財政收入與國民生產(chǎn)總值和稅收等經(jīng)濟指標有親熱的依存關(guān)系。(x1稅收(x2:百億元),進出口貿(mào)易總額(x3:百億元),經(jīng)濟活動人口(x4:百萬人)的局部數(shù)據(jù),見下表所示,分析財政收入和國民生產(chǎn)總值、稅收、進出口貿(mào)易總額、經(jīng)濟活動人口之間的關(guān)系。1財政收入多因素分析數(shù)據(jù)yyx1x2x3x41991199119921993199419951996199719981999202320232023202320232023202320232023根本統(tǒng)計分析和R語言命令〔15分〕假設(shè)將該數(shù)據(jù)存入到一個文本文件中,寫出將該文本數(shù)據(jù)讀入datRdat=(““,,header=T)(1假設(shè)將該數(shù)據(jù)拷貝到剪切板中,寫出將該數(shù)據(jù)讀入數(shù)據(jù)框dat中的Rdat=(“clipboard“,header=T)(1寫出提取2023年數(shù)據(jù)的R命令:dat[10,] (1分)寫出提取稅收(x2)數(shù)據(jù)的R命令:dat[,5] (1分)20232023(x4Rdat[11:18,5] (1寫出計算財政收入統(tǒng)計量的R命令:summary(y) (2分)Min.1stQu.Median Mean 3rdQu.Max.寫出計算下面相關(guān)陣R命令:cor(dat) (2分)y x1 x2 x3 x4yx1x2x3x4Rfm=lm(y~x1+x2+x3+x4,data=dat);fm(2分)Coefficients:(Intercept) x1 x2 x3 x4寫出計算下面檢驗的R命令:summary(fm) (2分)Coefficients:EstimateStd.ErrortvaluePr(>|t|)(Intercept) ***x1x2 <2e-16***x3x4 ***---Signif.codes:0‘***’‘**’‘*’‘.’‘’1Residualstandarderror:on13degreesoffreedomMultipleR-squared: , AdjustedR-squared:F-statistic:+04on4and13DF,p-value:<2e-16寫出計算下面檢驗的R命令:fm1=lm(y~x2+x4,data=dat);fm1summary(fm1) (2Coefficients:EstimateStd.ErrortvaluePr(>|t|)(Intercept) ***x2 <2e-16***x4 ***---Signif.codes:0‘***’‘**’‘*’‘.’‘’1Residualstandarderror:on15degreesoffreedomMultipleR-squared: 1, AdjustedR-squared: 1F-statistic:+05on2and15DF,p-value:<在上面計算的根底上進展進一步分析(15分)試問該回歸方程有無統(tǒng)計學(xué)意義,為什么(2分)由F檢驗結(jié)果可知,P值小于,于是在的顯著性水平上拒絕原假設(shè),所以認為整個回歸方程有統(tǒng)計學(xué)意義。該模型的復(fù)相關(guān)系數(shù)、打算系數(shù)、調(diào)整復(fù)相關(guān)系數(shù)平方和剩余標準差(3打算系數(shù):剩余標準差: 由于方程的P<,能否說明每個自變量都有顯著作

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論