版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、完美格式整理版第1章多元正態(tài)分布1、在數(shù)據(jù)處理時(shí),為什么通常要進(jìn)行標(biāo)準(zhǔn)化處理?數(shù)據(jù)的標(biāo)準(zhǔn)化是將數(shù)據(jù)按比例縮放, 使之落入一個(gè)小的特定區(qū)間。在某些比 較和評(píng)價(jià)的指標(biāo)處理中經(jīng)常會(huì)用到, 去除數(shù)據(jù)的單位限制,將其轉(zhuǎn)化為無(wú)量綱的 純數(shù)值,便于不同單位或量級(jí)的指標(biāo)能夠進(jìn)行比較和加權(quán)。其中最典型的就是 0-1標(biāo)準(zhǔn)化和Z標(biāo)準(zhǔn)化。2、歐氏距離與馬氏距離的優(yōu)缺點(diǎn)是什么?歐氏距離也稱(chēng)歐幾里得度量、歐幾里得度量,是一個(gè)通常采用的距離定義, 它是在m維空間中兩個(gè)點(diǎn)之間的真實(shí)距離。在二維和三維空間中的歐氏距離的就 是兩點(diǎn)之間的距離。缺點(diǎn):就大部分統(tǒng)計(jì)問(wèn)題而言,歐氏距離是不能令人滿(mǎn)意的。每個(gè)坐標(biāo)對(duì)歐 氏距離的貢獻(xiàn)是同等的
2、。當(dāng)坐標(biāo)表示測(cè)量值時(shí),它們往往帶有大小不等的隨機(jī)波 動(dòng),在這種情況下,合理的方法是對(duì)坐標(biāo)加權(quán),使變化較大的坐標(biāo)比變化較小的 坐標(biāo)有較小的權(quán)系數(shù),這就產(chǎn)生了各種距離。當(dāng)各個(gè)分量為不同性質(zhì)的量時(shí),“距 離”的大小與指標(biāo)的單位有關(guān)。它將樣品的不同屬性之間的差別等同看待, 這一 點(diǎn)有時(shí)不能滿(mǎn)足實(shí)際要求。沒(méi)有考慮到總體變異對(duì)距離遠(yuǎn)近的影響。馬氏距離表示數(shù)據(jù)的協(xié)方差距離。為兩個(gè)服從同一分布并且其協(xié)方差矩陣為 2的隨機(jī)變量與的差異程度:如果協(xié)方差矩陣為單位矩陣,那么馬氏距離就簡(jiǎn)化 為歐氏距離,如果協(xié)方差矩陣為對(duì)角陣,則其也可稱(chēng)為正規(guī)化的歐氏距離。優(yōu)點(diǎn):它不受量綱的影響,兩點(diǎn)之間的馬氏距離與原始數(shù)據(jù)的測(cè)量單位
3、無(wú)關(guān)。由標(biāo)準(zhǔn)化數(shù)據(jù)和中心化數(shù)據(jù)計(jì)算出的二點(diǎn)之間的馬氏距離相同。馬氏距離還可以排除變量之間的相關(guān)性的干擾。缺點(diǎn):夸大了變化微小的變量的作用。 受協(xié)方差矩陣不穩(wěn)定的影響,馬氏距 離并不總是能順利計(jì)算出。3、當(dāng)變量X1和X2方向上的變差相等,且與互相獨(dú)立時(shí),采用歐氏距離與統(tǒng)計(jì) 距離是否一致?統(tǒng)計(jì)距離區(qū)別于歐式距離,此距離要依賴(lài)樣本的方差和協(xié)方差, 能夠體現(xiàn)各 變量在變差大小上的不同,以及優(yōu)勢(shì)存在的相關(guān)性,還要求距離與各變量所用的 單位無(wú)關(guān)。如果各變量之間相互獨(dú)立,即觀測(cè)變量的協(xié)方差矩陣是對(duì)角矩陣,則 馬氏距離就退化為用各個(gè)觀測(cè)指標(biāo)的標(biāo)準(zhǔn)差的倒數(shù)作為權(quán)數(shù)的加權(quán)歐氏距離。4、如果正態(tài)隨機(jī)向量X =(X1
4、,X2#|Xp)'的協(xié)方差陣工為對(duì)角陣,證明X的分量 是相互獨(dú)立的隨機(jī)變量。解:因?yàn)閄 =(X1,X2,|Xp)的密度函數(shù)為f 區(qū),.1.,Xp)=l*2 "2 exp學(xué)習(xí)好幫手/ 2。1又由于E =22 =仃12仃21Mbp則 f (Xi,,Xp)二 i22 22/211、2HMpexp2(x ©N =(x- m) >1 (1)211exp2 二 121 (X2 -;3)21 (XP p)2一二 2-. 一二 22 二 22;pp 1_L(x.-J)2f(K).f(Xp)-JI I exp -(Xi2=i"、22 二;則其分量是相互獨(dú)立 5. y1
5、和y2是相互獨(dú)立的隨機(jī)變量,且 y1N (0,1) , y2N(3,4)(a)求y;的分布。(b)如果y = y1寫(xiě)出yy關(guān)于y1與y2的表達(dá)式,并寫(xiě)出yy的分- 3) / 2 一布。(c)如果y = 1y"且yN(d£ ),寫(xiě)出y2,y關(guān)于y1與y2的表達(dá)式,并 X一 ,1寫(xiě)出y 2 - y的分布。解:(a)由于y1N (0,1),所以y1X(1)。(b)由于 yi N (0,1) , y2N (3,4);所以勺UN (0,1);故y y = V; +( y22 3)2 ,且 y y 7 2( 2)第2章均值向量和協(xié)方差陣的檢驗(yàn)1、略 2、試談Wilks統(tǒng)計(jì)量在多元方差分
6、析中的重要意義。答;威爾克斯統(tǒng)計(jì)量在多元方差分析中是用于檢瞼均值的統(tǒng)計(jì)量,H爐月=陽(yáng)=也 為至少存的X使羯*巧用似然比原則構(gòu)成的檢險(xiǎn)統(tǒng)計(jì)量為A = F|=lH_7A(PE-上片-1)給定檢險(xiǎn)水PH |a+e|平戊,查刈眥分布表j確定臨界值.然后作出統(tǒng)計(jì)判斷。3、題目此略多元均值檢驗(yàn),從題意知道,容量為9的樣本,總體協(xié)方差未知假設(shè) H0: N =&,H1 : N %(n=9 p=5)檢驗(yàn)統(tǒng)計(jì)量只=5 1)6十)5-1(又例)/(n-1)T2 =n(X No)'S,(X 5)服從 P, n-1 的T2分布統(tǒng)計(jì)量T2實(shí)際上是樣本均值與已知總體均值之間的馬氏距離再乘以n* (n-1)這
7、個(gè)值越大,相等的可能性越小,備擇假設(shè)成立時(shí),T2有變大的趨勢(shì),所以拒絕域選擇T2值較大的右側(cè)部分,也可以轉(zhuǎn)變?yōu)?F統(tǒng)計(jì)量零假設(shè)的拒絕區(qū)域 (n-p) /(n-1)*p* T2 >Fp,n_pQ)1/10* T2 >F5,4(5)科0= ( 6212.01 32.87 2972 9.515.78)'樣本均值(4208.78 35.12 1965.8912.2127.79)'(樣本均值-) '=(-2003.232.25-1006.112.7112.01)協(xié)方差矩陣(維一一因子分析一一抽取)協(xié)方差的逆矩陣1.88034E-05-0.00044037-6.0978
8、E-050.002799208-0.00062589-0.0004403680.207023949-0.000210374-0.023704352-0.06044981-6.09781E-05-0.0002103740.00022733-0.0105018810.0030474740.00279921-0.0237044-0.01050190.85288927-0.1813998-0.000625893-0.060449810.003047474-0.181399810.070148804Inter-Item Covariance Matrix人均GDP阮)三產(chǎn)比重(人均消費(fèi)(元)人口增長(zhǎng)(%
9、)文盲半文盲(%)人均GDP阮)1020190.840582.460331693.531-599.784-6356.325三產(chǎn)比重(為582.46019.480-105.4646.62543.697人均消費(fèi)(元)331693.531-105.464125364.321-213.634-3130.038人口增長(zhǎng)(%)-599.7846.625-213.6346.09925.410文盲半文盲(%)-6356.32543.697-3130.03825.410196.884計(jì)算:邊遠(yuǎn)及少數(shù)民族聚居區(qū)社會(huì)經(jīng)濟(jì)發(fā)展水平的指標(biāo)數(shù)據(jù).xlsT2=9* (-2003.23 2.25-1006.112.7112.
10、01)*sA-1*(-2003.232.25-1006.112.7112.01) ' =9*50.11793817=451,06144353F統(tǒng)計(jì)量=45.2>6.2拒絕零假設(shè),邊緣及少數(shù)民族聚居區(qū)的社會(huì)經(jīng)濟(jì)發(fā)展水平與全國(guó)平均水平有顯著差異。4、略第3章聚類(lèi)分析1.、聚類(lèi)分析的基本思想和功能是什么?聚類(lèi)分析的基本思想是研究的樣品或指標(biāo)之間存著程度不同的相似性,于是根據(jù)一批樣品的多個(gè)觀測(cè)指標(biāo),具體找出一些能夠度量樣品或指標(biāo)之間的相似程 度的統(tǒng)計(jì)量,以這些統(tǒng)計(jì)量作為劃分類(lèi)型的依據(jù), 把一些相似程度較大的樣品聚 合為一類(lèi),把另外一些彼此之間相似程度較大的樣品又聚合為另外一類(lèi),直到把所有
11、的樣品聚合完畢,形成一個(gè)有小到大的分類(lèi)系統(tǒng),最后再把整個(gè)分類(lèi)系統(tǒng)畫(huà) 成一張分群圖,用它把所有樣品間的親疏關(guān)系表示出來(lái)。 功能是把相似的研究對(duì) 象歸類(lèi)。2、試述系統(tǒng)聚類(lèi)法的原理和具體步驟。系統(tǒng)聚類(lèi)是將每個(gè)樣品分成若干類(lèi)的方法,其基本思想是先將各個(gè)樣品各看 成一類(lèi),然后規(guī)定類(lèi)與類(lèi)之間的距離,選擇距離最小的一對(duì)合并成新的一類(lèi), 計(jì) 算新類(lèi)與其他類(lèi)之間的距離,再將距離最近的兩類(lèi)合并,這樣每次減少一類(lèi),直 至所有的樣品合為一類(lèi)為止。具體步驟:1、對(duì)數(shù)據(jù)進(jìn)行變換處理;(不是必須的,當(dāng)數(shù)量級(jí)相差很大或指標(biāo)變量具有不同 單位時(shí)是必要的)2、構(gòu)造n個(gè)類(lèi),每個(gè)類(lèi)只包含一個(gè)樣本;3、計(jì)算n個(gè)樣本兩兩間的距離ijd
12、;4、合并距離最近的兩類(lèi)為一新類(lèi);5、計(jì)算新類(lèi)與當(dāng)前各類(lèi)的距離,若類(lèi)的個(gè)數(shù)等于 1,轉(zhuǎn)到6;否則回4;6、畫(huà)聚類(lèi)圖;7、決定類(lèi)的個(gè)數(shù),從而得出分類(lèi)結(jié)果。3、試述K-均值聚類(lèi)的方法原理。K-均值法是一種非譜系聚類(lèi)法,把每個(gè)樣品聚集到其最近形心(均值)類(lèi)中, 它是把樣品聚集成K個(gè)類(lèi)的集合,類(lèi)的個(gè)數(shù)k可以預(yù)先給定或者在聚類(lèi)過(guò)程中確 定,該方法應(yīng)用于比系統(tǒng)聚類(lèi)法大得多的數(shù)據(jù)組。步驟是把樣品分為K個(gè)初始類(lèi), 進(jìn)行修改,逐個(gè)分派樣品到期最近均值的類(lèi)中(通常采用標(biāo)準(zhǔn)化數(shù)據(jù)或非標(biāo)準(zhǔn)化 數(shù)據(jù)計(jì)算歐氏距離)重新計(jì)算接受新樣品的類(lèi)和失去樣品的類(lèi)的形心。重復(fù)這一 步直到各類(lèi)無(wú)元素進(jìn)出。4、試述模糊聚類(lèi)的思想方法。模糊
13、聚類(lèi)分析是根據(jù)客觀事物間的特征、 親疏程度、相似性,通過(guò)建立模糊 相似關(guān)系對(duì)客觀事物進(jìn)行聚類(lèi)的分析方法, 實(shí)質(zhì)是根據(jù)研究對(duì)象本身的屬性構(gòu)造 模糊矩陣,在此基礎(chǔ)上根據(jù)一定的隸屬度來(lái)確定其分類(lèi)關(guān)系。 基本思想是要把需 要識(shí)別的事物與模板進(jìn)行模糊比較, 從而得到所屬的類(lèi)別。簡(jiǎn)單地說(shuō),模糊聚類(lèi) 事先不知道具體的分類(lèi)類(lèi)別,而模糊識(shí)別是在已知分類(lèi)的情況下進(jìn)行的。模糊聚 類(lèi)分析廣泛應(yīng)用在氣象預(yù)報(bào)、地質(zhì)、農(nóng)業(yè)、林業(yè)等方面。它有兩種基本方法:系統(tǒng)聚類(lèi)法和逐步聚類(lèi)法。該方法多用于定性變量的分類(lèi)。5、略第4章判別分析1、應(yīng)用判別分析應(yīng)該具備什么樣的條件?答:判別分析最基本的要求是,分組類(lèi)型在兩組以上,每組案例的規(guī)模
14、必須至少 在一個(gè)以上,解釋變量必須是可測(cè)量的,才能夠計(jì)算其平均值和方差。對(duì)于判別分析有三個(gè)假設(shè):(1)每一個(gè)判別變量不能是其他判別變量的線性組合。有時(shí)一個(gè)判別變量與另 外的判別變量高度相關(guān),或與其的線性組合高度相關(guān),也就是多重共線性。(2)各組變量的協(xié)方差矩陣相等。判別分析最簡(jiǎn)單和最常用的的形式是采用現(xiàn) 行判別函數(shù),他們是判別變量的簡(jiǎn)單線性組合,在各組協(xié)方差矩陣相等的假設(shè)條 件下,可以使用很簡(jiǎn)單的公式來(lái)計(jì)算判別函數(shù)和進(jìn)行顯著性檢驗(yàn)。(3)各判別變量之間具有多元正態(tài)分布,即每個(gè)變量對(duì)于所有其他變量的固定 值有正態(tài)分布,在這種條件下可以精確計(jì)算顯著性檢驗(yàn)值和分組歸屬的概率。2、試述貝葉斯判別法的思
15、路。答:貝葉斯判別法的思路是先假定對(duì)研究的對(duì)象已有一定的認(rèn)識(shí),常用先驗(yàn)概率分布來(lái)描述這種認(rèn)識(shí),然后我們?nèi)〉靡粋€(gè)樣本,用樣本來(lái)修正已有的認(rèn)識(shí)(先驗(yàn) 概率分布),得到后驗(yàn)概率分布,各種統(tǒng)計(jì)推斷都通過(guò)后驗(yàn)概率分布來(lái)進(jìn)行。將 貝葉斯判別方法用于判別分析,就得到貝葉斯判別。3、試述費(fèi)歇判別法的基本思想。答:費(fèi)歇判別法的基本思想是將高維數(shù)據(jù)點(diǎn)投影到低維空間上來(lái),然而利用方差分析的思想選出一個(gè)最優(yōu)的投影方向。 因此,嚴(yán)格的說(shuō)費(fèi)歇判別分析本身不是一 種判別方法,只是利用費(fèi)歇統(tǒng)計(jì)量進(jìn)行數(shù)據(jù)預(yù)處理的方法, 以使更有利于用判別 分析方法解決問(wèn)題。為了有利于判別,我們選擇投影方向a應(yīng)使投影后的k個(gè)一元 總體能盡量分開(kāi)
16、(同一總體中的樣品的投影值盡量靠近)。k要做到這一點(diǎn),只要 投影后的k個(gè)一元總體均值有顯著差異,即可利用方差分析的方法使組問(wèn)平方和 盡可能的大。則選取投影方向a使A (a)達(dá)極大即可。4、什么是逐步判別分析?答:具有篩選變量能力的判別方法稱(chēng)為逐步判別分析法。逐步判別分析法就是先從所有因子中挑選一個(gè)具有最顯著判別能力的因子,然后再挑選第二個(gè)因子,這 因子是在第一因子的基礎(chǔ)上具有最顯著判別能力的因子,即第一個(gè)和第二個(gè)因子 聯(lián)合起來(lái)有顯著判別能力的因子; 接著挑選第三個(gè)因子,這因子是在第一、第二 因子的基礎(chǔ)上具有最顯著判別能力的因子。 由于因子之間的相互關(guān)系,當(dāng)引進(jìn)了 新的因子之后,會(huì)使原來(lái)已引入的
17、因子失去顯著判別能力。 因此,在引入第三個(gè) 因子之后就要先檢驗(yàn)已經(jīng)引入的因子是否還具有顯著判別能力,如果有就要剔除這個(gè)不顯著的因子;接著再繼續(xù)引入,直到再?zèng)]有顯著能力的因子可剔除為止, 最后利用已選中的變量建立判別函數(shù)。5、簡(jiǎn)要敘述判別分析的步驟及流程答:(1)研究問(wèn)題:選擇對(duì)象,評(píng)估一個(gè)多元問(wèn)題各組的差異,將觀測(cè)個(gè)體歸類(lèi), 確定組與組之間的判別函數(shù)。(2)設(shè)計(jì)要點(diǎn):選擇解釋變量,樣本量的考慮,建立分析樣本的保留樣本。(3)假定:解釋變量的正態(tài)性,線性關(guān)系,解釋變量間不存在多重共線性,協(xié) 方差陣相等。(4)估計(jì)判別函數(shù):聯(lián)立估計(jì)或逐步估計(jì),判別函數(shù)的顯著性。(5)使用分類(lèi)矩陣評(píng)估預(yù)測(cè)的精度:確
18、定最優(yōu)臨界得分,確定準(zhǔn)則來(lái)評(píng)估判對(duì) 比率,預(yù)測(cè)精確的統(tǒng)計(jì)顯著性。(6)判別函數(shù)的解釋?zhuān)盒枰嗌賯€(gè)函數(shù)。評(píng)價(jià)單個(gè)函數(shù)主要從判別權(quán)重、判別 載荷、偏F值幾個(gè)方面;評(píng)價(jià)兩個(gè)以上的判別函數(shù),分為評(píng)價(jià)判別的函數(shù)和評(píng)價(jià) 合并的函數(shù)。(7)判別結(jié)果的驗(yàn)證:分開(kāi)樣本或交叉驗(yàn)證,刻畫(huà)組間的差異。6、略第5章主成分分析1、主成分的基本思想是什么?在對(duì)某一事物進(jìn)行實(shí)證研究時(shí),為更全面、準(zhǔn)確地反映事物的特征及其發(fā)展 規(guī)律,往往考慮與其有關(guān)的多個(gè)指標(biāo),在多元統(tǒng)計(jì)中也稱(chēng)為變量。一方避免遺漏 重要信息而考慮盡可能多的指標(biāo)看,另一方面考慮指標(biāo)的增多,又難以避免信息 重疊。希望涉及的變量少,而得到的信息量有較多。主成分的基本思
19、想是研究如何通過(guò)原來(lái)的少數(shù)幾個(gè)線性組合來(lái)解釋原來(lái)變 量絕大多數(shù)信息的一種多元統(tǒng)計(jì)方法。研究某一問(wèn)題涉及的眾多變量之間有一定 的相關(guān)性,必然存在著支配作用的公共因素。通過(guò)對(duì)原始變量相關(guān)矩陣或協(xié)方差 矩陣內(nèi)部結(jié)構(gòu)關(guān)系的研究,利用原始變量的線性組合形成幾個(gè)無(wú)關(guān)的綜合指標(biāo)(主成分)來(lái)代替原來(lái)的指標(biāo)。通常數(shù)學(xué)上的處理就是將原來(lái) P個(gè)指標(biāo)作線性組 合,作為新的綜合指標(biāo)。最經(jīng)典的做法就是用 F1 (選取的第一個(gè)線性組合,即 第一個(gè)綜合指標(biāo))的方差來(lái)表達(dá),即 Var (F1)越大,表示F1包含的信息越多。 因此在所有的線性組合中選取的 F1應(yīng)該是方差最大的,故稱(chēng)F1為第一主成分, 如果第一主成分不足以代表原來(lái)
20、 P個(gè)指標(biāo)的信息,再考慮選取F2即選第二個(gè)線 性組合,為了有效地反映原來(lái)信息,F(xiàn)1已有的信息就不需要再出現(xiàn)在 F2中,用 數(shù)學(xué)語(yǔ)言表達(dá)就是要求Cov (F1, F2) =0則稱(chēng)F2為第二主成分,依此類(lèi)推可以 構(gòu)造出第三、第四,第P個(gè)主成分。2、主成分在應(yīng)用中的主要作用是什么?作用:利用原始變量的線性組合形成幾個(gè)綜合指標(biāo)(主成分),在保留原始變量 主要信息的前提下起到降維與簡(jiǎn)化問(wèn)題的作用, 使得在研究復(fù)雜問(wèn)題時(shí)更容易抓 住主要矛盾。通過(guò)主成分分析,可以從事物之間錯(cuò)綜復(fù)雜的關(guān)系中找出一些主要 成分,從而能有效利用大量數(shù)據(jù)進(jìn)行定量分析, 解釋變量之間的內(nèi)在關(guān)系,得到 對(duì)事物特征及其發(fā)展規(guī)律的一些深層
21、次的啟發(fā), 把研究工作引向深入。主成分分 析能降低所研究的數(shù)據(jù)空間的維數(shù),有時(shí)可通過(guò)因子載荷aij的結(jié)論,弄清X(qián)變量間的某些關(guān)系,多維數(shù)據(jù)的一種圖形表示方法,用主成分分析篩選變量,可 以用較少的計(jì)算量來(lái)選擇,獲得選擇最佳變量子集合的效果。3.由協(xié)方差陣出發(fā)和由相關(guān)陣出發(fā)求主成分有什么不同?(1)由協(xié)方差陣出發(fā)設(shè)隨即向量X=(X1,X2, X3,Xp)'的協(xié)方差矩陣為2, ?.1>X2> 冷為2的特征值,T 1, 丫 2,T p為矩陣A各特征值對(duì)應(yīng)的標(biāo)準(zhǔn)正交特征 向量,則第i個(gè)主成分為Yi= T 1i*X1+ T 2i*X2+ 丫 pi*Xp,i=1,2,p此時(shí) VAR (Y
22、i)=箱,COV (Yi, Yj) = 0, i w j我們把X1, X2, X3,Xp的協(xié)方差矩陣的非零特征根九1:九2> Xp>0 向量對(duì)應(yīng)的標(biāo)準(zhǔn)化特征向量丫1, 丫2, 丫 p分別作為系數(shù)向量,Y1=y 1' *X,Y2=t 2' *X,,Yp=Yp' *X分別稱(chēng)為隨即向量X的第一主成分,第二主成 分第p主成分。Y的分量Y1, Y2,,Yp依次是X的第一主成分、第二 主成分第p主成分的充分必要條件是:(1) Y=P *X,即P為p階正交陣,(2) Y的分量之間互不相關(guān),即 D (Y) =diag(九1,九2,,九p),(3)Y 的p個(gè)分 量是按方差由大
23、到小排列,即>2>”甲。(2)由相關(guān)陣出發(fā)對(duì)原始變量X進(jìn)行標(biāo)準(zhǔn)化,Z=( 2 A1/2)A-1*(X- 仙)cov (Z) =R原始變量的相關(guān)矩陣實(shí)際上就是對(duì)原始變量標(biāo)準(zhǔn)化后的協(xié)方差矩陣,因此,有相關(guān)矩陣求主成分的過(guò)程與主成分個(gè)數(shù)的確定準(zhǔn)則實(shí)際上是與由協(xié)方差矩陣出發(fā) 求主成分的過(guò)程與主成分個(gè)數(shù)的確定準(zhǔn)則相一致的。入i , 丫 i分別表示相關(guān)陣 R的特征根值與對(duì)應(yīng)的標(biāo)準(zhǔn)正交特征向量,此時(shí),求得的主成分與原始變量的關(guān) 系式為:Yi= 丫 i ' *Z= 丫 i ' *( 2 Ai/2)Ai*(x 業(yè))在實(shí)際研究中,有時(shí)單個(gè)指標(biāo)的方差對(duì)研究目的起關(guān)鍵作用,為了達(dá)到研究目的
24、,此時(shí)用協(xié)方差矩陣進(jìn)行主成分分析恰到好處。有些數(shù)據(jù)涉及到指標(biāo)的不同度量尺度使指標(biāo)方差之間不具有可比性,對(duì)于這類(lèi)數(shù)據(jù)用協(xié)方差矩陣進(jìn)行主成分 分析也有不妥。相關(guān)系數(shù)矩陣計(jì)算主成分其優(yōu)勢(shì)效應(yīng)僅體現(xiàn)在相關(guān)性大、相關(guān)指標(biāo)數(shù)多的一類(lèi)指標(biāo)上。避免單個(gè)指標(biāo)方差對(duì)主成分分析產(chǎn)生的負(fù)面影響,自然會(huì)想到把單個(gè)指標(biāo)的方差從協(xié)方差矩陣中剝離,而相關(guān)系數(shù)矩陣恰好能達(dá)到此目 的。4、略第6章因子分析1、因子分析與主成分分析有什么本質(zhì)不同?答:(1)因子分析把諸多變量看成由對(duì)每一個(gè)變量都有作用的一些公共因子和 一些僅對(duì)某一個(gè)變量有作用的特殊因子線性組合而成,因此,我們的目的就是要從數(shù)據(jù)中探查能對(duì)變量起解釋作用的公共因子和特殊
25、因子,以及公共因子和特殊因子的線性組合。主成分分析則簡(jiǎn)單一些,它只是從空間生成的角度尋找能解釋 諸多變量絕大部分變異的幾組彼此不相關(guān)的新變量(2)因子分析中,把變量表示成各因子的線性組合,而主成分分析中,把主成 分表示成各變量的線性組合(3)主成分分析中不需要有一些專(zhuān)門(mén)假設(shè),因子分析則需要一些假設(shè),因子分析的假設(shè)包括:各個(gè)因子之間不相關(guān),特殊因子之間不相關(guān),公共因子和特殊因 子之間不相關(guān)。(4)在因子分析中,提取主因子的方法不僅有主成分法,還有極大似然法等,基于這些不同算法得到的結(jié)果一般也不同。而主成分分析只能用主成分法提取。(5)主成分分析中,當(dāng)給定的協(xié)方差矩陣或者相關(guān)矩陣的特征根唯一時(shí),主
26、成 分一般是固定;而因子分析中,因子不是固定的,可以旋轉(zhuǎn)得到不同的因子。(6)在因子分析中,因子個(gè)數(shù)需要分析者指定,結(jié)果隨指定的因子數(shù)不同而不 同。在主成分分析中,主成分的數(shù)量是一定的,一般有幾個(gè)變量就有幾個(gè)主成分。(7)與主成分分析相比,由于因子分析可以使用旋轉(zhuǎn)技術(shù)幫助解釋因子,在解 釋方面更加有優(yōu)勢(shì)。而如果想把現(xiàn)有的變量變成少數(shù)幾個(gè)新的變量(新的變量幾 乎帶有原來(lái)所有變量的信息)來(lái)進(jìn)行后續(xù)的分析,則可以使用主成分分析。2、因子載荷aj的統(tǒng)計(jì)定義是什么?它在實(shí)際問(wèn)題的分析中的作用是什么?答:(1)因子載荷a。的統(tǒng)計(jì)定義:是原始變量Xi與公共因子Fj的協(xié)方差,Xi與 Fj (i =1,2,p;
27、 j =1,2,m)都是均值為0,方差為1的變量,因此a。同時(shí)也是Xi 與Fj的相關(guān)系數(shù)。(2)記g2 =a2j +a2j + apj(j =1,2,m),則g2表示的是公共因子Fj對(duì)于X的 每一分量Xi(i =1,2,., p)所提供的方差的總和,稱(chēng)為公共因子Fj對(duì)原始變量X的 方貢獻(xiàn),它是衡量公共因子相對(duì)重要性的指標(biāo)。g2越大,表明公共因子Fj對(duì)Xi的貢獻(xiàn)越大,或者說(shuō)對(duì) X的影響作用就越大。如果因子載荷矩陣對(duì)A的所有的g2(j=1,2,.,m)都計(jì)算出來(lái),并按大小排序,就可以依此提煉出最有影響的公共 因子。3、略第7章對(duì)應(yīng)分析1、試述對(duì)應(yīng)分析的思想方法及特點(diǎn)。思想:對(duì)應(yīng)分析又稱(chēng)為相應(yīng)分析,
28、也稱(chēng) R Q分析。是因子分子基礎(chǔ)發(fā)展起來(lái)的 一種多元統(tǒng)計(jì)分析方法。它主要通過(guò)分析定性變量構(gòu)成的列聯(lián)表來(lái)揭示變量之間 的關(guān)系。當(dāng)我們對(duì)同一觀測(cè)數(shù)據(jù)施加 R和Q型因子分析,并分別保留兩個(gè)公共因 子,則是對(duì)應(yīng)分析的初步。對(duì)應(yīng)分析的基本思想是將一個(gè)聯(lián)列表的行和列中各 元素的比例結(jié)構(gòu)以點(diǎn)的形式在較低維的空間中表示出來(lái)。它最大特點(diǎn)是能把眾多 的樣品和眾多的變量同時(shí)作到同一張圖解上, 將樣品的大類(lèi)及其屬性在圖上直觀 而又明了地表示出來(lái),具有直觀性。另外,它還省去了因子選擇和因子軸旋轉(zhuǎn)等 復(fù)雜的數(shù)學(xué)運(yùn)算及中間過(guò)程,可以從因子載荷圖上對(duì)樣品進(jìn)行直觀的分類(lèi), 而且 能夠指示分類(lèi)的主要參數(shù)(主因子)以及分類(lèi)的依據(jù),
29、是一種直觀、簡(jiǎn)單、方便 的多元統(tǒng)計(jì)方法。特點(diǎn):對(duì)應(yīng)分析的基本思想是將一個(gè)聯(lián)列表的行和列中各元素的比例結(jié)構(gòu)以點(diǎn)的 形式在較低維的空間中表示出來(lái)。它最大特點(diǎn)是能把眾多的樣品和眾多的變量同 時(shí)作到同一張圖解上,將樣品的大類(lèi)及其屬性在圖上直觀而又明了地表示出來(lái), 具有直觀性。另外,它還省去了因子選擇和因子軸旋轉(zhuǎn)等復(fù)雜的數(shù)學(xué)運(yùn)算及中間 過(guò)程,可以從因子載荷圖上對(duì)樣品進(jìn)行直觀的分類(lèi),而且能夠指示分類(lèi)的主要參 數(shù)(主因子)以及分類(lèi)的依據(jù),是一種直觀、簡(jiǎn)單、方便的多元統(tǒng)計(jì)方法。2、試述對(duì)應(yīng)分析中總慣量的意義。 . .2總慣量不僅反映了行剖面集定義的各點(diǎn)與其重心加權(quán)距離的總和,同時(shí)與x、 ,一 、.、.-2、,
30、 一 統(tǒng)計(jì)量?jī)H相差一個(gè)常數(shù),而x統(tǒng)計(jì)量反映了列聯(lián)表橫聯(lián)與縱聯(lián)的相關(guān)關(guān)系 ,因此總慣量也反映了兩個(gè)屬性變量各狀態(tài)之間的相關(guān)關(guān)系。對(duì)應(yīng)分析就是在對(duì)總慣量信息損失最小的前提下,簡(jiǎn)化數(shù)據(jù)結(jié)構(gòu)以反映兩屬性變量之間的相關(guān)關(guān)系。3、略第8章典型相關(guān)分析1、試述典型相關(guān)分析的統(tǒng)計(jì)思想及該方法在研究實(shí)際問(wèn)題中的作用。答:典型相關(guān)分析是研究?jī)山M變量之間相關(guān)關(guān)系的一種多元統(tǒng)計(jì)方法。用 于揭示兩組變 量之間的內(nèi)在聯(lián)系。典型相關(guān)分析的目的是識(shí)別并量化兩組變 量之間的聯(lián)系。將兩組變量相 關(guān)關(guān)系的分析轉(zhuǎn)化為一組變量的線性組合與另 一組變量線性組合之間的相關(guān)關(guān)系?;舅枷耄?1)在每組變量中找胞變量的線性組合,使得兩組的線性組合之間具有最大的 相關(guān)系數(shù)。即:X (Xi, X2, , , X p)、X (Xi, X2, , , Xq)是兩組 相互關(guān)聯(lián)的隨機(jī)變量,分別在兩組變量中選取若干有代表性的綜合變量U、Vi,使是原變量的線性組合。Ui a1X1a2 X2.aP X P m a 'XV 切Y1 b2 Y2. bq Y q 三 b 'Y在D(a X ) Ub X)1的條件下,使得(a X , b X )達(dá)到最大。(2)選取和最初挑選的這對(duì)線性組合不相關(guān)的線性組合,使其配對(duì),并選取相 關(guān)系數(shù)最大的一對(duì)。(3)如此繼續(xù)下去,直到兩組變量之
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 關(guān)于體育課件教學(xué)課件
- 2024年度成都農(nóng)產(chǎn)品批發(fā)市場(chǎng)運(yùn)營(yíng)合同
- 2024年度廣告發(fā)布合同:某品牌廣告投放協(xié)議
- 2024年建筑工程施工安全管理協(xié)議
- 20245G基站建設(shè)項(xiàng)目合同
- 2024年定期貨物運(yùn)輸協(xié)議
- 2024年上海房屋裝修工程維修合同
- 2024年度★店鋪轉(zhuǎn)讓及財(cái)務(wù)交接合同
- 2024年城市公共藝術(shù)裝置安裝工程分包合同
- 04版房地產(chǎn)買(mǎi)賣(mài)與開(kāi)發(fā)合同
- 《中華商業(yè)文化》第六章
- 醫(yī)院玻璃采光頂玻璃雨棚施工方案
- 運(yùn)籌學(xué)-隨機(jī)規(guī)劃課件
- 《電阻》說(shuō)課課件
- 同濟(jì)外科學(xué)課件之頸腰椎退行性疾病
- 杜邦杜邦工程塑料課件
- 砌體工程監(jiān)理實(shí)施細(xì)則
- 運(yùn)輸車(chē)輛衛(wèi)生安全檢查記錄表
- 房建裝修修繕工程量清單
- 部編版四年級(jí)道德與法治上冊(cè)第8課《網(wǎng)絡(luò)新世界》優(yōu)質(zhì)課件
- 柴油發(fā)電機(jī)組應(yīng)急預(yù)案
評(píng)論
0/150
提交評(píng)論