版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、第 1 章 多元正態(tài)分布1、在數(shù)據(jù)處理時(shí),為什么通常要進(jìn)行標(biāo)準(zhǔn)化處理?數(shù)據(jù)的標(biāo)準(zhǔn)化是將數(shù)據(jù)按比例縮放,使之落入一個(gè)小的特定區(qū)間。在某些比擬和評 價(jià) 的指標(biāo)處理中經(jīng)常會用到,去除數(shù)據(jù)的單位限制,將其轉(zhuǎn)化為無量綱的純數(shù)值,便于 不同 單位或量級的指標(biāo)能夠進(jìn)行比擬和加權(quán)。其中最典型的就是 0-1 標(biāo)準(zhǔn)化和 Z 標(biāo)準(zhǔn)化。2、歐氏距離與馬氏距離的優(yōu)缺點(diǎn)是什么?歐氏距離也稱歐幾里得度量、 歐幾里得度量, 是一個(gè)通常采用的距離定義, 它是在 m 維空間中兩個(gè)點(diǎn)之間的真實(shí)距離。 在二維和三維空間中的歐氏距離的就是兩點(diǎn)之間的距 離。缺點(diǎn):就大局部統(tǒng)計(jì)問題而言,歐氏距離是不能令人滿意的。每個(gè)坐標(biāo)對歐氏距離的 奉獻(xiàn)
2、是同等的。當(dāng)坐標(biāo)表示測量值時(shí),它們往往帶有大小不等的隨機(jī)波動(dòng),在這種情 況下, 合理的方法是對坐標(biāo)加權(quán), 使變化較大的坐標(biāo)比變化較小的坐標(biāo)有較小的權(quán)系數(shù), 這就產(chǎn) 生了各種距離。當(dāng)各個(gè)分量為不同性質(zhì)的量時(shí), “距離的大小與指標(biāo)的單位 有關(guān)。它將樣 品的不同屬性之間的差異等同看待,這一點(diǎn)有時(shí)不能滿足實(shí)際要求。沒有 考慮到總體變異 對距離遠(yuǎn)近的影響。馬氏距離表示數(shù)據(jù)的協(xié)方差距離。為兩個(gè)服從同一分布并且其協(xié)方差矩陣為 藝的隨 機(jī) 變量與的差異程度 : 如果協(xié)方差矩陣為單位矩陣 ,那么馬氏距離就簡化為歐氏距離 , 如 果協(xié) 方差矩陣為對角陣 , 那么其也可稱為正規(guī)化的歐氏距離。優(yōu)點(diǎn):它不受量綱的影響,
3、兩點(diǎn)之間的馬氏距離與原始數(shù)據(jù)的測量單位無關(guān)。由標(biāo)準(zhǔn) 化數(shù)據(jù)和中心化數(shù)據(jù)計(jì)算出的二點(diǎn)之間的馬氏距離相同。馬氏距離還可以排除變量之 間的相關(guān)性的干擾。缺點(diǎn):夸大了變化微小的變量的作用。受協(xié)方差矩陣不穩(wěn)定的影響,馬氏距離并不總是能順利計(jì)算出3、 當(dāng)變量X1和X2方向上的變差相等, 且與互相獨(dú)立時(shí), 采用歐氏距離與統(tǒng)計(jì)距離 是否一致?統(tǒng)計(jì)距離區(qū)別于歐式距離,此距離要依賴樣本的方差和協(xié)方差, 能夠表達(dá)各變量在變 差大小上的不同,以及優(yōu)勢存在的相關(guān)性,還要求距離與各變量所用的單位無關(guān)。如果 各變量之間相互獨(dú)立,即觀測變量的協(xié)方差矩陣是對角矩陣,那么馬氏距離就退化為用各 個(gè)觀測指標(biāo)的標(biāo)準(zhǔn)差的倒數(shù)作為權(quán)數(shù)的加
4、權(quán)歐氏距離。4、如果正態(tài)隨機(jī)向量X(Xi,X2,L Xp)的協(xié)方差陣?為對角陣,證明X的分量是相互獨(dú)立 的隨機(jī)變量解:因?yàn)閄 (Xi,X2,L Xp)的密度函數(shù)為又由于工那么 f X1,Xp那么其分量是相互獨(dú)立5. y i和y 2是相互獨(dú)立的隨機(jī)變量,且屮N (0,1) , yN (3,4)(b) 如果y1 ,寫出y y關(guān)于yi與y 2的表達(dá)式,并寫出yy的分布。(y2 3)/ 2 1 2(c) 如果y y1且yN (,),寫出y y關(guān)于y 1與y 2的表達(dá)式,并寫出y yy2的分布。解:(a)由于yiN ( 0,1),所以y 1(2 1 )。(b)由于 屮N (0,1) ,y 2N ( 3,
5、4);所以 y2 3 N(0,1 );2故 yy y12 (y2 2 3)2,且 y y ( 2 2)第 2 章 均值向量和協(xié)方差陣的檢驗(yàn)1、略2、試談 Wilks 統(tǒng)計(jì)量在多元方差分析中的重要意義3、題目此略多元均值檢驗(yàn) , 從題意知道,容量為 9 的樣本 ,總體協(xié)方差未知假設(shè)0 , H1 : 0 (n=9 p=5)檢驗(yàn)統(tǒng)計(jì)21T2 n X 0S1 X o服從 P, n-1 的 T2 分布統(tǒng)計(jì)量T2實(shí)際上是樣本均值與總體均值之間的馬氏距離再乘以n* n-1 ,這個(gè)值越大,相等的可能性越小,備擇假設(shè)成立時(shí),T2有變大的趨勢,所以拒絕域選擇 T 2值較大的右側(cè)局部,也可以轉(zhuǎn)變?yōu)?F統(tǒng)計(jì)量零假設(shè)的
6、拒絕區(qū)域 n-p/ n-1*p* T2> Fp,n p1/10* T2>F5,4 5Q= 6212.01 32.87 2972 9.515.78 '樣本均值4208.78 35.12 1965.89 12.21 27.79'樣本均值 -Q ' = -2003.232.25 -1006.11 2.71 12.01 協(xié)方差矩陣降維一一因子分析一一抽取In ter-ltem Covaria nee Matrix人均GDP元三產(chǎn)比重%人均消費(fèi)元人口增長%文盲半文盲%人均GDP 元1020210.840582.460331693.531-599.784-6356.32
7、5三產(chǎn)比重%582.46019.480-105.4646.62543.697人均消費(fèi)元331693.531-105.464125364.321-213.634-3130.038人口增長(%)-599.7846.625-213.6346.09925.410文盲半文盲(%)-6356.32543.697-3130.03825.410196.884協(xié)方差的逆矩陣1.88034E-05-0.000440368-6.09781E-050.00279921-0.000625893-0.00044037-0.000210374-0.0237044-0.06044981-6.0978E-05-0.000210
8、3740.00022733-0.01050190.0030474740.002799208-0.00062589-0.060449810.003047474-0.1813998計(jì)算:遙遠(yuǎn)及少數(shù)民族聚居區(qū)社會經(jīng)濟(jì)開展水平的指標(biāo)數(shù)據(jù).XisT2=9* (-2003.23 2.25-1006.11 2.71 12.01)*sA-1* (-2003.23 2.25-1006.11 2.71 12.01)'F統(tǒng)計(jì)量=45.2>6.2拒絕零假設(shè),邊緣及少數(shù)民族聚居區(qū)的社會經(jīng)濟(jì)開展水平與全國平均 水平有顯著差異。第 3 章 聚類分析1. 、聚類分析的根本思想和功能是什么?聚類分析的根本思想是研
9、究的樣品或指標(biāo)之間存著程度不同的相似性,于是根據(jù)一 批 樣品的多個(gè)觀測指標(biāo),具體找出一些能夠度量樣品或指標(biāo)之間的相似程度的統(tǒng)計(jì)量,以 這 些統(tǒng)計(jì)量作為劃分類型的依據(jù),把一些相似程度較大的樣品聚合為一類,把另外一些彼 此 之間相似程度較大的樣品又聚合為另外一類,直到把所有的樣品聚合完畢,形成一個(gè)有 小 到大的分類系統(tǒng),最后再把整個(gè)分類系統(tǒng)畫成一張分群圖,用它把所有樣品間的親疏關(guān) 系 表示出來。功能是把相似的研究對象歸類。2、試述系統(tǒng)聚類法的原理和具體步驟。系統(tǒng)聚類是將每個(gè)樣品分成假設(shè)干類的方法, 其根本思想是先將各個(gè)樣品各看成一類, 然后規(guī)定類與類之間的距離,選擇距離最小的一對合并成新的一類,計(jì)
10、算新類與其他類 之 間的距離,再將距離最近的兩類合并,這樣每次減少一類,直至所有的樣品合為一類 為止。 具體步驟:1、對數(shù)據(jù)進(jìn)行變換處理; 不是必須的,當(dāng)數(shù)量級相差很大或指標(biāo)變量具有不同單位 時(shí)是 必要的2、構(gòu)造 n 個(gè)類,每個(gè)類只包含一個(gè)樣本;3、計(jì)算 n 個(gè)樣本兩兩間的距離 ijd ;4、合并距離最近的兩類為一新類;5、計(jì)算新類與當(dāng)前各類的距離,假設(shè)類的個(gè)數(shù)等于 1,轉(zhuǎn)到 6;否那么回 4; 6、畫聚類圖; 7、決定類的個(gè)數(shù),從而得出分類結(jié)果。3、試述 K- 均值聚類的方法原理。K-均值法是一種非譜系聚類法,把每個(gè)樣品聚集到其最近形心均值類中,它是把 樣品聚集成 K 個(gè)類的集合,類的個(gè)數(shù)
11、k 可以預(yù)先給定或者在聚類過程中確定,該方法應(yīng) 用 于比系統(tǒng)聚類法大得多的數(shù)據(jù)組。步驟是把樣品分為K 個(gè)初始類, 進(jìn)行修改, 逐個(gè)分派樣 品到期最近均值的類中 通常采用標(biāo)準(zhǔn)化數(shù)據(jù)或非標(biāo)準(zhǔn)化數(shù)據(jù)計(jì)算歐氏距離 重新計(jì)算接 受新樣品的類和失去樣品的類的形心。重復(fù)這一步直到各類無元素進(jìn)出。4、試述模糊聚類的思想方法。模糊聚類分析是根據(jù)客觀事物間的特征、 親疏程度、 相似性, 通過建立模糊相似關(guān)系 對客觀事物進(jìn)行聚類的分析方法, 實(shí)質(zhì)是根據(jù)研究對象本身的屬性構(gòu)造模糊矩陣, 在此基 礎(chǔ)上根據(jù)一定的隸屬度來確定其分類關(guān)系。 根本思想是要把需要識別的事物與模板進(jìn)行模 糊比擬,從而得到所屬的類別。簡單地說,模糊
12、聚類事先不知道具體的分類類別,而模糊 識別是在分類的情況下進(jìn)行的。模糊聚類分析廣泛應(yīng)用在氣象預(yù)報(bào)、地質(zhì)、農(nóng)業(yè)、林 業(yè)等方面。它有兩種根本方法 : 系統(tǒng)聚類法和逐步聚類法。 該方法多用于定性變量的分類。5、略第 4 章 判別分析1、應(yīng)用判別分析應(yīng)該具備什么樣的條件? 答:判別分析最根本的要求是,分組類型在兩 組以上,每組案例的規(guī)模必須至少在一個(gè)以 上,解釋變量必須是可測量的,才能夠計(jì)算 其平均值和方差。對于判別分析有三個(gè)假設(shè): 1 每一個(gè)判別變量不能是其他判別變量的線性組合。 有時(shí)一個(gè)判別變量與另外的判 別變 量高度相關(guān),或與其的線性組合高度相關(guān),也就是多重共線性。 2 各組變量的協(xié)方差矩陣相等
13、。 判別分析最簡單和最常用的的形式是采用現(xiàn)行判別 函數(shù), 他們是判別變量的簡單線性組合,在各組協(xié)方差矩陣相等的假設(shè)條件下,可以使 用很簡單 的公式來計(jì)算判別函數(shù)和進(jìn)行顯著性檢驗(yàn)。 3 各判別變量之間具有多元正態(tài)分布, 即每個(gè)變量對于所有其他變量的固定值有正 態(tài)分 布,在這種條件下可以精確計(jì)算顯著性檢驗(yàn)值和分組歸屬的概率。2、試述貝葉斯判別法的思路。答:貝葉斯判別法的思路是先假定對研究的對象已有一定的認(rèn)識, 常用先驗(yàn)概率分布來描 述這種認(rèn)識,然后我們?nèi)〉靡粋€(gè)樣本,用樣本來修正已有的認(rèn)識先驗(yàn)概率分布 ,得 到后 驗(yàn)概率分布, 各種統(tǒng)計(jì)推斷都通過后驗(yàn)概率分布來進(jìn)行。 將貝葉斯判別方法用于 判別分析,
14、 就得到貝葉斯判別。3、試述費(fèi)歇判別法的根本思想。答:費(fèi)歇判別法的根本思想是將高維數(shù)據(jù)點(diǎn)投影到低維空間上來, 然而利用方差分析的思 想選出一個(gè)最優(yōu)的投影方向。 因此, 嚴(yán)格的說費(fèi)歇判別分析本身不是一種判別方法, 只是 利用費(fèi)歇統(tǒng)計(jì)量進(jìn)行數(shù)據(jù)預(yù)處理的方法, 以使更有利于用判別分析方法解決問題。 為了有 利于判別,我們選擇投影方向 a 應(yīng)使投影后的 k 個(gè)一元總體能盡量分開同一總體中的 樣品的投影值盡量靠近)。 k 要做到這一點(diǎn),只要投影后的 k 個(gè)一元總體均值有顯著差異,即 可利 用方差分析的方法使組間平方和盡可能的大。那么選取投影方向a使 (a)達(dá)極大即可。4、什么是逐步判別分析?答:具有篩選
15、變量能力的判別方法稱為逐步判別分析法。 逐步判別分析法就是先從所有因 子中挑選一個(gè)具有最顯著判別能力的因子, 然后再挑選第二個(gè)因子,這因子是在第一因子 的根底上具有最顯著判別能力的因子,即第一個(gè)和第二個(gè)因子聯(lián)合起來有顯著判別能力的 因子;接著挑選第三個(gè)因子,這因子是在第一、第二因子的根底上具有最顯著判別能力的 因子。由于因子之間的相互關(guān)系,當(dāng)引進(jìn)了新的因子之后,會使原來已引入的因子失去顯 著判別能力。因此,在引入第三個(gè)因子之后就要先檢驗(yàn)已經(jīng)引入的因子是否還具有顯著判 別能力,如果有就要剔除這個(gè)不顯著的因子; 接著再繼續(xù)引入,直到再沒有顯著能力的因 子可剔除為止,最后利用已選中的變量建立判別函數(shù)
16、。5、簡要表達(dá)判別分析的步驟及流程答:( 1)研究問題:選擇對象,評估一個(gè)多元問題各組的差異,將觀測個(gè)體歸類,確定 組與組之間的判別函數(shù)。(2) 設(shè)計(jì)要點(diǎn):選擇解釋變量,樣本量的考慮,建立分析樣本的保存樣本。(3) 假定:解釋變量的正態(tài)性, 線性關(guān)系,解釋變量間不存在多重共線性, 協(xié)方差陣 相等。( 4)估計(jì)判別函數(shù):聯(lián)立估計(jì)或逐步估計(jì),判別函數(shù)的顯著性。(5)使用分類矩陣評估預(yù)測的精度:確定最優(yōu)臨界得分,確定準(zhǔn)那么來評估判比照率,預(yù)測精確的統(tǒng)計(jì)顯著性。 6 判別函數(shù)的解釋:需要多少個(gè)函數(shù)。評價(jià)單個(gè)函數(shù)主要從判別權(quán)重、判別載荷、偏F 值幾個(gè)方面;評價(jià)兩個(gè)以上的判別函數(shù),分為評價(jià)判別的函數(shù)和評價(jià)
17、合并的函數(shù)。7判別結(jié)果的驗(yàn)證:分開樣本或交叉驗(yàn)證,刻畫組間的差異。6、略第 5 章 主成分分析1、主成分的根本思想是什么?在對某一事物進(jìn)行實(shí)證研究時(shí), 為更全面、 準(zhǔn)確地反映事物的特征及其開展規(guī)律, 往 往考慮與其有關(guān)的多個(gè)指標(biāo), 在多元統(tǒng)計(jì)中也稱為變量。 一方防止遺漏重要信息而考慮盡 可能多的指標(biāo)看,另一方面考慮指標(biāo)的增多,又難以防止信息重疊。希望涉及的變量少, 而得到的信息量有較多。主成分的根本思想是研究如何通過原來的少數(shù)幾個(gè)線性組合來解釋原來變量絕大多 數(shù) 信息的一種多元統(tǒng)計(jì)方法。研究某一問題涉及的眾多變量之間有一定的相關(guān)性,必然 存在 著支配作用的公共因素。通過對原始變量相關(guān)矩陣或協(xié)方
18、差矩陣內(nèi)部結(jié)構(gòu)關(guān)系的研 究,利 用原始變量的線性組合形成幾個(gè)無關(guān)的綜合指標(biāo)主成分來代替原來的指標(biāo)。 通常數(shù)學(xué) 上的處理就是將原來 P 個(gè)指標(biāo)作線性組合, 作為新的綜合指標(biāo)。 最經(jīng)典的做 法就是用F1 選取的第一個(gè)線性組合,即第一個(gè)綜合指標(biāo)的方差來表達(dá),即Var F1 越大,表示 F1 包含的信息越多。因此在所有的線性組合中選取的 F1 應(yīng)該是方差最大的,故稱 F1 為第一 主成分,如果第一主成分缺乏以代表原來 P 個(gè)指標(biāo)的信息,再考慮選取 F2 即選第二個(gè) 線性組 合,為了有效地反映原來信息, F1 已有的信息就不需要再出現(xiàn)在 F2 中,用數(shù)學(xué)語言表 達(dá)就是要求 Cov(F1,F(xiàn)2)=0 那么
19、稱 F2 為第二主成分, 依此類推可以構(gòu)造出第三、 第 四第 P 個(gè)主成分。2、主成分在應(yīng)用中的主要作用是什么?作用:利用原始變量的線性組合形成幾個(gè)綜合指標(biāo)(主成分) ,在保存原始變量主要信息的 前提下起到降維與簡化問題的作用,使得在 研究復(fù)雜問題時(shí)更容易抓住主要矛盾。通過主 成分分析,可以從事物之間錯(cuò)綜復(fù)雜的關(guān) 系中找出一些主要成分,從而能有效利用大量數(shù) 據(jù)進(jìn)行定量分析,解釋變量之間的內(nèi)在 關(guān)系,得到對事物特征及其開展規(guī)律的一些深層次 的啟發(fā),把研究工作引向深入。主成 分分析能降低所研究的數(shù)據(jù)空間的維數(shù),有時(shí)可通過 因子載荷 aij 的結(jié)論,弄清 X 變量 間的某些關(guān)系,多維數(shù)據(jù)的一種圖形表
20、示方法,用主成 分分析篩選變量,可以用較少的 計(jì)算量來選擇,獲得選擇最正確變量子集合的效果。3. 由協(xié)方差陣出發(fā)和由相關(guān)陣出發(fā)求主成分有什么不同?( 1)由協(xié)方差陣出發(fā)設(shè)隨即向量X= (X1 , X2 , X3,? ? Xp)'的協(xié)方差矩陣為厶?1 >?2 >? ? > ?p為 藝的特征值,丫 1 , 丫2, ? yp為矩陣A各特征值對應(yīng)的標(biāo)準(zhǔn)正交特征向量,那么第 i個(gè)主 成分為 Yi= Yi*X1+ *i*X2+ ? ?+ Yi*Xp,i=1,2, ? ? ,p此時(shí) VAR ( Yi ) =?i , COV(Yi,Yj)=0,ij我們把X1 , X2 , X3,?
21、? Xp的協(xié)方差矩陣 藝的非零特征根?1 > ?2 > ? ? > ?p>0向量對應(yīng) 的標(biāo)準(zhǔn)化特征向量 Y, Y, ?yp分別作為系數(shù)向量,丫仁Y'*x, Y2= y *x, ? ?, Yp= Y *X分別稱為隨即向量x的第一主成分,第二主成分? ?第p主成分。Y的分量Y1 , Y2,? ?,Yp依次是X的第一主成分、第二主成分? ?第p主成分的充分必要條件是:(1) Y=P'*X,即P為p階正交 陣,(2)Y的分量 之間互不 相關(guān),即D(Y) =diag( ?1,?2, ? ? ,?p),(3)Y的p個(gè)分量是按方差由大到小排列,即?1 > ?2
22、> ? ? > ?p。(2) 由相關(guān)陣出發(fā)對原始變量 X 進(jìn)行標(biāo)準(zhǔn)化,Z=(吝1/2F-1*(X- p) cov ( Z) =R原始變量的相關(guān)矩陣實(shí)際上就是對原始變量標(biāo)準(zhǔn)化后的協(xié)方差矩陣, 因此,有相關(guān)矩陣求 主成分的過程與主成分個(gè)數(shù)確實(shí)定準(zhǔn)那么實(shí)際上是與由協(xié)方差矩陣出發(fā)求主成分的過程與 主成分個(gè)數(shù)確實(shí)定準(zhǔn)那么相一致的。入,Y分別表示相關(guān)陣R的特征根值與對應(yīng)的標(biāo)準(zhǔn)正交特征向量,此時(shí),求得的主成分與原始變量的關(guān)系式為:Yi= Y*Z= Y*( N1/2)A-1*(X- p)在實(shí)際研究中 , 有時(shí)單個(gè)指標(biāo)的方差對研究目的起關(guān)鍵作用,為了到達(dá)研究目的,此時(shí)用協(xié)方差矩陣進(jìn)行主成分分析恰到好
23、處。有些數(shù)據(jù)涉及到指標(biāo)的不同度量尺度使指標(biāo) 方差之間不具有可比性 , 對于這類數(shù)據(jù)用協(xié)方差矩陣進(jìn)行主成分分析也有不妥。 相關(guān)系 數(shù)矩陣計(jì)算主成分其優(yōu)勢效應(yīng)僅表達(dá)在相關(guān)性大、相關(guān)指標(biāo)數(shù)多的一類指標(biāo)上。防止單 個(gè)指標(biāo)方差對主成分分析產(chǎn)生的負(fù)面影響,自然會想到把單個(gè)指標(biāo)的方差從協(xié)方差矩陣 中剝離,而相關(guān)系數(shù)矩陣恰好能到達(dá)此目的。4、略第 6 章 因子分析1、因子分析與主成分分析有什么本質(zhì)不同? 答: 1因子分析把諸多變量看成由對每 一個(gè)變量都有作用的一些公共因子和一些僅對某 一個(gè)變量有作用的特殊因子線性組合而 成,因此,我們的目的就是要從數(shù)據(jù)中探查能對變量起解釋作用的公共因子和特殊因子, 以及公共因
24、子和特殊因子的線性組合。 主成分分析 那么簡單一些,它只是從空間生成的角度尋找能解釋諸多變量絕大局部變異的幾組彼此不相 關(guān)的新變量2因子分析中,把變量表示成各因子的線性組合,而主成分分析中,把主成 分表示成各變量的線性組合3主成分分析中不需要有一些專門假設(shè),因子分析那么需要一些假設(shè),因子分析的假設(shè) 包 括:各個(gè)因子之間不相關(guān),特殊因子之間不相關(guān),公共因子和特殊因子之間不相關(guān)。4在因子分析中,提取主因子的方法不僅有主成分法,還有極大似然法等,基于這些 不 同算法得到的結(jié)果一般也不同。而主成分分析只能用主成分法提取。5 主成分分析中, 當(dāng)給定的協(xié)方差矩陣或者相關(guān)矩陣的特征根唯一時(shí),主成分一般是固定
25、;而因子分析中, 因子不是固定的,可以旋轉(zhuǎn)得到不同的因子。6在因子分析中,因子個(gè)數(shù)需要分析者指定,結(jié)果隨指定的因子數(shù)不同而不同。在主 成 分分析中,主成分的數(shù)量是一定的,一般有幾個(gè)變量就有幾個(gè)主成分。 7與主成分分析相比, 由于因子分析可以使用旋轉(zhuǎn)技術(shù)幫助解釋因子, 在解釋方面更加有優(yōu)勢。 而如果 想把現(xiàn)有的變量變成少數(shù)幾個(gè)新的變量 新的變量幾乎帶有原來所有變量的信息 來進(jìn)行后續(xù)的分析,那么可以使用主成分分析2、因子載荷 aij 的統(tǒng)計(jì)定義是什么?它在實(shí)際問題的分析中的作用是什么?答:(1 )因子載荷a。的統(tǒng)計(jì)定義:是原始變量Xi與公共因子Fj的協(xié)方差,Xi與Fj (i1,2,., p; j
26、1,2,., m)都是均值為0,方差為1的變量,因此aij同時(shí)也是Xi與Fj的相關(guān)系數(shù)。(2)記 g2j a12j a22j . ap2j(j 1,2,.,m),那么 gj2表示的是公共因子 Fj對于 X 的每一分量 Xi(i 1,2,., p) 所提供的方差的總和,稱為公共因子 Fj對原始變量X的方奉獻(xiàn),它是衡量公共因子相對 重要性的指標(biāo)。g2j越大,說明公共因子Fj對Xi的奉獻(xiàn)越大,或者說對 X的影響作用就 越大。如果因子載荷矩陣對 A 的所有的 gj2( j 1,2,.,m) 都計(jì)算出來,并按大小 排序,就可 以依此提煉出最有影響的公共因子。3、略第 7 章 對應(yīng)分析1、試述對應(yīng)分析的思
27、想方法及特點(diǎn)。?思想 :對應(yīng)分析又稱為相應(yīng)分析,也稱 RQ 分析。是因子分子根底開展起來的一種多 元統(tǒng) 計(jì)分析方法。它主要通過分析定性變量構(gòu)成的列聯(lián)表來揭示變量之間的關(guān)系。當(dāng)我 們對同 一觀測數(shù)據(jù)施加 R 和 Q 型因子分析,并分別保存兩個(gè)公共因子,那么是對應(yīng)分析 的初步。對應(yīng)分析的根本思想是將一個(gè)聯(lián)列表的行和列中各元素的比例結(jié)構(gòu)以點(diǎn)的形式在較低維 的 空間中表示出來。 它最大特點(diǎn)是能把眾多的樣品和眾多的變量同時(shí)作到同一張圖解上, 將 樣品的大類及其屬性在圖上直觀而又明了地表示出來,具有直觀性。另外,它還省去 了因 子選擇和因子軸旋轉(zhuǎn)等復(fù)雜的數(shù)學(xué)運(yùn)算及中間過程,可以從因子載荷圖上對樣品進(jìn)行直觀
28、 的分類,而且能夠指示分類的主要參數(shù) 主因子 以及分類的依據(jù),是一種直觀、簡單、 方便的多元統(tǒng)計(jì)方法。 ?特點(diǎn):對應(yīng)分析的根本思想是將一個(gè)聯(lián)列表的行和列中各元素的比例結(jié)構(gòu)以點(diǎn)的形式在較 低維的空間中表示出來。 它最大特點(diǎn)是能把眾多的樣品和眾多的變量同時(shí)作到同一張圖解 上,將樣品的大類及其屬性在圖上直觀而又明了地表示出來,具有直觀性。另外,它還省 去了因子選擇和因子軸旋轉(zhuǎn)等復(fù)雜的數(shù)學(xué)運(yùn)算及中間過程, 可以從因子載荷圖上對樣品進(jìn) 行直觀的分類, 而且能夠指示分類的主要參數(shù) 主因子以及分類的依據(jù), 是一種直觀、 簡 單、方便的多元統(tǒng)計(jì)方法。2、試述對應(yīng)分析中總慣量的意義。 ?2 總慣量不僅反映了行剖
29、面集定義的各點(diǎn)與其重心加權(quán)距離的總和,同時(shí)與 x2 統(tǒng)計(jì)量僅相2差一個(gè)常數(shù) ,而 x2 統(tǒng)計(jì)量反映了列聯(lián)表橫聯(lián)與縱聯(lián)的相關(guān)關(guān)系 ,因此總慣量也反映了兩個(gè)屬 性變量各狀態(tài)之間的相關(guān)關(guān)系。對應(yīng)分析就是在對總慣量信息損失最小的前提下,簡化數(shù) 據(jù)結(jié)構(gòu)以反映兩屬性變量之間的相關(guān)關(guān)系。3、略第 8 章 典型相關(guān)分析1、試述典型相關(guān)分析的統(tǒng)計(jì)思想及該方法在研究實(shí)際問題中的作用。答: 典型相關(guān)分析是研究兩組變量之間相關(guān)關(guān)系的一種多元統(tǒng)計(jì)方法。用于揭示兩組變 量之間的內(nèi)在聯(lián)系。典型相關(guān)分析的目的是識別并量化兩組變量之間的聯(lián)系。 將兩組變 量相 關(guān)關(guān)系的分析轉(zhuǎn)化為一組變量的線性組合與另一組變量線性組合之間的相關(guān)關(guān)系。根本思想:( 1)在每組變量中找出變量的線性組合,使得兩組的線性組合之間具有最大的相關(guān)系數(shù)。即:X ? ( X1, X2, , , X p)、X? ( X1, X2, , , Xq)是兩組相互關(guān)聯(lián)的隨機(jī)變量,分別在兩組變量中選取假設(shè)干有代表性的綜合變量 Ui 、Vi ,使是原變量的線性組合。Ui ? a1X1? a2 X2? ? aP X P = a XVi ? b1Y1 ?b2 Y2 ? ?bq Yq = b ' 丫在 D(a?X ) ? D(b ?X) ? 1 的條件下,使得 ? (a?X , b?X) 到達(dá)最大。( 2)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五版股份質(zhì)押回購交易合同3篇
- 二零二四二手鋼鐵材料購買與運(yùn)輸合同3篇
- 二零二五版打印機(jī)銷售渠道資源整合與共享合同3篇
- 年度聚碳酸酯(PC)及合金市場分析及競爭策略分析報(bào)告
- 二零二四年工業(yè)自動(dòng)化設(shè)備安裝與生產(chǎn)流程優(yōu)化合同3篇
- 2024-2025學(xué)年新教材高中數(shù)學(xué)第十章復(fù)數(shù)10.2.2第1課時(shí)復(fù)數(shù)的乘法教師用書教案新人教B版必修第四冊
- 二零二五年文秘與檔案管理勞動(dòng)合同2篇
- 二零二五年度網(wǎng)絡(luò)安全風(fēng)險(xiǎn)評估與防護(hù)合同3篇
- 2025年星酒店投資技術(shù)服務(wù)與酒店客房智能化改造合同3篇
- 二零二五年度特色餐飲店承包經(jīng)營權(quán)轉(zhuǎn)讓合同3篇
- 2025-2030年中國MPV汽車市場全景調(diào)研及投資策略分析報(bào)告
- 二零二五年度數(shù)據(jù)存儲與備份外包服務(wù)協(xié)議2篇
- 家政服務(wù)與社區(qū)合作方案
- 2024年深圳市龍崗區(qū)城市建設(shè)投資集團(tuán)有限公司招聘筆試真題
- 2024-2025學(xué)年北京市朝陽區(qū)高三上學(xué)期期末考試數(shù)學(xué)試卷(含答案)
- 第五單元《習(xí)作例文:風(fēng)向袋的制作》說課稿-2024-2025學(xué)年五年級上冊語文統(tǒng)編版
- 四年級數(shù)學(xué)(除數(shù)是兩位數(shù))計(jì)算題專項(xiàng)練習(xí)及答案
- 四川省綿陽市涪城區(qū)2024-2025學(xué)年九年級上學(xué)期1月期末歷史試卷(含答案)
- 2025年山東水發(fā)集團(tuán)限公司社會招聘高頻重點(diǎn)提升(共500題)附帶答案詳解
- JJG 1204-2025電子計(jì)價(jià)秤檢定規(guī)程(試行)
- 2024年計(jì)算機(jī)二級WPS考試題庫(共380題含答案)
評論
0/150
提交評論