多元統(tǒng)計復(fù)習題附答案_第1頁
多元統(tǒng)計復(fù)習題附答案_第2頁
多元統(tǒng)計復(fù)習題附答案_第3頁
多元統(tǒng)計復(fù)習題附答案_第4頁
多元統(tǒng)計復(fù)習題附答案_第5頁
已閱讀5頁,還剩12頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、復(fù)習題原文:答案:4.2 試述判別分析的實質(zhì)。4.3 簡述距離判別法的基本思想和方法。4.4 簡述貝葉斯判別法的基本思想和方法。4.5 簡述費希爾判別法的基本思想和方法。4.6 試析距離判別法、貝葉斯判別法和費希爾判別法的異同。4.2 試述判別分析的實質(zhì)。答:判別分析就是希望利用已經(jīng)測得的變量數(shù)據(jù),找出一種判別函數(shù),使得這一函數(shù)具有某種最優(yōu)性質(zhì),能把屬于不同類別的樣本點盡可能地區(qū)別開來。設(shè)R1,R2,Rk是p維空間R p的k個子集,如果它們互不相交,且它們的和集為Rp,則稱R1,R2Rp為Rp的一個劃分。判別分析問題實質(zhì)上就是在某種意義上,以最優(yōu)的性質(zhì)對p維空間Rp構(gòu)造一個“劃分”,這個“劃分

2、”就構(gòu)成了一個判別規(guī)則。4.3 簡述距離判別法的基本思想和方法。答:距離判別問題分為兩個總體的距離判別問題和多個總體的判別問題。其基本思想都是分別計算樣本與各個總體的距離(馬氏距離),將距離近的判別為一類。兩個總體的距離判別問題設(shè)有協(xié)方差矩陣相等的兩個總體G1和G2,其均值分別是m1和m 2,對于一個新的樣品X,要判斷它來自哪個總體。計算新樣品X到兩個總體的馬氏距離D2(X,G1)和D2(X,G2),則 X G1 ,D2(X,G1) D2(X,G2)X G2 ,D2(X,G1)> D2(X,G2,具體分析, 記 則判別規(guī)則為 X G1 ,W(X)0X G2 ,W(X)<0多個總體的

3、判別問題。設(shè)有個總體,其均值和協(xié)方差矩陣分別是和,且。計算樣本到每個總體的馬氏距離,到哪個總體的距離最小就屬于哪個總體。具體分析, 取,??梢匀【€性判別函數(shù)為, 相應(yīng)的判別規(guī)則為 若 4.4 簡述貝葉斯判別法的基本思想和方法?;舅枷耄涸O(shè)k個總體,其各自的分布密度函數(shù),假設(shè)k個總體各自出現(xiàn)的概率分別為,。設(shè)將本來屬于總體的樣品錯判到總體時造成的損失為,。設(shè)個總體相應(yīng)的維樣本空間為 。在規(guī)則下,將屬于的樣品錯判為的概率為 則這種判別規(guī)則下樣品錯判后所造成的平均損失為 則用規(guī)則來進行判別所造成的總平均損失為 貝葉斯判別法則,就是要選擇一種劃分,使總平均損失達到極小?;痉椒ǎ毫?,則 若有另一劃分,

4、則在兩種劃分下的總平均損失之差為 因為在上對一切成立,故上式小于或等于零,是貝葉斯判別的解。從而得到的劃分為 4.5 簡述費希爾判別法的基本思想和方法。答:基本思想:從個總體中抽取具有個指標的樣品觀測數(shù)據(jù),借助方差分析的思想構(gòu)造一個線性判別函數(shù) 系數(shù)可使得總體之間區(qū)別最大,而使每個總體內(nèi)部的離差最小。將新樣品的個指標值代入線性判別函數(shù)式中求出值,然后根據(jù)判別一定的規(guī)則,就可以判別新的樣品屬于哪個總體。4.6 試析距離判別法、貝葉斯判別法和費希爾判別法的異同。答: 費希爾判別與距離判別對判別變量的分布類型無要求。二者只是要求有各類母體的兩階矩存在。而貝葉斯判別必須知道判別變量的分布類型。因此前兩

5、者相對來說較為簡單。 當k=2時,若1=2=則費希爾判別與距離判別等價。當判別變量服從正態(tài)分布時,二者與貝葉斯判別也等價。 當12時,費希爾判別用1+2作為共同協(xié)差陣,實際看成等協(xié)差陣,此與距離判別、貝葉斯判別不同。 距離判別可以看為貝葉斯判別的特殊情形。貝葉斯判別的判別規(guī)則是 X G1 ,W(X)lndX G2 ,W(X)<lnd距離判別的判別規(guī)則是 X G1 ,W(X)0X G2 ,W(X)<0二者的區(qū)別在于閾值點。當,時,。二者完全相同。4.7 設(shè)有兩個二元總體G1和G2 ,從中分別抽取樣本計算得到 X(1)=51, X(2)=3-2,Sp=5.82.12.17.6 假設(shè)1=

6、2,試用距離判別法建立判別函數(shù)和判別規(guī)則。 樣品X=(6,0)應(yīng)屬于哪個總體?解:1=X(1)=51 ,2=X(2)=3-2 , =1+22=4-0.5Wp=x-=x-'-11-2x-'=6,0-4,0.5=2,0.5-1=139677.6-2.1-2.15.81-2=(2,3)'Wp=2,0.5139677.6-2.1-2.15.823=24.439.67>0 X G1即樣品X屬于總體G15.1 判別分析和聚類分析有何區(qū)別?5.2 試述系統(tǒng)聚類的基本思想。5.3 對樣品和變量進行聚類分析時, 所構(gòu)造的統(tǒng)計量分別是什么?簡要說明為什么這樣構(gòu)造5.5試述K均值法與系

7、統(tǒng)聚類法的異同。5.1 判別分析和聚類分析有何區(qū)別?答:即根據(jù)一定的判別準則,判定一個樣本歸屬于哪一類。具體而言,設(shè)有n個樣本,對每個樣本測得p項指標(變量)的數(shù)據(jù),已知每個樣本屬于k個類別(或總體)中的某一類,通過找出一個最優(yōu)的劃分,使得不同類別的樣本盡可能地區(qū)別開,并判別該樣本屬于哪個總體。聚類分析是分析如何對樣品(或變量)進行量化分類的問題。在聚類之前,我們并不知道總體,而是通過一次次的聚類,使相近的樣品(或變量)聚合形成總體。通俗來講,判別分析是在已知有多少類及是什么類的情況下進行分類,而聚類分析是在不知道類的情況下進行分類。5.2 試述系統(tǒng)聚類的基本思想。答:系統(tǒng)聚類的基本思想是:距

8、離相近的樣品(或變量)先聚成類,距離相遠的后聚成類,過程一直進行下去,每個樣品(或變量)總能聚到合適的類中。5.3 對樣品和變量進行聚類分析時, 所構(gòu)造的統(tǒng)計量分別是什么?簡要說明為什么這樣構(gòu)造?答:對樣品進行聚類分析時,用距離來測定樣品之間的相似程度。因為我們把n個樣本看作p維空間的n個點。點之間的距離即可代表樣品間的相似度。常用的距離為(一)閔可夫斯基距離:q取不同值,分為(1)絕對距離() (2)歐氏距離() (3)切比雪夫距離() (二)馬氏距離 (三)蘭氏距離 對變量的相似性,我們更多地要了解變量的變化趨勢或變化方向,因此用相關(guān)性進行衡量。將變量看作p維空間的向量,一般用(一)夾角余

9、弦(二)相關(guān)系數(shù)5.5試述K均值法與系統(tǒng)聚類法的異同。答:相同:K均值法和系統(tǒng)聚類法一樣,都是以距離的遠近親疏為標準進行聚類的。不同:系統(tǒng)聚類對不同的類數(shù)產(chǎn)生一系列的聚類結(jié)果,而K均值法只能產(chǎn)生指定類數(shù)的聚類結(jié)果。具體類數(shù)的確定,離不開實踐經(jīng)驗的積累;有時也可以借助系統(tǒng)聚類法以一部分樣品為對象進行聚類,其結(jié)果作為K均值法確定類數(shù)的參考。6.1 試述主成分分析的基本思想。6.2 主成分分析的作用體現(xiàn)在何處?6.3 簡述主成分分析中累積貢獻率的具體含義。6.5 試述根據(jù)協(xié)差陣進行主成分分析和根據(jù)相關(guān)陣進行主成分分析的區(qū)別。6.1 試述主成分分析的基本思想。答:我們處理的問題多是多指標變量問題,由于

10、多個變量之間往往存在著一定程度的相關(guān)性,人們希望能通過線性組合的方式從這些指標中盡可能快的提取信息。當?shù)谝粋€組合不能提取更多信息時,再考慮第二個線性組合。繼續(xù)這個過程,直到提取的信息與原指標差不多時為止。這就是主成分分析的基本思想。6.2 主成分分析的作用體現(xiàn)在何處?答:一般說來,在主成分分析適用的場合,用較少的主成分就可以得到較多的信息量。以各個主成分為分量,就得到一個更低維的隨機向量;主成分分析的作用就是在降低數(shù)據(jù)“維數(shù)”的同時又保留了原數(shù)據(jù)的大部分信息。6.3 簡述主成分分析中累積貢獻率的具體含義。答:主成分分析把個原始變量的總方差分解成了個相互獨立的變量的方差之和。主成分分析的目的是減

11、少變量的個數(shù),所以一般不會使用所有個主成分的,忽略一些帶有較小方差的主成分將不會給總方差帶來太大的影響。這里我們稱 為第個主成分的貢獻率。第一主成分的貢獻率最大,這表明綜合原始變量的能力最強,而的綜合能力依次遞減。若只取個主成分,則稱 為主成分的累計貢獻率,累計貢獻率表明綜合的能力。通常取,使得累計貢獻率達到一個較高的百分數(shù)(如85以上)。 6.5 試述根據(jù)協(xié)差陣進行主成分分析和根據(jù)相關(guān)陣進行主成分分析的區(qū)別。答:從相關(guān)陣求得的主成分與協(xié)差陣求得的主成分一般情況是不相同的。從協(xié)方差矩陣出發(fā)的,其結(jié)果受變量單位的影響。主成分傾向于多歸納方差大的變量的信息,對于方差小的變量就可能體現(xiàn)得不夠,也存在

12、“大數(shù)吃小數(shù)”的問題。實際表明,這種差異有時很大。我們認為,如果各指標之間的數(shù)量級相差懸殊,特別是各指標有不同的物理量綱的話,較為合理的做法是使用R代替。對于研究經(jīng)濟問題所涉及的變量單位大都不統(tǒng)一,采用R代替后,可以看作是用標準化的數(shù)據(jù)做分析,這樣使得主成分有現(xiàn)實經(jīng)濟意義,不僅便于剖析實際問題,又可以避免突出數(shù)值大的變量。7.1 試述因子分析與主成分分析的聯(lián)系與區(qū)別。7.2 因子分析主要可應(yīng)用于哪些方面?7.3 簡述因子模型X=AY+中載荷矩陣A的統(tǒng)計意義。7.4 在進行因子分析時,為什么要進行因子旋轉(zhuǎn)?最大方差因子旋轉(zhuǎn)的基本思路是什么?7.1 試述因子分析與主成分分析的聯(lián)系與區(qū)別。答:因子分

13、析與主成分分析的聯(lián)系是:兩種分析方法都是一種降維、簡化數(shù)據(jù)的技術(shù)。兩種分析的求解過程是類似的,都是從一個協(xié)方差陣出發(fā),利用特征值、特征向量求解。因子分析可以說是主成分分析的姐妹篇,將主成分分析向前推進一步便導(dǎo)致因子分析。因子分析也可以說成是主成分分析的逆問題。如果說主成分分析是將原指標綜合、歸納,那么因子分析可以說是將原指標給予分解、演繹。因子分析與主成分分析的主要區(qū)別是:主成分分析本質(zhì)上是一種線性變換,將原始坐標變換到變異程度大的方向上為止,突出數(shù)據(jù)變異的方向,歸納重要信息。而因子分析是從顯在變量去提煉潛在因子的過程。此外,主成分分析不需要構(gòu)造分析模型而因子分析要構(gòu)造因子模型。7.2 因子分

14、析主要可應(yīng)用于哪些方面?答:因子分析是一種通過顯在變量測評潛在變量,通過具體指標測評抽象因子的統(tǒng)計分析方法。目前因子分析在心理學(xué)、社會學(xué)、經(jīng)濟學(xué)等學(xué)科中都有重要的應(yīng)用。具體來說,因子分析可以用于分類。如用考試分數(shù)將學(xué)生的學(xué)習狀況予以分類;用空氣中各種成分的比例對空氣的優(yōu)劣予以分類等等因子分析可以用于探索潛在因素。即是探索未能觀察的或不能觀測的的潛在因素是什么,起的作用如何等。對我們進一步研究與探討指示方向。在社會調(diào)查分析中十分常用。因子分析的另一個作用是用于時空分解。如研究幾個不同地點的不同日期的氣象狀況,就用因子分析將時間因素引起的變化和空間因素引起的變化分離開來從而判斷各自的影響和變化規(guī)律

15、。7.3 簡述因子模型X=AY+中載荷矩陣A的統(tǒng)計意義。 答:對于因子模型 因子載荷陣為與的協(xié)方差為:=若對作標準化處理,rXi,Fj=,因此 一方面表示對的依賴程度;另一方面也反映了變量對公共因子的相對重要性。變量共同度 說明變量的方差由兩部分組成:第一部分為共同度,它描述了全部公共因子對變量的總方差所作的貢獻,反映了公共因子對變量的影響程度。第二部分為特殊因子對變量的方差的貢獻,通常稱為個性方差。而公共因子對的貢獻表示同一公共因子對各變量所提供的方差貢獻之總和,它是衡量每一個公共因子相對重要性的一個尺度。7.4 在進行因子分析時,為什么要進行因子旋轉(zhuǎn)?最大方差因子旋轉(zhuǎn)的基本思路是什么?答:

16、因子分析的目標之一就是要對所提取的抽象因子的實際含義進行合理解釋。但有時直接根據(jù)特征根、特征向量求得的因子載荷陣難以看出公共因子的含義。這種因子模型反而是不利于突出主要矛盾和矛盾的主要方面的,也很難對因子的實際背景進行合理的解釋。這時需要通過因子旋轉(zhuǎn)的方法,使每個變量僅在一個公共因子上有較大的載荷,而在其余的公共因子上的載荷比較小。最大方差旋轉(zhuǎn)法是一種正交旋轉(zhuǎn)的方法,其基本思路為:AA*d11d12dp1dp2 d1mdpm 其中令 的第列元素平方的相對方差可定義為最大方差旋轉(zhuǎn)法就是選擇正交矩陣,使得矩陣所有m個列元素平方的相對方差之和達到最大。8.1 什么是對應(yīng)分析?它與因子分析有何關(guān)系?8

17、.2試述對應(yīng)分析的基本思想。8.3 試述對應(yīng)分析的基本步驟。8.1 什么是相應(yīng)分析?它與因子分析有何關(guān)系?答:相應(yīng)分析也叫對應(yīng)分析,通常意義下,是指兩個定性變量的多種水平進行相應(yīng)性研究。其特點是它所研究的變量可以是定性的。相應(yīng)分析與因子分析的關(guān)系是: 在進行相應(yīng)分析過程中,計算出過渡矩陣后,要分別對變量和樣本進行因子分析。因此,因子分析是相應(yīng)分析的基礎(chǔ)。具體而言,r(Zuj)=j(Zuj)式表明Zuj為相對于特征值j的關(guān)于因素A各水平構(gòu)成的協(xié)差陣r的特征向量。從而建立了相應(yīng)分析中R型因子分析和Q型因子分析的關(guān)系。8.2試述相應(yīng)分析的基本思想。答:相應(yīng)分析,是指對兩個定性變量的多種水平進行分析。

18、設(shè)有兩組因素A和B,其中因素A包含r個水平,因素B包含c個水平。對這兩組因素作隨機抽樣調(diào)查,得到一個的二維列聯(lián)表,記為。要尋求列聯(lián)表列因素A和行因素B的基本分析特征和最優(yōu)列聯(lián)表示。相應(yīng)分析即是通過列聯(lián)表的轉(zhuǎn)換,使得因素A 和因素B具有對等性,從而用相同的因子軸同時描述兩個因素各個水平的情況。把兩個因素的各個水平的狀況同時反映到具有相同坐標軸的因子平面上,從而得到因素A、B的聯(lián)系。8.3 試述相應(yīng)分析的基本步驟。答:(1)建立列聯(lián)表設(shè)受制于某個載體總體的兩個因素為和,其中因素包含個水平,因素包含個水平。對這兩組因素作隨機抽樣調(diào)查,得到一個的二維列聯(lián)表,記為。(2)將原始的列聯(lián)資料K=(kij)

19、r ´c變換成矩陣Z=(zij) r ´c,使得zij對因素A和列因素B具有對等性。通過變換Zij=kij-ki.k.jrki.k.j。得,。(3)對因素B 進行因子分析。計算出的特征向量1,2,m 及其相應(yīng)的特征向量 t1,t2,tm計算出因素B的因子U1, U2U=(1t1,2t2,mtm)(4)對因素A 進行因子分析。計算出的特征向量1,2,m 及其相應(yīng)的特征向量v1,v2,vm計算出因素A的因子V1, V2Vm=(1v1,2v2,mvm(5)選取因素B 的第一、第二公因子U1, U2 選取因素A 的第一、第二公因子V1, V2將B因素的c個水平(U11, U12),

20、(U21, U22),(Uc1, Uc2)A因素的r個水平(V11, V12)(V21, V22)(Vr1, Vr2)同時反應(yīng)到相同坐標軸的因子平面上上(6)根據(jù)因素A和因素B各個水平在平面圖上的分布,描述兩因素及各個水平之間的相關(guān)關(guān)系。9.1 什么是典型相關(guān)分析?簡述其基本思想。9.2 什么是典型變量?它具有哪些性質(zhì)?9.3 試分析一組變量的典型變量與其主成分的聯(lián)系與區(qū)別。9.1 什么是典型相關(guān)分析?簡述其基本思想。 答: 典型相關(guān)分析是研究兩組變量之間相關(guān)關(guān)系的一種多元統(tǒng)計方法。用于揭示兩組變量之間的內(nèi)在聯(lián)系。典型相關(guān)分析的目的是識別并量化兩組變量之間的聯(lián)系。將兩組變量相關(guān)關(guān)系的分析轉(zhuǎn)化為

21、一組變量的線性組合與另一組變量線性組合之間的相關(guān)關(guān)系。 基本思想:(1)在每組變量中找出變量的線性組合,使得兩組的線性組合之間具有最大的相關(guān)系數(shù)。即:若設(shè)、是兩組相互關(guān)聯(lián)的隨機變量,分別在兩組變量中選取若干有代表性的綜合變量Ui、Vi,使是原變量的線性組合。在的條件下,使得達到最大。(2)選取和最初挑選的這對線性組合不相關(guān)的線性組合,使其配對,并選取相關(guān)系數(shù)最大的一對。(3)如此繼續(xù)下去,直到兩組變量之間的相關(guān)性被提取完畢為此。9.2 什么是典型變量?它具有哪些性質(zhì)?答:在典型相關(guān)分析中,在一定條件下選取系列線性組合以反映兩組變量之間的線性關(guān)系,這被選出的線性組合配對被稱為典型變量。具體來說,

22、在的條件下,使得達到最大,則稱、是、的第一對典型相關(guān)變量。典型變量性質(zhì):典型相關(guān)量化了兩組變量之間的聯(lián)系,反映了兩組變量的相關(guān)程度。1. 2. 9.3 試分析一組變量的典型變量與其主成分的聯(lián)系與區(qū)別。答:一組變量的典型變量和其主成分都是經(jīng)過線性變換計算矩陣特征值與特征向量得出的。主成分分析只涉及一組變量的相互依賴關(guān)系而典型相關(guān)則擴展到兩組變量之間的相互依賴關(guān)系之中,度量了這兩組變量之間聯(lián)系的強度。4.8 某超市經(jīng)銷十種品牌的飲料,其中有四種暢銷,三種滯銷,三種平銷。下表是這十種品牌飲料的銷售價格(元)和顧客對各種飲料的口味評分、信任度評分的平均數(shù)。6.8利用主成分分析法,綜合評價六個工業(yè)行業(yè)的

23、經(jīng)濟效益指標。6.10 根據(jù)習題5.10中2003年我國省會城市和計劃單列市的主要經(jīng)濟指標數(shù)據(jù),利用主成分分析法對這些地區(qū)進行分類。7.8 某汽車組織欲根據(jù)一系列指標來預(yù)測汽車的銷售情況,為了避免有些指標間的相關(guān)關(guān)系影響預(yù)測結(jié)果,需首先進行因子分析來簡化指標系統(tǒng)。下表是抽查歐洲某汽車市場7個品牌不同型號的汽車的各種指標數(shù)據(jù),試用因子分析法找出其簡化的指標系統(tǒng)。4.8 某超市經(jīng)銷十種品牌的飲料,其中有四種暢銷,三種滯銷,三種平銷。下表是這十種品牌飲料的銷售價格(元)和顧客對各種飲料的口味評分、信任度評分的平均數(shù)。銷售情況產(chǎn)品序號銷售價格口味評分信任度評分暢銷12.25822.56733.0394

24、3.286平銷52.87663.58774.898滯銷81.73492.242102.743 根據(jù)數(shù)據(jù)建立貝葉斯判別函數(shù),并根據(jù)此判別函數(shù)對原樣本進行回判。 現(xiàn)有一新品牌的飲料在該超市試銷,其銷售價格為3.0,顧客對其口味的評分平均為8,信任評分平均為5,試預(yù)測該飲料的銷售情況。解:增加group變量,令暢銷、平銷、滯銷分別為group1、2、3;銷售價格為X1,口味評分為X2,信任度評分為X3,用spss 解題的步驟如下:1. 在SPSS窗口中選擇AnalyzeClassifyDiscriminate,調(diào)出判別分析主界面,將左邊的變量列表中的“group”變量選入分組變量中,將X1、X2、X

25、3變量選入自變量中,并選擇Enter independents together單選按鈕,即使用所有自變量進行判別分析。2. 點擊Define Range按鈕,定義分組變量的取值范圍。本例中分類變量的范圍為1到3,所以在最小值和最大值中分別輸入1和3。單擊Continue按鈕,返回主界面。如圖4.1 圖4.1 判別分析主界面3. 單擊Statistics按鈕,指定輸出的描述統(tǒng)計量和判別函數(shù)系數(shù)。選中Function Coefficients欄中的Fishers:給出Bayes判別函數(shù)的系數(shù)。(注意:這個選項不是要給出Fisher判別函數(shù)的系數(shù)。這個復(fù)選框的名字之所以為Fishers,是因為按判

26、別函數(shù)值最大的一組進行歸類這種思想是由Fisher提出來的。這里極易混淆,請讀者注意辨別。)如圖4.2。單擊Continue按鈕,返回主界面。 圖4.2 statistics子對話框4. 單擊Classify按鈕,彈出classification子對話框,選中Display選項欄中的Summary table復(fù)選框,即要求輸出錯判矩陣,以便實現(xiàn)題中對原樣本進行回判的要求。如圖4.3。 圖4.3 classification對話框5. 返回判別分析主界面,單擊OK按鈕,運行判別分析過程。1) 根據(jù)判別分析的結(jié)果建立Bayes判別函數(shù):Bayes判別函數(shù)的系數(shù)見表4.1。表中每一列表示樣本判入相應(yīng)

27、類的Bayes判別函數(shù)系數(shù)。由此可建立判別函數(shù)如下:Group1: Group2: Group3: 將各樣品的自變量值代入上述三個Bayes判別函數(shù),得到三個函數(shù)值。比較這三個函數(shù)值,哪個函數(shù)值比較大就可以判斷該樣品判入哪一類。 Classification Function Coefficientsgroup123x1-11.689-10.707-2.194x212.29713.3614.960x316.76117.0866.447(Constant)-81.843-94.536-17.449Fisher's linear discriminant functions 表4.1 Ba

28、yes判別函數(shù)系數(shù)根據(jù)此判別函數(shù)對樣本進行回判,結(jié)果如表4.2。從中可以看出在4種暢銷飲料中,有3種被正確地判定,有1種被錯誤地判定為平銷飲料,正確率為75%。在3種平銷飲料中,有2種被正確判定,有1種被錯誤地判定為暢銷飲料,正確率為66.7%。3種滯銷飲料均正確判定。整體的正確率為80.0%。Classification ResultsagroupPredicted Group MembershipTotal123OriginalCount131042120330033%175.025.0.0100.0233.366.7.0100.03.0.0100.0100.0a. 80.0% of or

29、iginal grouped cases correctly classified. 表4.2 錯判矩陣2) 該新飲料的,將這3個自變量代入上一小題得到的Bayes判別函數(shù),的值最大,該飲料預(yù)計平銷。也可通過在原樣本中增加這一新樣本,重復(fù)上述的判別過程,并在classification子對話框中同時要求輸出casewise results,運行判別過程,得到相同的結(jié)果。6.8利用主成分分析法,綜合評價六個工業(yè)行業(yè)的經(jīng)濟效益指標。單位:(億元)行業(yè)名稱資產(chǎn)總計固定資產(chǎn)凈值平均余額產(chǎn)品銷售收入利潤總額煤炭開采和選業(yè)6917.23032.7683.361.6石油和天然氣開采業(yè)5675.93926.2

30、717.533877黑色金屬礦采選業(yè)768.1221.296.513.8有色金屬礦采選業(yè)622.4248116.421.6非金屬礦采選業(yè)699.9291.584.96.2其它采礦業(yè)1.60.50.30解:令資產(chǎn)總計為X1,固定資產(chǎn)凈值平均余額為X2,產(chǎn)品銷售收入為X3,利潤總額為X4,用SPSS對這六個行業(yè)進行主成分分析的方法如下:1. 在SPSS窗口中選擇AnalyzeData ReductionFactor菜單項,調(diào)出因子分析主界面,并將變量移入Variables框中,其他均保持系統(tǒng)默認選項,單擊OK按鈕,執(zhí)行因子分析過程(關(guān)于因子分子在SPSS中實現(xiàn)的詳細過程,參見7.7)。得到如表6.

31、1所示的特征根和方差貢獻率表和表6.2所示的因子載荷陣。第一個因子就可以解釋86.5%表6.1 特征根和方差貢獻率表表6.2 因子載荷陣2. 將表6.2中因子載荷陣中的數(shù)據(jù)輸入SPSS數(shù)據(jù)編輯窗口,命名為a1。點擊菜單項中的TransformCompute,調(diào)出Compute variable對話框,在對話框中輸入等式:z1=a1 / SQRT(3.46),計算第一個特征向量。點擊OK按鈕,即可在數(shù)據(jù)編輯窗口中得到以z1為變量名的第一特征向量。 表6.3 特征向量矩陣z1x10.509 x20.537 x30.530 x40.413 根據(jù)表6.3得主成分的表達式:3. 再次使用Compute命

32、令,調(diào)出Compute variable對話框,在對話框中輸入等式: 根據(jù)六個工業(yè)行業(yè)計算所的y1的大小可得石油和天然氣開采業(yè)的經(jīng)濟效益最好,煤炭開采和選業(yè)其次,接著依次是黑色金屬、非金屬、有色金屬和其他采礦業(yè)。6.10 根據(jù)習題5.10中2003年我國省會城市和計劃單列市的主要經(jīng)濟指標數(shù)據(jù),利用主成分分析法對這些地區(qū)進行分類。解:用SPSS進行主成分分析的具體方法參見6.8,分析結(jié)果如下:表6.7 特征根和方差貢獻率表表6.8 因子載荷陣表6.6 特征向量矩陣z1z2x10.29 0.47 x20.28 0.48 x30.14 -0.29 x40.31 -0.37 x50.40 -0.20

33、x60.40 -0.27 x70.31 0.39 x80.39 0.12 x90.39 -0.24 根據(jù)表6.6得主成分的表達式:分別計算出以上三項后,利用公式得到綜合得分并排序如下表:地區(qū)y1y2y深圳170038.89 254204.05 197055.90 上海70185.88 34213.02 58638.59 廈門50894.53 69593.93 56897.04 廣州55849.21 32174.58 48249.65 杭州42167.71 29244.98 38019.51 寧波40552.85 28367.34 36641.30 北京45747.38 11555.73 347

34、71.86 南寧45747.38 11555.73 34771.86 天津39597.90 21080.52 33653.82 ???9597.90 21080.52 33653.82 南京36680.75 25804.65 33189.52 青島35237.27 14552.46 28597.44 大連31830.56 17629.53 27272.03 濟南25149.73 16499.39 22372.97 福州22734.16 16326.97 20677.45 烏魯木齊22284.54 15284.68 20037.59 沈陽23184.99 12310.22 19694.19 武漢

35、23909.27 9770.56 19370.75 長春21524.95 14179.21 19166.96 成都33808.79 -17638.73 17294.14 太原19445.42 9809.99 16352.45 鄭州18561.81 9822.90 15756.62 蘭州16568.97 13769.80 15670.44 ???7666.70 11325.77 15631.26 昆明18494.34 8579.72 15311.75 呼和浩特16128.60 13359.10 15239.59 長沙18845.23 6252.54 14802.98 石家莊18229.33 73

36、99.62 14752.99 西安16764.15 4871.97 12946.76 南昌14598.40 9288.20 12893.83 哈爾濱15782.07 6297.20 12737.43 合肥14319.85 8659.41 12502.85 銀川12865.97 10960.08 12254.18 貴陽15339.90 4138.48 11744.24 重慶27859.53 -22407.66 11723.76 西寧10450.62 6144.51 9068.36 南寧11526.86 2677.29 8686.15 最后的分類可以根據(jù)最終得分Y的值來劃分,由于沒有給出具體的分類

37、標準,具體分類結(jié)果根據(jù)各人的主觀意愿可以有多種答案。可以歸為一類,屬于文科學(xué)習能力的指標;第二個公共因子在前三個指標上有較大載荷,同樣可以歸為一類,這三個指標同屬于理科學(xué)習能力的指標。根據(jù)表7.3易得: 表7.3 因子得分系數(shù)矩陣將每個學(xué)生的六門成績分別代入F1、F2,比較兩者的大小,F(xiàn)1大的適合學(xué)文,F(xiàn)2大的適合學(xué)理。計算結(jié)果為學(xué)號是1、16、24的學(xué)生適合學(xué)文,其余均適合學(xué)理。7.8 某汽車組織欲根據(jù)一系列指標來預(yù)測汽車的銷售情況,為了避免有些指標間的相關(guān)關(guān)系影響預(yù)測結(jié)果,需首先進行因子分析來簡化指標系統(tǒng)。下表是抽查歐洲某汽車市場7個品牌不同型號的汽車的各種指標數(shù)據(jù),試用因子分析法找出其簡化的指標系統(tǒng)。品牌價格發(fā)動機功率軸距寬長軸距燃料容量燃料效率A215001.8140101.267.3172.42.63913.228A284003.2225108.170.3192.93.51717.225A420003.5210114.671.4196.63.85018.022B239901.8150102.668.2178.02.99816.427B339502.8200108.776.1192.03.56118

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論