版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第第頁免責(zé)聲明:圖文來源于網(wǎng)絡(luò)搜集,版權(quán)歸原作者所以若侵犯了您的合法權(quán)益,請作者與本上傳人聯(lián)系,我們將及時(shí)更正刪除。 主成分分析與因子分析的優(yōu)缺點(diǎn)二、基本思想的異同
(一)共同點(diǎn)
主成分分析法和因子分析法都是用少數(shù)的幾個(gè)變量(因子)來綜合反映原始變量(因子)的主要信息,變量雖然較原始變量少,但所包含的信息量卻占原始信息的85%以上,所以即使用少數(shù)的幾個(gè)新變量,可信度也很高,也可以有效地解釋問題.并且新的變量彼此間互不相關(guān),消除了多重共線性.這兩種分析法得出的新變量,并不是原始變量篩選后剩余的變量.在主成分分析中,最終確定的新變量是原始變量的線性組合,如原始變量為x1,x2,...,x3,經(jīng)過坐標(biāo)變換,將原有的p個(gè)相關(guān)變量xi作線性變換,每個(gè)主成分都是由原有p個(gè)變量線性組合得到.在諸多主成分zi中,z1在方差中占的比重最大,說明它綜合原有變量的能力最強(qiáng),越往后主成分在方差中的比重也小,綜合原信息的能力越弱.因子分析是要利用少數(shù)幾個(gè)公共因子去解釋較多個(gè)要觀測變量中存在的復(fù)雜關(guān)系,它不是對原始變量的重新組合,而是對原始變量進(jìn)行分解,分解為公共因子與特殊因子兩部分.公共因子是由所有變量共同具有的少數(shù)幾個(gè)因子;特殊因子是每個(gè)原始變量獨(dú)自具有的因子.對新產(chǎn)生的主成分變量及因子變量計(jì)算其得分,就可以將主成分得分或因子得分代替原始變量進(jìn)行進(jìn)一步的分析,因?yàn)橹鞒煞肿兞考耙蜃幼兞勘仍甲兞可倭嗽S多,所以起到了降維的作用,為我們處理數(shù)據(jù)降低了難度.聚類分析的基本思想是:采用多變量的統(tǒng)計(jì)值,定量地確定相互之間的親疏關(guān)系,考慮對象多因素的聯(lián)系和主導(dǎo)作用,按它們親疏差異程度,歸入不同的分類中一元,使分類更具客觀實(shí)際并能反映事物的內(nèi)在必然聯(lián)系.也就是說,聚類分析是把研究對象視作多維空間中的許多點(diǎn),并合理地分成若干類,因此它是一種根據(jù)變量域之間的相似性而逐步歸群成類的方法,它能客觀地反映這些變量或區(qū)域之間的內(nèi)在組合關(guān)系[3].聚類分析是通過一個(gè)大的對稱矩陣來探索相關(guān)關(guān)系的一種數(shù)學(xué)分析方法,是多元統(tǒng)計(jì)分析方法,分析的結(jié)果為群集.對向量聚類后,我們對數(shù)據(jù)的處理難度也自然降低,所以從某種意義上說,聚類分析也起到了降維的作用.
(二)不同之處
主成分分析是研究如何通過少數(shù)幾個(gè)主成分來解釋多變量的方差一協(xié)方差結(jié)構(gòu)的分析方法,也就是求出少數(shù)幾個(gè)主成分(變量),使它們盡可能多地保留原始變量的信息,且彼此不相關(guān).它是一種數(shù)學(xué)變換方法,即把給定的一組變量通過線性變換,轉(zhuǎn)換為一組不相關(guān)的變量(兩兩相關(guān)系數(shù)為0,或樣本向量彼此相互垂直的隨機(jī)變量),在這種變換中,保持變量的總方差(方差之和)不變,同時(shí)具有最大方差,稱為第一主成分;具有次大方差,稱為第二主成分.依次類推.若共有p個(gè)變量,實(shí)際應(yīng)用中一般不是找p個(gè)主成分,而是找出m(m三、數(shù)據(jù)標(biāo)準(zhǔn)化的比較
主成分分析中為了消除量綱和數(shù)量級,通常需要將原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化,將其轉(zhuǎn)化為均值為0方差為1的無量綱數(shù)據(jù).而因子分析在這方面要求不是太高,因?yàn)樵谝蜃臃治鲋锌梢酝ㄟ^主因子法、加權(quán)最小二乘法、不加權(quán)最小二乘法、重心法等很多解法來求因子變量,并且因子變量是每一個(gè)變量的內(nèi)部影響變量,它的求解與原始變量是否同量綱關(guān)系并不太大,當(dāng)然在采用主成分法求因子變量時(shí),仍需標(biāo)準(zhǔn)化.不過在實(shí)際應(yīng)用的過程中,為了盡量避免量綱或數(shù)量級的影響,建議在使用因子分析前還是要進(jìn)行數(shù)據(jù)標(biāo)準(zhǔn)化.在構(gòu)造因子變量時(shí)采用的是主成分分析方法,主要將指標(biāo)值先進(jìn)行標(biāo)準(zhǔn)化處理得到協(xié)方差矩陣,即相關(guān)矩陣和對應(yīng)的特征值與特征向量,然后構(gòu)造綜合評價(jià)函數(shù)進(jìn)行評價(jià).聚類分析中如果參與聚類的變量的量綱不同會導(dǎo)致錯誤的聚類結(jié)果.因此在聚類過程進(jìn)行之前必須對變量值進(jìn)行標(biāo)準(zhǔn)化,即消除量綱的影響.不同方法進(jìn)行標(biāo)準(zhǔn)化,會導(dǎo)致不同的聚類結(jié)果要注意變量的分布.如果是正態(tài)分布應(yīng)該采用z分?jǐn)?shù)法.
四、應(yīng)用中的優(yōu)缺點(diǎn)比較
(一)主成分分析
1、優(yōu)點(diǎn)
首先它利用降維技術(shù)用少數(shù)幾個(gè)綜合變量來代替原始多個(gè)變量,這些綜合變量集中了原始變量的大部分信息.其次它通過計(jì)算綜合主成分函數(shù)得分,對客觀經(jīng)濟(jì)現(xiàn)象進(jìn)行科學(xué)評價(jià).再次它在應(yīng)用上側(cè)重于信息貢獻(xiàn)影響力綜合評價(jià).
2、缺點(diǎn)
當(dāng)主成分的因子負(fù)荷的符號有正有負(fù)時(shí),綜合評價(jià)函數(shù)意義就不明確.命名清晰性低.
(二)因子分析
1、優(yōu)點(diǎn)
第一它不是對原有變量的取舍,而是根據(jù)原始變量的信息進(jìn)行重新組合,找出影響變量的共同因子,化簡數(shù)據(jù);第二,它通過旋轉(zhuǎn)使得因子變量更具有可解釋性,命名清晰性高.
2、缺點(diǎn)
在計(jì)算因子得分時(shí),采用的是最小二乘法,此法有時(shí)可能會失效.
(三)聚類分析
1、優(yōu)點(diǎn)
聚類分析模型的優(yōu)點(diǎn)就是直觀,結(jié)論形式簡明.
2、缺點(diǎn)
在樣本量較大時(shí),要獲得聚類結(jié)論有一定困難.由于相似系數(shù)是根據(jù)被試的反映來建立反映被試間內(nèi)在聯(lián)系的指標(biāo),而實(shí)踐中有時(shí)盡管從被試反映所得出的數(shù)據(jù)中發(fā)現(xiàn)他們之間有緊密的關(guān)系,但事物之間卻無任何內(nèi)在聯(lián)系,此時(shí),如果根據(jù)距離或相似系數(shù)得出聚類分析的結(jié)果,顯然是不適當(dāng)?shù)模?,聚類分析模型本身卻無法識別這類錯誤.
第二篇:主成分分析與全成分分析區(qū)別主成分分析與全成分分析的區(qū)別
主成分分析。是把幾個(gè)綜合變量來代替原來眾多的變量,使這些綜合變量能盡可能地代表原來變量的信息量,而且彼此之間互不相關(guān)的一種數(shù)學(xué)降維的方法。
全成分分析。是將送檢樣品中的原材料、填料、助劑等進(jìn)行定性定量分析。塑料原材料種類,填料種類、粒徑,助劑種類都能影響對產(chǎn)品的性能、壽命,通常是同一種原材料、同一種填料,因?yàn)橹鷦┓N類的不同,造成產(chǎn)品性能大不相同。
主成分分析也稱主分量分析,旨在利用降維的思想,把多指標(biāo)轉(zhuǎn)化為少數(shù)幾個(gè)綜合指標(biāo)。在實(shí)際問題研究中,為了全面、系統(tǒng)地分析問題,我們必須考慮眾多影響因素。這些涉及的因素一般稱為指標(biāo),在多元統(tǒng)計(jì)分析中也稱為變量。因?yàn)槊總€(gè)變量都在不同程度上反映了所研究問題的某些信息,并且指標(biāo)之間彼此有一定的相關(guān)性,因而所得的統(tǒng)計(jì)數(shù)據(jù)反映的信息在一定程度上有重疊。在用統(tǒng)計(jì)方法研究多變量問題時(shí),變量太多會增加計(jì)算量和增加分析問題的復(fù)雜性,人們希望在進(jìn)行定量分析的過程中,涉及的變量較少,得到的信息量較多。主要目的
是希望用較少的變量去解釋原來資料中的大部分變量,將我們手中許多相關(guān)性很高的變量轉(zhuǎn)化成彼此相互獨(dú)立或不相關(guān)的變量。通常是選出比原始變量個(gè)數(shù)少,能解釋大部分資料中變量的幾個(gè)新變量,即所謂主成分,并用以解釋資料的綜合性指標(biāo)。由此可見,主成分分析實(shí)際上是一種降維方法。
分析步驟
數(shù)據(jù)標(biāo)準(zhǔn)化;
一、求相關(guān)系數(shù)矩陣;
二、一系列正交變換,使非對角線上的數(shù)置0,加到主對角上;
三、得特征根xi(即相應(yīng)那個(gè)主成分引起變異的方差),并按照從大到小的順序把特征根排列;
四、求各個(gè)特征根對應(yīng)的特征向量;
五、用下式計(jì)算每個(gè)特征根的貢獻(xiàn)率vi;
vi=xi/(x1+x2+)
六、根據(jù)特征根及其特征向量解釋主成分物理意義。
主成分分析的基本思想
主成分分析是設(shè)法將原來眾多具有一定相關(guān)性(比如p個(gè)指標(biāo)),重新組合成一組新的互相無關(guān)的綜合指標(biāo)來代替原來的指標(biāo)。
主成分分析,是考察多個(gè)變量間相關(guān)性一種多元統(tǒng)計(jì)方法,研究如何通過少數(shù)幾個(gè)主成分來揭示多個(gè)變量間的內(nèi)部結(jié)構(gòu),即從原始變量中導(dǎo)出少數(shù)幾個(gè)主成分,使它們盡可能多地保留原始變量的信息,且彼此間互不相關(guān).通常數(shù)學(xué)上的處理就是將原來p個(gè)指標(biāo)作線性組合,作為新的綜合指標(biāo)。
主成分分析是把幾個(gè)綜合變量來代替原來眾多的變量,使這些綜合變量能盡可能地代表原來變量的信息量,而且彼此之間互不相關(guān)的一種數(shù)學(xué)降維的方法。
第三篇:主成分分析法的優(yōu)點(diǎn)主成分分析法的優(yōu)點(diǎn):
1、可消除評價(jià)指標(biāo)之間的相關(guān)影響
因?yàn)橹鞒煞址治鲈趯υ笜?biāo)變量進(jìn)行變換后形成了彼此相互獨(dú)立的主成分,而且實(shí)踐證明指標(biāo)之間相關(guān)程度越高,主成分分析效果越好。
2、可減少指標(biāo)選擇的工作量
對于其它評價(jià)方法,由于難以消除評價(jià)指標(biāo)間的相關(guān)影響,所以選擇指標(biāo)時(shí)要花費(fèi)不少精力,而主成分分析由于可以消除這種相關(guān)影響,所以在指標(biāo)選擇上相對容易些。
3、當(dāng)評級指標(biāo)較多時(shí)還可以在保留絕大部分信息的情況下用少數(shù)幾個(gè)綜合指標(biāo)代替原指標(biāo)進(jìn)行分析
主成分分析中各主成分是按方差大小依次排列順序的,在分析問題時(shí),可以舍棄一部分主成分,只取前后方差較大的幾個(gè)主成分來代表原變量,從而減少了計(jì)算工作量。
4、在綜合評價(jià)函數(shù)中,各主成分的權(quán)數(shù)為其貢獻(xiàn)率,它反映了該主成分包含原始數(shù)據(jù)的信息量占全部信息量的比重,這樣確定權(quán)數(shù)是客觀的、合理的,它克服了某些評價(jià)方法中認(rèn)為確定權(quán)數(shù)的缺陷。
5、這種方法的計(jì)算比較規(guī)范,便于在計(jì)算機(jī)上實(shí)現(xiàn),還可以利用專門的軟件。主成分分析法的缺點(diǎn):
1、在主成分分析中,我們首先應(yīng)保證所提取的前幾個(gè)主成分的累計(jì)貢獻(xiàn)率達(dá)到一個(gè)較高的水平(即變量降維后的信息量須保持在一個(gè)較高水平上),其次對這些被提取的主成分必須都能夠給出符合實(shí)際背景和意義的解釋(否則主成分將空有信息量而無實(shí)際含義)。
2、主成分的解釋其含義一般多少帶有點(diǎn)模糊性,不像原始變量的含義那么清楚、確切,這是變量降維過程中不得不付出的代價(jià)。因此,提取的主成分個(gè)數(shù)m通常應(yīng)明顯小于原始變量個(gè)數(shù)p(除非p本身較?。駝t維數(shù)降低的“利”可能抵不過主成分含義不如原始變量清楚的“弊”。
聚類分析法優(yōu)點(diǎn):
聚類分析模型的優(yōu)點(diǎn)就是直觀,結(jié)論形式簡明
聚類分析法缺點(diǎn):
在樣本量較大時(shí),要獲得聚類結(jié)論有一定困難。由于相似系數(shù)是根據(jù)被試的反映來建立反映被試間內(nèi)在聯(lián)系的指標(biāo),而實(shí)踐中有時(shí)盡管從被試反映所得出的數(shù)據(jù)中發(fā)現(xiàn)他們之間有緊密的關(guān)系,但事物之間卻無任何內(nèi)在聯(lián)系,此時(shí),如果根據(jù)距離或相似系數(shù)得出聚類分析的結(jié)果,顯然是不適當(dāng)?shù)?,但是,聚類分析模型本身卻無法識別這類錯誤。
第四篇:因子分析方法因子分析法
1.因子分析(factoranalysis)
因子分析的基本目的就是用少數(shù)幾個(gè)因子去描述許多指標(biāo)或因素之間的聯(lián)系,即將相關(guān)比較密切的幾個(gè)變量歸在同一類中,每一類變量就成為一個(gè)因子(之所以稱其為因子,是因?yàn)樗遣豢捎^測的,即不是具體的變量),以較少的幾個(gè)因子反映原資料的大部分信息。運(yùn)用這種研究技術(shù),我們可以方便地找出影響消費(fèi)者購買、消費(fèi)以及滿意度的主要因素是哪些,以及它們的影響力(權(quán)重)運(yùn)用這種研究技術(shù),我們還可以為市場細(xì)分做前期分析。
因子分析法與其他一些多元統(tǒng)計(jì)方法的區(qū)別:
2.主成分分析
主成分分析主要是作為一種探索性的技術(shù),在分析者進(jìn)行多元數(shù)據(jù)分析之前,用主成分分析來分析數(shù)據(jù),讓自己對數(shù)據(jù)有一個(gè)大致的了解是非常重要的。主成分分析一般很少單獨(dú)使用:a,了解數(shù)據(jù)。(screeningthedata),b,和clusteranalysis一起使用,c,和判別分析一起使用,比如當(dāng)變量很多,個(gè)案數(shù)不多,直接使用判別分析可能無解,這時(shí)候可以使用主成份發(fā)對變量簡化。(reducedimensionality)d,在多元回歸中,主成分分析可以幫助判斷是否存在共線性(條件指數(shù)),還可以用來處理共線性。
1、因子分析中是把變量表示成各因子的線性組合,而主成分分析中則是把主成分表示成個(gè)變量的線性組合。
2、主成分分析的重點(diǎn)在于解釋各變量的總方差,而因子分析則把重點(diǎn)放在解釋各變量之間的協(xié)方差。
3、主成分分析中不需要有假設(shè)(assumptions),因子分析則需要一些假設(shè)。因子分析的假設(shè)包括:各個(gè)共同因子之間不相關(guān),特殊因子(specificfactor)之間也不相關(guān),共同因子和特殊因子之間也不相關(guān)。
4、主成分分析中,當(dāng)給定的協(xié)方差矩陣或者相關(guān)矩陣的特征值是唯一的時(shí)候,的主成分一般是獨(dú)特的;而因子分析中因子不是獨(dú)特的,可以旋轉(zhuǎn)得到不同的因子。
5、在因子分析中,因子個(gè)數(shù)需要分析者指定(spss根據(jù)一定的條件自動設(shè)定,只要是特征值大于1的因子進(jìn)入分析),而指定的因子數(shù)量不同而結(jié)果不同。在主成分分析中,成分的數(shù)量是一定的,一般有幾個(gè)變量就有幾個(gè)主成分。和主成分分析相比,由于因子分析可以使用旋轉(zhuǎn)技術(shù)幫助解釋因子,在解釋方面更加有優(yōu)勢。大致說來,當(dāng)需要尋找潛在的因子,并對這些因子進(jìn)行解釋的時(shí)候,更加傾向于使用因子分析,并且借助旋轉(zhuǎn)技術(shù)幫助更好解釋。而如果想把現(xiàn)有的變量變成少數(shù)幾個(gè)新的變量(新的變量幾乎帶有原來所有變量的信息)來進(jìn)入后續(xù)的分析,則可以使用主成分分析。當(dāng)然,這種情況也可以使用因子得分做到。所以這種區(qū)分不是絕對的。
總得來說,主成分分析主要是作為一種探索性的技術(shù),在分析者進(jìn)行多元數(shù)據(jù)分析之前,用主成分分析來分析數(shù)據(jù),讓自己對數(shù)據(jù)有一個(gè)大致的了解是非常重要的。主成分分析一般很少單獨(dú)使用:a,了解數(shù)據(jù)。(screeningthedata),b,和clusteranalysis一起使用,c,和判別分析一起使用,比如當(dāng)變量很多,個(gè)案數(shù)不多,直接使用判別分析可能無解,這時(shí)候可以使用主成份發(fā)對變量簡化。(reducedimensionality)d,在多元回歸中,主成分分析可以幫助判斷是否存在共線性(條件指數(shù)),還可以用來處理共線性。
在算法上,主成分分析和因子分析很類似,不過,在因子分析中所采用的協(xié)方差矩陣的對角元素不在是變量的方差,而是和變量對應(yīng)的共同度(變量方差中被各因子所解釋的部分)。
3.聚類分析(clusteranalysis)
聚類分析是直接比較各事物之間的性質(zhì),將性質(zhì)相近的歸為一類,將性質(zhì)差別較大的歸入不同的類的分析技術(shù)。
在市場研究領(lǐng)域,聚類分析主要應(yīng)用方面是幫助我們尋找目標(biāo)消費(fèi)群體,運(yùn)用這項(xiàng)研究技術(shù),我們可以劃分出產(chǎn)品的細(xì)分市場,并且可以描述出各細(xì)分市場的人群特征,以便于客戶可以有針對性的對目標(biāo)消費(fèi)群體施加影響,合理地開展工作。
4.判別分析(discriminatoryanalysis)
判別分析(discriminatoryanalysis)的任務(wù)是根據(jù)已掌握的1批分類明確的樣品,建立較好的判別函數(shù),使產(chǎn)生錯判的事例最少,進(jìn)而對給定的1個(gè)新樣品,判斷它來自哪個(gè)總體。根據(jù)資料的性質(zhì),分為定性資料的判別分析和定量資料的判別分析;采用不同的判別準(zhǔn)則,又有費(fèi)歇、貝葉斯、距離等判別方法。
費(fèi)歇(fisher)判別思想是投影,使多維問題簡化為一維問題來處理。選擇一個(gè)適當(dāng)?shù)耐队拜S,使所有的樣品點(diǎn)都投影到這個(gè)軸上得到一個(gè)投影值。對這個(gè)投影軸的方向的要求是:使每一類內(nèi)的投影值所形成的類內(nèi)離差盡可能小,而不同類間的投影值所形成的類間離差盡可能大。貝葉斯(bayes)判別思想是根據(jù)先驗(yàn)概率求出后驗(yàn)概率,并依據(jù)后驗(yàn)概率分布作出統(tǒng)計(jì)推斷。所謂先驗(yàn)概率,就是用概率來描述人們事先對所研究的對象的認(rèn)識的程度;所謂后驗(yàn)概率,就是根據(jù)具體資料、先驗(yàn)概率、特定的判別規(guī)則所計(jì)算出來的概率。它是對先驗(yàn)概率修正后的結(jié)果。
距離判別思想是根據(jù)各樣品與各母體之間的距離遠(yuǎn)近作出判別。即根據(jù)資料建立關(guān)于各母體的距離判別函數(shù)式,將各樣品數(shù)據(jù)逐一代入計(jì)算,得出各樣品與各母體之間的距離值,判樣品屬于距離值最小的那個(gè)母體。
5.對應(yīng)分析(correspondenceanalysis)
對應(yīng)分析是一種用來研究變量與變量之間聯(lián)系緊密程度的研究技術(shù)。
運(yùn)用這種研究技術(shù),我們可以獲取有關(guān)消費(fèi)者對產(chǎn)品品牌定位方面的圖形,從而幫助您及時(shí)調(diào)整營銷策略,以便使產(chǎn)品品牌在消費(fèi)者中能樹立起正確的形象。
這種研究技術(shù)還可以用于檢驗(yàn)廣告或市場推廣活動的效果,我們可以通過對比廣告播出前或市場推廣活動前與廣告播出后或市場推廣活動后消費(fèi)者對產(chǎn)品的不同認(rèn)知圖來看出廣告或市場推廣活動是否成功的向消費(fèi)者傳達(dá)了需要傳達(dá)的信息。
6.典型相關(guān)分析
典型相關(guān)分析是分析兩組隨機(jī)變量間線性密切程度的統(tǒng)計(jì)方法,是兩變量間線性相關(guān)分析的拓廣。各組隨機(jī)變量中既可有定量隨機(jī)變量,也可有定性隨機(jī)變量(分析時(shí)須f6說明為定性變量)。本法還可以用于分析高維列聯(lián)表各邊際變量的線性關(guān)系。
注意:
1.嚴(yán)格地說,一個(gè)典型相關(guān)系數(shù)描述的只是一對典型變量之間的相關(guān),而不是兩個(gè)變量組之間的相關(guān)。而各對典型變量之間構(gòu)成的多維典型相關(guān)才共同揭示了兩個(gè)觀測變量組之間的相關(guān)形式。
2.典型相關(guān)模型的基本假設(shè)和數(shù)據(jù)要求
要求兩組變量之間為線性關(guān)系,即每對典型變量之間為線性關(guān)系;
每個(gè)典型變量與本組所有觀測變量的關(guān)系也是線性關(guān)系。如果不是線性關(guān)系,可先線性化:如經(jīng)濟(jì)水平和收入水平與其他一些社會發(fā)展水之間并不是線性關(guān)系,可先取對數(shù)。即log經(jīng)濟(jì)水平,log收入水平。
3.典型相關(guān)模型的基本假設(shè)和數(shù)據(jù)要求
所有觀測變量為定量數(shù)據(jù)。同時(shí)也可將定性數(shù)據(jù)按照一定形式設(shè)為虛擬變量后,再放入典型相關(guān)模型中進(jìn)行分析。
7.多維尺度分析(multi-dimensionanalysis)
多維尺度分析(multi-dimensionanalysis)是市場研究的一種有力手段,它可以通過低維空間(通常是二維空間)展示多個(gè)研究對象(比如品牌)之間的聯(lián)系,利用平面距離來反映研究對象之間的相似程度。由于多維尺度分析法通常是基于研究對象之間的相似性(距離)的,只要獲得了兩個(gè)研究對象之間的距離矩陣,我們就可以通過相應(yīng)統(tǒng)計(jì)軟件做出他們的相似性知覺圖。
在實(shí)際應(yīng)用中,距離矩陣的獲得主要有兩種方法。一種是采用直接的相似性評價(jià),先所有評價(jià)對象進(jìn)行兩兩組合,然后要求被訪者所有的這些組合間進(jìn)行直接相似性評價(jià),這種方法我們稱之為直接評價(jià)法;另一種為間接評價(jià)法,由研究人員根據(jù)事先經(jīng)驗(yàn),找出影響人們評價(jià)研究對象相似性的主要屬性,然后對每個(gè)研究對象,讓被訪者對這些屬性進(jìn)行逐一評價(jià),最后將所有屬性作為多維空間的坐標(biāo),通過距離變換計(jì)算對象之間的距離。
多維尺度分析的主要思路是利用對被訪者對研究對象的分組,來反映被訪者對研究對象相似性的感知,這種方法具有一定直觀合理性。同時(shí)該方法實(shí)施方便,調(diào)查中被訪者負(fù)擔(dān)較小,很容易得到理解接受。當(dāng)然,該方法的不足之處是犧牲了個(gè)體距離矩陣,由于每個(gè)被訪者個(gè)體的距離矩陣只包含1與0兩種取值,相對較為粗糙,個(gè)體距離矩陣的分析顯得比較勉強(qiáng)。但這一點(diǎn)是完全可以接受的,因?yàn)閷Υ蠖鄶?shù)研究而言,我們并不需要知道每一個(gè)體的空間知覺圖。
多元統(tǒng)計(jì)分析是統(tǒng)計(jì)學(xué)中內(nèi)容十分豐富、應(yīng)用范圍極為廣泛的一個(gè)分支。在自然科學(xué)和社會科學(xué)的許多學(xué)科中,研究者都有可能需要分析處理有多個(gè)變量的數(shù)據(jù)的問題。能否從表面上看起來雜亂無章的數(shù)據(jù)中發(fā)現(xiàn)和提煉出規(guī)律性的結(jié)論,不僅對所研究的專業(yè)領(lǐng)域要有很好的訓(xùn)練,而且要掌握必要的統(tǒng)計(jì)分析工具。對實(shí)際領(lǐng)域中的研究者和高等院校的研究生來說,要學(xué)習(xí)掌握多元統(tǒng)計(jì)分析的各種模型和方法,手頭有一本好的、有長久價(jià)值的參考書是非常必要的。這樣一本書應(yīng)該滿足以下條件:首先,它應(yīng)該是“淺入深出”的,也就是說,既可供初學(xué)者入門,又能使有較深基礎(chǔ)的人受益。其次,它應(yīng)該是既側(cè)重于應(yīng)用,又兼顧必要的推理論證,使學(xué)習(xí)者既能學(xué)到“如何”做,而且在一定程度上了解“為什么”這樣做。最后,它應(yīng)該是內(nèi)涵豐富、全面的,不僅要基本包括各種在實(shí)際中常用的多元統(tǒng)計(jì)分析方法,而且還要對現(xiàn)代統(tǒng)計(jì)學(xué)的最新思想和進(jìn)展有所介紹、交代。
因子分析的核心問題有兩個(gè):
一是如何構(gòu)造因子變量;二是如何對因子變量進(jìn)行命名解釋。因此,因子分析的基本步驟和解決思路就是圍繞這兩個(gè)核心問題展開的。
(i)因子分析常常有以下四個(gè)基本步驟:
(1)確認(rèn)待分析的原變量是否適合作因子分析。
(2)構(gòu)造因子變量。
(3)利用旋轉(zhuǎn)方法使因子變量更具有可解釋性。
(4)計(jì)算因子變量得分。
(ii)因子分析的計(jì)算過程:
(1)將原始數(shù)據(jù)標(biāo)準(zhǔn)化,以消除變量間在數(shù)量級和量綱上的不同。
(2)求標(biāo)準(zhǔn)化數(shù)據(jù)的相關(guān)系數(shù)矩陣;
(3)求相關(guān)矩陣的特征值和特征向量;
(4)計(jì)算方差貢獻(xiàn)率與累積方差貢獻(xiàn)率;
(5)確定因子:
設(shè)f1,f2,…,fp為p個(gè)因子,其中前m個(gè)因子包含的數(shù)據(jù)信息總量(即其累積貢獻(xiàn)率)不低于80%時(shí),可取前m個(gè)因子來反映原評價(jià)指標(biāo);
(6)因子旋轉(zhuǎn):
若所得的m個(gè)因子無法確定或其實(shí)際意義不是很明顯,這時(shí)需將因子進(jìn)行旋轉(zhuǎn)以獲得較為明顯的實(shí)際含義。
(7)用原指標(biāo)的線性組合來求各因子得分:
采用回歸估計(jì)法,bartlett估計(jì)法或thomson估計(jì)法計(jì)算因子得分。
(8)綜合得分
以各因子的方差貢獻(xiàn)率為權(quán),由各因子的線性組合得到綜合評價(jià)指標(biāo)函數(shù)。
f=(w1f1+w2f2+…+wmfm)/(w1+w2+…+wm)
此處wi為旋轉(zhuǎn)前或旋轉(zhuǎn)后因子的方差貢獻(xiàn)率。
(9)得分排序。利用綜合得分可以得到得分名次。
在采用多元統(tǒng)計(jì)分析技術(shù)進(jìn)行數(shù)據(jù)處理、建立宏觀或微觀系統(tǒng)模型時(shí),需要研究以下幾個(gè)方面的問題:
·簡化系統(tǒng)結(jié)構(gòu),探討系統(tǒng)內(nèi)核??刹捎弥鞒煞址治?、因子分析、對應(yīng)分析等方法,在眾多因素中找出各個(gè)變量最佳的子集合,從子集合所包含的信息描述多變量的系統(tǒng)結(jié)果及各個(gè)因子對系統(tǒng)的影響?!皬臉淠究瓷帧保プ≈饕?,把握主要矛盾的主要方面,舍棄次要因素,以簡化系統(tǒng)的結(jié)構(gòu),認(rèn)識系統(tǒng)的內(nèi)核。
·構(gòu)造預(yù)測模型,進(jìn)行預(yù)報(bào)控制。在自然和社會科學(xué)領(lǐng)域的科研與生產(chǎn)中,探索多變量系統(tǒng)運(yùn)動的客觀規(guī)律及其與外部環(huán)境的關(guān)系,進(jìn)行預(yù)測預(yù)報(bào),以實(shí)現(xiàn)對系統(tǒng)的最優(yōu)控制,是應(yīng)用多元統(tǒng)計(jì)分析技術(shù)的主要目的。在多元分析中,用于預(yù)報(bào)控制的模型有兩大類。一類是預(yù)測預(yù)報(bào)模型,通常采用多元線性回歸或逐步回歸分析、判別分析、雙重篩選逐步回歸分析等建模技術(shù)。另一類是描述性模型,通常采用聚類分析的建模技術(shù)。
·進(jìn)行數(shù)值分類,構(gòu)造分類模式。在多變量系統(tǒng)的分析中,往往需要將系統(tǒng)性質(zhì)相似的事物或現(xiàn)象歸為一類。以便找出它們之間的聯(lián)系和內(nèi)在規(guī)律性。過去許多研究多是按單因素進(jìn)行定性處理,以致處理結(jié)果反映不出系統(tǒng)的總的特征。進(jìn)行數(shù)值分類,構(gòu)造分類模式一般采用聚類分析和判別分析技術(shù)。
如何選擇適當(dāng)?shù)姆椒▉斫鉀Q實(shí)際問題,需要對問題進(jìn)行綜合考慮。對一個(gè)問題可以綜合運(yùn)用多種統(tǒng)計(jì)方法進(jìn)行分析。例如一個(gè)預(yù)報(bào)模型的建立,可先根據(jù)有關(guān)生物學(xué)、生態(tài)學(xué)原理,確定理論模型和試驗(yàn)設(shè)計(jì);根據(jù)試驗(yàn)結(jié)果,收集試驗(yàn)資料;對資料進(jìn)行初步提煉;然后應(yīng)用統(tǒng)計(jì)分析方法(如相關(guān)分析、逐步回歸分析、主成分分析等)研究各個(gè)變量之間的相關(guān)性,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 關(guān)于垃圾分類合同模板
- 合作廠家合同模板
- 合作養(yǎng)殖蝎子合同范例
- 培訓(xùn)住宿合同范例
- 醫(yī)院科室共建合同模板
- 保潔承包酒吧合同模板
- 余姚房屋拆除合同范例簡易
- 買餐館定金合同范例
- 出國押金合同范例
- 關(guān)于質(zhì)保合同模板
- 熒光光纖測溫監(jiān)測系統(tǒng)-高壓柜 環(huán)網(wǎng)柜
- 國家衛(wèi)生健康委臨床檢驗(yàn)中心室間質(zhì)量評價(jià)標(biāo)準(zhǔn)2023年
- 《微生物與健康》課件PPT【科學(xué)六年級上冊教科版】
- 竊電與違約用電
- 醫(yī)療機(jī)構(gòu)設(shè)置審批及執(zhí)業(yè)許可流程圖
- 031超高超限梁板模架專項(xiàng)方案交底
- 心肺復(fù)蘇及AED的使用
- 2023屆高考議論文段落提升指導(dǎo)課件(共32張PPT)
- 數(shù)控機(jī)床的機(jī)械結(jié)構(gòu)
- 2023年鶴壁市鶴山區(qū)小升初英語考試題庫及答案解析
- 內(nèi)部合伙人制度與股權(quán)激勵方案
評論
0/150
提交評論