




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、探索性因子分析與驗證性因子分析比較研究湖北 武漢 楊 丹摘要:探索性因子分析與驗證性因子分析是因子分析的兩種不同形式。它們都是以普通因子模型為基礎(chǔ), 但它們之間也存在著較大差異。本文通過對它們進(jìn)行比較分析, 找出其異同,并對實證分析提供一定的指導(dǎo)依據(jù)。關(guān)鍵詞:探索性因子分析、驗證性因子分析、結(jié)構(gòu)方程模型現(xiàn)實生活中的事物是錯綜復(fù)雜的,在現(xiàn)實的數(shù)據(jù)中,我們經(jīng)常遇到的是多元的情況,而不僅僅是單一的自變量和單一的因變量。因此要用到多元的分析方法,而因子分析就是其中一種非常重要的處理降維的方法。它是將具有錯綜復(fù)雜關(guān)系的變量(或樣品)綜合為少數(shù)幾個因子,以再現(xiàn)原始變量與因子之間的相互關(guān)系,同時根據(jù)不同因子
2、還可以對變量進(jìn)行分類。它實際上就是一種用來檢驗潛在結(jié)構(gòu)是怎樣影響觀測變量的方法。因子分析主要有兩種基本形式:探索性因子分析(Exploratory Factor Analysis)和驗證性因子分析(Confirmatory Factor Analysis)。探索性因子分析(EFA )致力于找出事物內(nèi)在的本質(zhì)結(jié)構(gòu);而驗證性因子分析(CFA )是用來檢驗已知的特定結(jié)構(gòu)是否按照預(yù)期的方式產(chǎn)生作用。兩者之間是既有聯(lián)系也有區(qū)別的,下面我們就從不同的方面進(jìn)行分析比較。一、 兩種因子分析的相同之處兩種因子分析都是以普通因子模型為基礎(chǔ)的。因子分析的基本思想是通過變量的相關(guān)系數(shù)矩陣內(nèi)部結(jié)構(gòu)的研究,找出能控制所有
3、變量的少數(shù)幾個隨機變量去描述多個變量之間的相關(guān)關(guān)系,但在這里,這少數(shù)幾個隨機變量是不可觀測的,通常稱為因子。然后根據(jù)相關(guān)性的大小把變量分組,使得同組內(nèi)的變量之間相關(guān)性較高,但不同組的變量相關(guān)性較低。如圖所示,我們假定一個模型,它表明所有的觀測變量(變量1到變量5)是一部分受到潛在公共因子(因子1和因子2)影響,一部分受到潛在特殊因子(E1到E5)影響的。而每個因子和每個變量之間的相關(guān)程度是不一樣的,可能某給定因子對于某些變量的影響要比對其他變量的影響大一些。我們可以把圖的因子模型表示成線性函數(shù):1111122122112222331132234411422455115225X a F a F
4、X a F a F X a F a F X a F a F X a F a F =+=+=+=+=+其中12, F F 表示兩個因子,它對所有(1,2, ,5 i X i = 是公有的因子,通常稱為公共因子,它們的系數(shù)(1,2, ,5; 1,2 ij a i j = 表示第i 個變量在第j 個因子上的載荷。(1,2, ,5 i i = 表示第i 個變量不能被前兩個因子包括的部分,稱為特殊因子,通常假定2(0, i i N 。 圖不論是探索性因子分析還是驗證性因子分析都是為了考察觀測變量之間的相關(guān)系數(shù)和方差協(xié)方差。高度相關(guān)的觀測變量(不管是正相關(guān)還是負(fù)相關(guān))很可能是受同樣的因子影響,而相對來說相
5、關(guān)程度不是很高的觀測變量很可能是受不同的因子影響的。而因子必須盡可能多地解釋變量方差,每個變量在每個因子上都有一個因子載荷,因子的意義需由看哪些變量在哪個因子上載荷最大來決定。通過尋找潛在公共因子,并合理解釋因子的意義,我們就能揭示錯綜復(fù)雜的事物的內(nèi)部結(jié)構(gòu)。二、兩種因子分析的差異(一)、基本思想的差異因子分析的基本思想是尋找公共因子以達(dá)到降維的目的。在尋找公共因子的過程中,是否利用先驗信息,產(chǎn)生了探索性因子分析和確定性因子分析的區(qū)別。探索性因子分析是在事先不知道影響因素的基礎(chǔ)上,完全依據(jù)資料數(shù)據(jù),利用統(tǒng)計軟件以一定的原則進(jìn)行因子分析,最后得出因子的過程。而確定性因子分析充分利用了先驗信息,是在
6、已知因子的情況下檢驗所搜集的數(shù)據(jù)資料是否按事先預(yù)定的結(jié)構(gòu)方式產(chǎn)生作用。因此探索性因子分析主要是為了找出影響觀測變量的因子個數(shù),以及各個因子和各個觀測變量之間的相關(guān)程度;而驗證性因子分析的主要目的是決定事前定義因子的模型擬合實際數(shù)據(jù)的能力。進(jìn)行探索性因子分析之前,我們不必知道我們要用幾個因子,各個因子和觀測變量之間的聯(lián)系如何;而驗證性因子分析要求事先假設(shè)因子結(jié)構(gòu),我們要做的是檢驗它是否與觀測數(shù)據(jù)一致。探索性因子分析試圖揭示一套相對比較大的變量的內(nèi)在結(jié)構(gòu)。研究者的假定是每個指示變量都與某個因子匹配 。這是因子分析最通常的形式。沒有先驗理論形式。沒有先驗理論,只能通過因子載荷憑知覺推斷數(shù)據(jù)的因子結(jié)構(gòu)
7、。驗證性因子分析試圖檢驗觀測變量的因子個數(shù)和因子載荷是否與基于預(yù)先建立的理論的預(yù)期一致。指示變量是基于先驗理論選出的,而因子分析是用來看它們是否如預(yù)期的一樣。研究者的先驗假設(shè)是每個因子都與一個具體的指示變量子集對應(yīng)。驗證性因子分析至少要求預(yù)先假設(shè)模型中因子的數(shù)目,但有時也預(yù)期哪些變量依賴哪個因子(Kim and Mueller, 1978b: 55。例如,研究者試圖檢驗代表潛在變量的觀測變量是否真屬于一類。(二)、分析方法的差異由于兩種因子分析的出發(fā)點不同而產(chǎn)生了不同的分析方法,我們分別從兩種因子分析的分析步驟來比較它們的差異。探索性因子分析主要有以下7個步驟:、收集觀測變量。由于總體的復(fù)雜性
8、和統(tǒng)計基本原理的保證,為了達(dá)到研究目的,我們通常采用抽樣的方法收集數(shù)據(jù)。所以我們必須按照實際情況收集觀測變量,并對其進(jìn)行觀測,獲得觀測值。、獲得協(xié)方差陣(或相似系數(shù)矩陣)。我們所有的分析都是從原始數(shù)據(jù)的協(xié)方差陣(或相似系數(shù)矩陣)出發(fā)的,這樣使我們分析得到的數(shù)據(jù)具有可比性,所以首先要根據(jù)資料數(shù)據(jù)獲得變量協(xié)方差陣(或相似系數(shù)矩陣)。、確定因子個數(shù)。有時候你有具體的假設(shè),它決定了因子的個數(shù);但更多的時候沒有這樣的假設(shè),你僅僅希望最后的到的模型能用盡可能少的因子解釋盡可能多的方差。如果你有k 個變量,你最多只能提取k 個因子。通過檢驗數(shù)據(jù)來確定最優(yōu)因子個數(shù)的方法有很多。Kaiser 準(zhǔn)則要求因子個數(shù)與
9、相關(guān)系數(shù)矩陣的特征根個數(shù)相等;而Scree 檢驗要求把相關(guān)系數(shù)矩陣的的特征根按從小到大的順序排列,繪制成圖,然后來確定因子的個數(shù)。究竟采用哪種方法來確定因子個數(shù),具體操作時可以視情況而定。、提取因子。因子的提取方法也有多種,主要有主成分方法、不加權(quán)最小平方法、極大似然法等,我們可以根據(jù)需要選擇合適的因子提取方法。其中主成分方法一種比較常用的提取因子的方法,它是用變量的線性組合中,能產(chǎn)生最大樣品方差的那些組合(稱主成分)作為公共因子來進(jìn)行分析的方法。、因子旋轉(zhuǎn)。由于因子載荷陣的不唯一性,可以對因子進(jìn)行旋轉(zhuǎn),而正是由于這一特征,使得因子結(jié)構(gòu)可以朝我們可以合理解釋的方向趨近。我們用一個正交陣右乘已經(jīng)
10、得到的因子載荷陣(由線性代數(shù)可知,一次正交變化對應(yīng)坐標(biāo)系的一次旋轉(zhuǎn)),使旋轉(zhuǎn)后的因子載荷陣結(jié)構(gòu)簡化。旋轉(zhuǎn)的方法也有多種,如正交旋轉(zhuǎn)、斜交旋轉(zhuǎn)等,最常用的是方差最大化正交旋轉(zhuǎn)。、解釋因子結(jié)構(gòu)。我們最后得到的簡化的因子結(jié)構(gòu)是使每個變量僅在一個公共因子上有較大載荷,而在其余公共因子上的載荷比較小,至多是中等大小。這樣我們就能知道我們所研究的這些變量到底是由哪些潛在因素(也就是公共因子)影響的,哪些因素是起主要作用的,而哪些因素的作用較小,甚至可以不用考慮。、因子得分。因子分析的數(shù)學(xué)模型是將變量表示為公共因子的線性組合,由于公共因子能反映原始變量的相關(guān)關(guān)系,用公共因子代表原始變量時,有時更利于描述研究
11、對象的特征,因而往往需要反過來將公共因子表示為變量的線性組合,即因子得分。而驗證性因子分析主要有以下6個步驟:、定義因子模型。包括選擇因子個數(shù)和定義因子載荷。因子載荷可以事先定為0或者其它自由變化的常數(shù)?;蛘咴谝欢ǖ募s束條件下變化的數(shù)(比如與另一載荷相等)。這是和探索性因子分析在分析方法上的一個重要差異,我們可以用一個直觀的比喻,也就是說探索性因子分析是在一張白紙上作圖,而驗證性因子分析是在一張有框架的圖上完善和修改。、收集觀測值。定義了因子模型以后,我們就可以根據(jù)研究目的收集觀測值了。這一點與探索性因子分析有一定的相似之處。、獲得相關(guān)系數(shù)矩陣。與探索性因子分析一樣,我們的分析都是在原始數(shù)據(jù)的
12、相關(guān)系數(shù)矩陣基礎(chǔ)上進(jìn)行的,所以首先就要得到相關(guān)系數(shù)矩陣。實際上方差協(xié)差陣、相似系數(shù)矩陣和相關(guān)陣之間是可以相互轉(zhuǎn)化的。、根據(jù)數(shù)據(jù)擬合模型。我們需要選擇一個方法來估計自由變化的因子載荷。在多元正態(tài)的條件下,最常用的是極大似然估計,也可采用漸進(jìn)分布自由估計。、評價模型是否恰當(dāng)。這一步可以說是驗證性因子分析的核心。當(dāng)因子模型能夠擬合數(shù)據(jù)時,因子載荷的選擇要使模型暗含的相關(guān)陣與實際觀測陣之間的差異最小。最好的參數(shù)被選擇以后,差異量能被用來作為衡量模型與數(shù)據(jù)一致的程度。最常用的模型適應(yīng)性檢驗是卡方擬合優(yōu)度檢驗。原假設(shè)是模型是適應(yīng)性模型,備擇假設(shè)是存在顯著差異。但是,這個檢驗受樣本量大小影響,包含大樣本的檢
13、驗往往會導(dǎo)致拒絕原假設(shè),盡管因子模型是合適的。其他的統(tǒng)計方法,比如用Tucker-Lewis 指數(shù),比較建議模型和“原模型”的擬合度。這些方法受樣本量大小影響不大。、與其他模型比較。為了得到最優(yōu)模型,我們需要完成這一步。如果你想比較兩個模型,其中一個是另一個的縮略形式,你就能從卡方統(tǒng)計量的值檢查出他們的差別,大約服從卡方分布。幾乎所有獨立因子載荷的檢驗?zāi)苡脕碜鳛槿蜃幽P秃秃喴蜃拥哪P椭g的比較。為以防你不是在檢查全模型和簡模型,你可以比較均方根誤差的近似值 (RMSEA,它是模型中每個自由度差異的一個估計值。三、兩種因子分析方法應(yīng)結(jié)合使用驗證性因子分析與結(jié)構(gòu)方程模型(Structure Eq
14、uation Modeling)有著極強的聯(lián)系,SEM 是統(tǒng)計學(xué)領(lǐng)域中相對不太標(biāo)準(zhǔn)的領(lǐng)域, 其具體原理和應(yīng)用方法本人在另一篇文章中有詳細(xì)介紹,這里不在贅述。驗證性因子分析比探索性因子分析處理要困難多了。驗證性因子分析比探索性因子分析要求更大容量的樣本。主要是因為驗證性因子分析要處理推論統(tǒng)計量。精確的樣本量要隨著觀測值和模型的因子數(shù)變化而變化,但一個標(biāo)準(zhǔn)模型至少需要200個個體。和探索性因子分析一樣,模型中每個因子至少需要3個變量;與探索性因子分析不同的是,你必須選擇與每個因子在很大程度上匹配的變量,而不是可能是潛在變量的“隨機樣本”。一般來說,如果你沒有堅實的理論基礎(chǔ)支撐,有關(guān)觀測變量內(nèi)部結(jié)構(gòu),一般用探索性因子分析。先用探索性因子分析產(chǎn)生一
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 12 慧眼看交通 教學(xué)設(shè)計-2023-2024學(xué)年道德與法治三年級下冊統(tǒng)編版
- 牛羊進(jìn)口合同范本
- 外包員工顧問合同范本
- 親屬買房合同范本
- 12總也倒不了的老屋教學(xué)設(shè)計2024-2025學(xué)年統(tǒng)編版語文三年級上冊
- 2023年浙江省中考科學(xué)一輪專題輔導(dǎo)教學(xué)設(shè)計:觀察生物
- 3《歡歡喜喜慶國慶》(教學(xué)設(shè)計)2023-2024學(xué)年統(tǒng)編版道德與法治二年級上冊
- Module 5 Unit 2 On Monday,I'll go swimming (教學(xué)設(shè)計)-2023-2024學(xué)年外研版(一起)英語三年級下冊
- 玉米買賣居間合同范本
- 收購的合同范本
- 2024-2025學(xué)年山東省煙臺市高三上學(xué)期期末學(xué)業(yè)水平考試英語試題(解析版)
- 2025年益陽醫(yī)學(xué)高等專科學(xué)校高職單招高職單招英語2016-2024歷年頻考點試題含答案解析
- 配套課件-前廳客房服務(wù)與管理
- 2025年度藥店營業(yè)員服務(wù)規(guī)范及合同約束協(xié)議3篇
- 工業(yè)和信息化部裝備工業(yè)發(fā)展中心2025年上半年應(yīng)屆畢業(yè)生招聘易考易錯模擬試題(共500題)試卷后附參考答案
- 重慶市2024-2025學(xué)年高一上學(xué)期期末聯(lián)考生物試卷(含答案)
- 緊急疏散逃生方法
- 羊水栓塞護(hù)理應(yīng)急預(yù)案
- 2024年醫(yī)師定期考核臨床類考試題庫及答案(共500題)
- 工程進(jìn)度款支付臺賬-1-
- 瀝青路面施工質(zhì)量控制要78課件講解
評論
0/150
提交評論