




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第十二講聚類分析和因子分析第一頁(yè),共二十四頁(yè),編輯于2023年,星期一聚類分析specialforspss層次聚類分析中的Q型聚類層次聚類分析中的R型聚類快速聚類分析判別分析第二頁(yè),共二十四頁(yè),編輯于2023年,星期一+`
聚類分析---物以類聚。特點(diǎn):探索性的分析。在分類過(guò)程中,人們不必事先給出一個(gè)分類的標(biāo)準(zhǔn),聚類分析能夠從樣本數(shù)據(jù)出發(fā),自動(dòng)進(jìn)行分類。它能夠?qū)⒁慌慌鷺颖緮?shù)據(jù)按照他們?cè)谛再|(zhì)上的親密程度在沒有先驗(yàn)知識(shí)的情況下自動(dòng)進(jìn)行分類。*不同于相關(guān)系數(shù)(變量之間的關(guān)系)聚類分析:樣本間的相關(guān)第三頁(yè),共二十四頁(yè),編輯于2023年,星期一層次聚類分析中的Q型(樣本間:哪幾個(gè)樣本很像)聚類根據(jù)樣本之間的距離進(jìn)行計(jì)算。常用算法:歐式距離各個(gè)變量相減再求和歐式距離的平方(X2+X1)2+…….Chebychev距離
Block距離
Minkovsky距離
Customized距離第四頁(yè),共二十四頁(yè),編輯于2023年,星期一第五頁(yè),共二十四頁(yè),編輯于2023年,星期一第六頁(yè),共二十四頁(yè),編輯于2023年,星期一層次聚類分析中的Q型聚類打開聚類1分析---分類---層次聚類(系統(tǒng)聚類)---選擇個(gè)案第七頁(yè),共二十四頁(yè),編輯于2023年,星期一層次聚類分析中的R型聚類與Q型聚類不同的是,R型聚類計(jì)算的是變量之間的距離,而不是樣本之間的距離。打開聚類2分析---分類---層次聚類(系統(tǒng)聚類)---選擇變量第八頁(yè),共二十四頁(yè),編輯于2023年,星期一快速聚類分析由于聚類分析對(duì)計(jì)算機(jī)要求很高,因此當(dāng)出現(xiàn)大樣本的情況下,層次聚類分析往往速度較慢,因此采用快速聚類分析。快速聚類分析要求用戶根據(jù)經(jīng)驗(yàn)指定聚類最終形成多少種類。第九頁(yè),共二十四頁(yè),編輯于2023年,星期一快速聚類分析打開聚類3分析---分類---K均值聚類第十頁(yè),共二十四頁(yè),編輯于2023年,星期一因子分析降維第十一頁(yè),共二十四頁(yè),編輯于2023年,星期一主成分分析與因子分析的概念需要與可能:在各個(gè)領(lǐng)域的科學(xué)研究中,往往需要對(duì)反映事物的多個(gè)變量進(jìn)行大量的觀測(cè),收集大量數(shù)據(jù)以便進(jìn)行分析尋找規(guī)律。多變量大樣本無(wú)疑會(huì)為科學(xué)研究提供豐富的信息,但也在一定程度上增加了數(shù)據(jù)采集的工作量,更重要的是在大多數(shù)情況下,許多變量之間可能存在相關(guān)性而增加了問題分析的復(fù)雜性,同時(shí)對(duì)分析帶來(lái)不便。如果分別分析每個(gè)指標(biāo),分析又可能是孤立的,而不是綜合的。盲目減少指標(biāo)會(huì)損失很多信息,容易產(chǎn)生錯(cuò)誤的結(jié)論。第十二頁(yè),共二十四頁(yè),編輯于2023年,星期一因此需要找到一個(gè)合理的方法,減少分析指標(biāo)的同時(shí),盡量減少原指標(biāo)包含信息的損失,對(duì)所收集的資料作全面的分析。由于各變量間存在一定的相關(guān)關(guān)系,因此有可能用較少的綜合指標(biāo)分別綜合存在于各變量中的各類信息。因子分析就是這樣一種降維的方法。第十三頁(yè),共二十四頁(yè),編輯于2023年,星期一因子分析用較少因子反映原始資料多個(gè)變量的信息。特點(diǎn):1。因子變量的數(shù)量遠(yuǎn)少于原有的指標(biāo)變量的數(shù)量。2。因子變量不是對(duì)原有變量的取舍,而是對(duì)原有變量信息的重構(gòu)。3。因子變量之間不存在線性相關(guān)關(guān)系。第十四頁(yè),共二十四頁(yè),編輯于2023年,星期一因子分析要求(p<<m)
F1-FM是原有變量X1-XP是新變量(因子變量)建立原有因子和新因子的聯(lián)系第十五頁(yè),共二十四頁(yè),編輯于2023年,星期一上式通過(guò)化簡(jiǎn),可得:F=BX+aeX:因子變量B:載荷矩陣其中βij稱為因子載荷,是第i個(gè)原有變量在第j個(gè)因子變量上的負(fù)載,即βi在第j個(gè)因子變量上的相對(duì)重要性。即βij絕對(duì)值越大,公共因子與原有變量關(guān)系越強(qiáng)。第十六頁(yè),共二十四頁(yè),編輯于2023年,星期一由于實(shí)測(cè)的變量間存在一定的相關(guān)關(guān)系,因此有可能用較少數(shù)的綜合指標(biāo)分別綜合存在于各變量中的各類信息,而綜合指標(biāo)之間彼此不相關(guān),即各指標(biāo)代表的信息不重疊。綜合指標(biāo)稱為因子或主成分(提取幾個(gè)因子),一般有兩種方法:確定因子數(shù)量的因素(機(jī)器決定)特征值>1累計(jì)貢獻(xiàn)率>0.8(新因子至少代表就因子80%以上的信息)第十七頁(yè),共二十四頁(yè),編輯于2023年,星期一幾個(gè)基本概念:因子載荷:表示該因子對(duì)變量的影響程度,代表了因子和原先變量的相關(guān)系數(shù)。也稱為變量在因子上的載荷。旋轉(zhuǎn)矩陣:對(duì)因子載荷進(jìn)行旋轉(zhuǎn),使系數(shù)向0和1兩極分化。(運(yùn)算復(fù)雜),想讓因子載荷矩陣做兩極分化,看清楚哪個(gè)因子系數(shù)作用程度更大因子得分系數(shù):每一個(gè)變量在不同因子上的具體數(shù)據(jù)值。第十八頁(yè),共二十四頁(yè),編輯于2023年,星期一成績(jī)數(shù)據(jù)(student.sav)100個(gè)學(xué)生的數(shù)學(xué)、物理、化學(xué)、語(yǔ)文、歷史、英語(yǔ)的成績(jī)?nèi)缦卤恚ú糠郑?。第十九?yè),共二十四頁(yè),編輯于2023年,星期一重要結(jié)果分析這里的InitialEigenvalues就是特征值(數(shù)據(jù)相關(guān)陣的特征值)。頭兩個(gè)成分特征值累積占了總方差的81.142%。后面的特征值的貢獻(xiàn)越來(lái)越少。第二十頁(yè),共二十四頁(yè),編輯于2023年,星期一特征值的貢獻(xiàn)還可以從SPSS的所謂碎石圖看出第二十一頁(yè),共二十四頁(yè),編輯于2023年,星期一這里,第一個(gè)因子主要和語(yǔ)文、歷史、英語(yǔ)三科有很強(qiáng)的正相關(guān);而第二個(gè)因子主要和數(shù)學(xué)、物理、化學(xué)三科有很強(qiáng)的正相關(guān)。因此可以給第一個(gè)因子起名為“文科因子”,而給第二個(gè)因子起名為“理科因子”??唇^對(duì)值:eg.數(shù)學(xué):第二個(gè)因子作用大,歸為文科因子第二十二頁(yè),共二十四頁(yè),編輯于2023年,星期一因子變量分析步驟:1。確定待分析的原有若干變量是否適合于因子分析。(檢驗(yàn)方法:巴德迪特檢驗(yàn);kmo>0
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 醫(yī)療服裝購(gòu)銷合同范本
- 獸醫(yī)免疫學(xué)模擬試題
- 初級(jí)經(jīng)濟(jì)師(人力資源專業(yè))模擬習(xí)題
- 廚具公司合同范本
- 下學(xué)期八年級(jí)英語(yǔ)教學(xué)總結(jié) -教學(xué)工作總結(jié)
- 中藥炮制題庫(kù)(含答案)
- 植物生產(chǎn)與環(huán)境測(cè)試題含參考答案
- 關(guān)于社保補(bǔ)充合同范本
- 一年級(jí)小學(xué)生入隊(duì)申請(qǐng)書
- 一年級(jí)下冊(cè)語(yǔ)文教學(xué)反思
- 急診醫(yī)院感染與控制課件
- 【生 物】光合作用課件-2024-2025學(xué)年人教版生物七年級(jí)下冊(cè)
- GB/T 44927-2024知識(shí)管理體系要求
- 2024年07月山東省泰山財(cái)產(chǎn)保險(xiǎn)股份有限公司2024年夏季校園招考29名工作人員筆試歷年參考題庫(kù)附帶答案詳解
- 臨床護(hù)理死亡病例討論
- 2025年廣東韶關(guān)城投集團(tuán)招聘筆試參考題庫(kù)含答案解析
- 醫(yī)療器械生產(chǎn)企業(yè)并購(gòu)合同
- 2025版新能源汽車充電站建設(shè)合同含政府補(bǔ)貼及稅收優(yōu)惠條款
- 2025年北京國(guó)資公司招聘筆試參考題庫(kù)含答案解析
- 建設(shè)工程總承包EPC建設(shè)工程項(xiàng)目管理方案1
- 2024年度酒店智能化系統(tǒng)安裝工程合同
評(píng)論
0/150
提交評(píng)論