《SPSS回歸分析》PPT課件_第1頁(yè)
《SPSS回歸分析》PPT課件_第2頁(yè)
《SPSS回歸分析》PPT課件_第3頁(yè)
《SPSS回歸分析》PPT課件_第4頁(yè)
《SPSS回歸分析》PPT課件_第5頁(yè)
已閱讀5頁(yè),還剩76頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第八章回歸分析1h主要內(nèi)容8.1 回歸分析概述8.2 線性回歸分析8.3 曲線估計(jì)8.4 二元Logistic回歸分析2h8.1 回歸分析概述(1)確定性關(guān)系與非確定性關(guān)系 變量與變量之間的關(guān)系分為確定性關(guān)系和非確定性關(guān)系,函數(shù)表達(dá)確定性關(guān)系。研究變量間的非確定性關(guān)系,構(gòu)造變量間經(jīng)驗(yàn)公式的數(shù)理統(tǒng)計(jì)方法稱(chēng)為回歸分析。(2)回歸分析基本概念 回歸分析是指通過(guò)提供變量之間的數(shù)學(xué)表達(dá)式來(lái)定量描述變量間相關(guān)關(guān)系的數(shù)學(xué)過(guò)程,這一數(shù)學(xué)表達(dá)式通常稱(chēng)為經(jīng)驗(yàn)公式。我們不僅可以利用概率統(tǒng)計(jì)知識(shí),對(duì)這個(gè)經(jīng)驗(yàn)公式的有效性進(jìn)行判定,同時(shí)還可以利用這個(gè)經(jīng)驗(yàn)公式,根據(jù)自變量的取值預(yù)測(cè)因變量的取值。如果是多個(gè)因素作為自變量的時(shí)

2、候,還可以通過(guò)因素分析,找出哪些自變量對(duì)因變量的影響是顯著的,哪些是不顯著的。3h(3)回歸分析的一般步驟第1步 確定回歸方程中的因變量和自變量。第2步 確定回歸模型。第3步 建立回歸方程。第4步 對(duì)回歸方程進(jìn)行各種檢驗(yàn)。擬合優(yōu)度檢驗(yàn)回歸方程的顯著性檢驗(yàn)回歸系數(shù)的顯著性檢驗(yàn)第5步 利用回歸方程進(jìn)行預(yù)測(cè)。8.1 回歸分析概述4h主要內(nèi)容8.1 回歸分析概述8.2 線性回歸分析8.3 曲線估計(jì)8.4 二元Logistic回歸分析5h8.2線性回歸分析8.2.1 基本概念及統(tǒng)計(jì)原理1.基本概念 線性回歸假設(shè)因變量與自變量之間為線性關(guān)系,用一定的線性回歸模型來(lái)擬合因變量和自變量的數(shù)據(jù),并通過(guò)確定模型參

3、數(shù)來(lái)得到回歸方程。根據(jù)自變量的多少,線性回歸可有不同的劃分。當(dāng)自變量只有一個(gè)時(shí),稱(chēng)為一元線性回歸,當(dāng)自變量有多個(gè)時(shí),稱(chēng)為多元線性回歸。6h8.2線性回歸分析(2) 統(tǒng)計(jì)原理 一元回歸方程和多元回歸方程一元線性和多元線性回歸分析的核心任務(wù)就是估計(jì)其中的參數(shù)。7h8.2線性回歸分析8.2.2 SPSS實(shí)例分析【例8-1】現(xiàn)有1992年-2006年國(guó)家財(cái)政收入和國(guó)內(nèi)生產(chǎn)總值的數(shù)據(jù)如下表所示,請(qǐng)研究國(guó)家財(cái)政收入和國(guó)內(nèi)生產(chǎn)總值之間的線性關(guān)系。年份國(guó)內(nèi)生產(chǎn)總值(單位:億元)財(cái)政收入(單位:億元)年份國(guó)內(nèi)生產(chǎn)總值(單位:億元)財(cái)政收入(單位:億元)199226923.53483.37200099214.61

4、3395.23199335333.94348.952001109655.216386.04199448197.95218.102002120332.718903.64199560793.76242.202003135822.821715.25199671176.67407.992004159878.326396.47199778973.08651.142005183867.931649.29199884402.39875.952006210871.038760.20199989677.111444.088h8.2 線性回歸分析第1步 分析:這是一個(gè)因變量和一個(gè)自變量之間的問(wèn)題,故應(yīng)該考慮用一元

5、線性回歸解決。第2步 數(shù)據(jù)組織:定義三個(gè)變量,分別為“year”(年份)、“x”(國(guó)內(nèi)生產(chǎn)總值)、“y”(財(cái)政收入)。第3步 作散點(diǎn)圖,觀察兩個(gè)變量的相關(guān)性:依次選擇菜單“圖形舊對(duì)話框散點(diǎn)/點(diǎn)狀簡(jiǎn)單分布”,并將“國(guó)內(nèi)生產(chǎn)總值”作為x軸,“財(cái)政收入”作為y軸,得到如下所示圖形??梢钥闯鰞勺兞烤哂休^強(qiáng)的線性關(guān)系,可以用一元線性回歸來(lái)擬合兩變量。9h8.2 線性回歸分析第4步 一元線性回歸分析設(shè)置:選擇菜單“分析回歸線性”,打開(kāi)“線性回歸”對(duì)話框,將變量“財(cái)政收入”作為因變量 ,“國(guó)內(nèi)生產(chǎn)總值”作為自變量。打開(kāi)“統(tǒng)計(jì)量”對(duì)話框,選上“估計(jì)”和“模型擬合度”。單擊“繪制(T)”按鈕,打開(kāi)“線性回歸:圖

6、”對(duì)話框,選用DEPENDENT作為y軸,*ZPRED為x軸作圖。并且選擇“直方圖”和“正態(tài)概率圖” 作相應(yīng)的保存選項(xiàng)設(shè)置,如預(yù)測(cè)值、殘差和距離等。10h8.2 線性回歸分析第5步 主要結(jié)果及分析:變量輸入和移去表表中顯示回歸模型編號(hào)、進(jìn)入模型的變量、移出模型的變量和變量的篩選方法??梢钥闯?,進(jìn)入模型的自變量為“國(guó)內(nèi)生產(chǎn)總值” 。 模型綜述表 R=0.989,說(shuō)明自變量與因變量之間的相關(guān)性很強(qiáng)。R方(R2) =0.979,說(shuō)明自變量“國(guó)內(nèi)生產(chǎn)總值”可以解釋因變量“財(cái)政收入”的97.9%的差異性。 模型輸入的變量移去的變量方法1國(guó)內(nèi)生產(chǎn)總值.輸入a. 已輸入所有請(qǐng)求的變量。 b. 因變量: 財(cái)政

7、收入。模型RR 方調(diào)整 R 方標(biāo)準(zhǔn)估計(jì)的誤差1.989a.979.9771621.66312a. 預(yù)測(cè)變量:(常量),國(guó)內(nèi)生產(chǎn)總值。b. 因變量:財(cái)政收入。11h8.2 線性回歸分析方差分析表表中顯示因變量的方差來(lái)源、方差平方和、自由度、均方、F檢驗(yàn)統(tǒng)計(jì)量的觀測(cè)值和顯著性水平。方差來(lái)源有回歸、殘差。從表中可以看出,F(xiàn)統(tǒng)計(jì)量的觀測(cè)值為592.25,顯著性概率為0.000,即檢驗(yàn)假設(shè)“H0:回歸系數(shù)B = 0”成立的概率為0.000,從而應(yīng)拒絕原假設(shè),說(shuō)明因變量和自變量的線性關(guān)系是非常顯著的,可建立線性模型。模型平方和df均方FSig.1回歸1.557E911.557E9592.250殘差3418

8、7286.770132629791.290總計(jì)1.592E914a. 預(yù)測(cè)變量:(常量),國(guó)內(nèi)生產(chǎn)總值。b. 因變量:財(cái)政收入。12h8.2 線性回歸分析回歸系數(shù)表表中顯示回歸模型的常數(shù)項(xiàng)、非標(biāo)準(zhǔn)化的回歸系數(shù)B值及其標(biāo)準(zhǔn)誤差、標(biāo)準(zhǔn)化的回歸系數(shù)值、統(tǒng)計(jì)量t值以及顯著性水平(Sig.)。從表中可看出,回歸模型的常數(shù)項(xiàng)為-4993.281,自變量“國(guó)內(nèi)生產(chǎn)總值”的回歸系數(shù)為0.197。因此,可以得出回歸方程:財(cái)政收入=-4993.281 + 0.197 國(guó)內(nèi)生產(chǎn)總值。模型非標(biāo)準(zhǔn)化系數(shù)標(biāo)準(zhǔn)系數(shù)tSig.B標(biāo)準(zhǔn)誤差試用版1(常量)-4993.281919.356-5.431.000國(guó)內(nèi)生產(chǎn)總值.197.

9、008.98924.336.000回歸系數(shù)的顯著性水平為0.000,明顯小于0.05,故應(yīng)拒絕T檢驗(yàn)的原假設(shè),這也說(shuō)明了回歸系數(shù)的顯著性,說(shuō)明建立線性模型是恰當(dāng)?shù)摹?3h主要內(nèi)容8.1 回歸分析概述8.2 線性回歸分析8.3 曲線估計(jì)8.4 二元Logistic回歸分析14h8.3 曲線估計(jì)8.3.1 基本概念及統(tǒng)計(jì)原理(1) 基本概念 曲線估計(jì)(曲線擬合、曲線回歸)則是研究?jī)勺兞块g非線性關(guān)系的一種方法,選定一種用方程表達(dá)的曲線,使得實(shí)際數(shù)據(jù)與理論數(shù)據(jù)之間的差異盡可能地小。如果曲線選擇得好,那么可以揭示因變量與自變量的內(nèi)在關(guān)系,并對(duì)因變量的預(yù)測(cè)有一定的意義。 在曲線估計(jì)中,需要解決兩個(gè)問(wèn)題:一

10、是選用哪種理論模型,即用哪種方程來(lái)擬合觀測(cè)值;二是當(dāng)模型確定后,如何選擇合適的參數(shù),使得理論數(shù)據(jù)和實(shí)際數(shù)據(jù)的差異最小。15h8.3 曲線估計(jì)(2) 統(tǒng)計(jì)原理 在曲線估計(jì)中,有很多的數(shù)學(xué)模型,選用哪一種形式的回歸方程才能最好地表示出一種曲線的關(guān)系往往不是一個(gè)簡(jiǎn)單的問(wèn)題,可以用數(shù)學(xué)方程來(lái)表示的各種曲線的數(shù)目幾乎是沒(méi)有限量的。在可能的方程之間,以吻合度而論,也許存在著許多吻合得同樣好的曲線方程。因此,在對(duì)曲線的形式的選擇上,對(duì)采取什么形式需要有一定的理論,這些理論是由問(wèn)題本質(zhì)決定的。(3) 分析步驟首先,在不能明確究竟哪種模型更接近樣本數(shù)據(jù)時(shí),可在上述多種可選擇的模型中選擇幾種模型;其次,SPSS自

11、動(dòng)完成模型參數(shù)的估計(jì),并輸出回歸方程顯著性檢驗(yàn)的F值和概率p值、決定系數(shù)R2等統(tǒng)計(jì)量;最后,以判定系數(shù)為主要依據(jù)選擇其中的最優(yōu)模型,并進(jìn)行預(yù)測(cè)分析等。16h8.3 曲線估計(jì)8.3.2 SPSS實(shí)例分析【例8-3】 表8.16是19892001年國(guó)家保費(fèi)收入與國(guó)內(nèi)生產(chǎn)總值的數(shù)據(jù),試研究保費(fèi)收入與國(guó)內(nèi)生產(chǎn)總值的關(guān)系。年度保費(fèi)收入國(guó)民生產(chǎn)總值年度保費(fèi)收入國(guó)民生產(chǎn)總值19804.64517.81991239.721662.519817.84860.3199237826651.9198210.35301.8199352534560.5198313.25957.4199463046670198420720

12、6.7199568357494.9198533.18989.1199677666850.5198645.810201.41997108073142.7198771.0411954.519981247.376967.21988109.514922.319991393.2280579.41989142.616917.820001595.988228.11990178.518598.420012109.3694346.417h8.3 曲線估計(jì)第1步 分析:先用散點(diǎn)圖的形式進(jìn)行分析,看究竟是否具有一元線性關(guān)系,如果具有一元線性關(guān)系,則用一元線性回歸分析,否則采用曲線估計(jì)求解。第2步 數(shù)據(jù)組織:定義為三

13、個(gè)變量,分別是“year”(年度)、“y”(保費(fèi)收入)和“x”(國(guó)內(nèi)生產(chǎn)總值),輸入數(shù)據(jù)并保存。第3步 作散點(diǎn)圖初步判定變量的分布趨勢(shì):保費(fèi)收入y隨國(guó)內(nèi)生產(chǎn)總值x的提高而逐漸提高,而且當(dāng)國(guó)內(nèi)生產(chǎn)總值達(dá)到一定水平后,保費(fèi)收入的增幅更加明顯。因此用線性回歸模型表示x,y的關(guān)系是不恰當(dāng)?shù)?。于是?yīng)找擬合效果好的模型。18h8.3 曲線估計(jì)第4步 進(jìn)行曲線估計(jì):依次選擇菜單“分析回歸曲線估計(jì)”,將所有模型全部選上,看哪種模型擬合效果更好(主要看決定系數(shù)R2),其所有模型的擬合優(yōu)度R2如下表所示。模型名稱(chēng)R Square(R2)直線(Linear)0.941二次曲線(Quadratic)0.973復(fù)合曲線

14、(Compound)0.789生長(zhǎng)曲線(Growth)0.789對(duì)數(shù)曲線(Logarithmic)0.772三次曲線(Cubic)0.990S曲線(S)0.946指數(shù)曲線(Exponential)0.789逆函數(shù)(Inverse)0.481冪函數(shù)(Power)0.972邏輯函數(shù)(Logistic)0.789從決定系數(shù)(R方即R2)來(lái)看,三次曲線效果最好(因?yàn)槠銻2值最大),并且方差分析的顯著性水平(Sig.)為0。故重新進(jìn)行上面的過(guò)程,只選“三次曲線(Cubic)”一種模型。 19h8.3 曲線估計(jì)第5步 結(jié)果與分析。三次曲線模型擬合效果的檢驗(yàn)表復(fù)相關(guān)系數(shù)R = 0.995,R2 = 0.99

15、0,經(jīng)校正后的R平方值為0.989。故可判斷保費(fèi)收入與國(guó)內(nèi)生產(chǎn)總值之間有較顯著的三次曲線關(guān)系 方差分析表 相伴概率Sig.=0.000說(shuō)明模型具有顯著的統(tǒng)計(jì)學(xué)意義。 RR方調(diào)整R方估計(jì)值的標(biāo)準(zhǔn)誤.995.990.98964.883自變量為 國(guó)內(nèi)生產(chǎn)總值。平方和df均方FSig.回歸7800612.55932600204.186617.659.000殘差75775.960184209.776總計(jì)7876388.51821自變量為 國(guó)內(nèi)生產(chǎn)總值。20h8.3 曲線估計(jì)回歸系數(shù)表從表中可知因變量與自變量的三次回歸模型為:y=-166.430+0.029x-5.364E-7x2+5.022E-12x3

16、未標(biāo)準(zhǔn)化系數(shù)標(biāo)準(zhǔn)化系數(shù)tSig.B標(biāo)準(zhǔn)誤Beta內(nèi)民生產(chǎn)總值.029.0051.5065.836.000國(guó)內(nèi)生產(chǎn)總值 * 2-5.364E-7.000-2.554-4.277.000國(guó)內(nèi)生產(chǎn)總值 * 35.022E-12.0002.093.(常數(shù))-166.43045.399-3.666.00221h9.2 曲線估計(jì)擬合效果圖從圖形上看出其擬合效果非常好。22h8.3 曲線估計(jì)說(shuō)明: 曲線估計(jì)是一個(gè)自變量與因變量的非線性回歸過(guò)程,但只能處理比較簡(jiǎn)單的模型。如果有多個(gè)自變量與因變量呈非線性關(guān)系時(shí),就需要用其他非線性模型對(duì)因變量進(jìn)行擬合,SPSS 19中提供了“非線性”過(guò)程,由于涉及的模型很多,且

17、非線性回歸分析中參數(shù)的估計(jì)通常是通過(guò)迭代方法獲得的,而且對(duì)初始值的設(shè)置也有較高的要求,如果初始值選擇不合適,即使指定的模型函數(shù)非常準(zhǔn)確,也會(huì)導(dǎo)致迭代過(guò)程不收斂,或者只得到一個(gè)局部最優(yōu)值而不能得到整體最優(yōu)值。23h主要內(nèi)容8.1 回歸分析概述8.2 線性回歸分析8.3 曲線估計(jì)8.4 二元Logistic回歸分析24h8.4.1 基本概念及統(tǒng)計(jì)原理(1)基本概念 Logistic回歸分析就是針對(duì)因變量是定性變量的回歸分析。根據(jù)因變量取值類(lèi)別數(shù)量不同,Logistic回歸分析又分為二元Logistic回歸分析和多元Logistic回歸分析。二元Logistic回歸模型中因變量只可以取兩個(gè)值1和0(

18、虛擬因變量),而多元Logistic回歸模型中因變量可取多個(gè)值。8.4 二元Logistic回歸分析25h(2)統(tǒng)計(jì)原理logit變換 8.4 二元Logistic回歸分析Logistic回歸模型Logistic回歸模型26h(3)統(tǒng)計(jì)檢驗(yàn) 與線性回歸一樣,擬合時(shí)也要考慮模型是否合適、哪些變量該保留、擬合效果如何等問(wèn)題。線性回歸中常用的是決定系數(shù)R2,T檢驗(yàn)、F檢驗(yàn)等工具在這里均不再適用。在Logistic回歸中常用的檢驗(yàn)有-2對(duì)數(shù)似然檢驗(yàn)(-2 log(likelihood), -2LL)、Hosmer和Lemeshow的擬合優(yōu)度檢驗(yàn)、Wald檢驗(yàn)等。 8.4 二元Logistic回歸分析2

19、7h8.4.2 SPSS實(shí)例分析【例8-4】 診斷發(fā)現(xiàn)運(yùn)營(yíng)不良的金融企業(yè)是審計(jì)核查的一項(xiàng)重要功能,審計(jì)核查的分類(lèi)失敗會(huì)導(dǎo)致災(zāi)難性的后果。下表列出了66家公司的部分運(yùn)營(yíng)財(cái)務(wù)比率,其中33家在2年后破產(chǎn)(Y = 0),另外33家在同期保持償付能力(Y = 1)。請(qǐng)用變量X1(未分配利潤(rùn)/總資產(chǎn))、X2(稅前利潤(rùn)/總資產(chǎn))和X3(銷(xiāo)售額/總資產(chǎn))擬合一個(gè)Logistic回歸模型。 8.4 二元Logistic回歸分析X1X2X3YX1X2X3YX1X2X3YX1X2X3Y-62.8-89.51.704316.41.31-27.96.31.3031.415.71.913.3-3.51.1047161.

20、91-48.26.81.6021.5-14.411-120.8-103.22.50-3.342.71-49.2-17.20.308.55.81.51-18.1-28.81.103520.81.91-19.2-36.70.8040.65.81.81-3.8-50.60.9046.712.60.91-18.1-6.50.9034.626.41.81-61.2-56.21.7020.812.52.41-98-20.81.7019.926.72.31-20.3-17.4103323.61.51-129-14.21.3017.412.61.31-194.5-25.80.5026.110.42.11-4-

21、15.82.1054.714.61.7120.8-4.31068.613.81.61-8.7-36.32.8053.520.61.11-106.1-22.91.5037.333.43.51-59.2-12.82.1035.926.421-39.4-35.71.205923.15.51-13.1-17.60.9039.430.51.91-164.1-17.71.3049.623.81.91-381.61.2053.17.11.91-308.9-65.80.8012.571.81-57.90.70.8039.813.81.217.2-22.62037.334.11.51-8.8-9.10.9059

22、.5721-118.3-34.21.5035.34.20.91-64.7-40.1016.320.411-185.9-2806.7049.525.12.61-11.44.80.90-34.6-19.43.4018.113.54121.7-7.81.6128h第1步 分析:共有3個(gè)自變量,均是定量數(shù)據(jù)類(lèi)型,而因變量是定性的,取值有兩種狀態(tài)(0和1),這是一個(gè)典型的可用二元Logistic回歸解決的問(wèn)題。 第2步 數(shù)據(jù)組織:定義三個(gè)自變量X1,X2和X3,再定義因變量Y,輸入數(shù)據(jù)并保存。 第3步 二元Logistic回歸分析設(shè)置: (設(shè)置過(guò)程詳見(jiàn)教材p195-197) 第4步 主要結(jié)果及分析:數(shù)據(jù)

23、的基本信息表8.4 二元Logistic回歸分析未加權(quán)的案例aN百分比選定案例包括在分析中66100.0缺失案例0.0總計(jì)66100.0未選定的案例0.0總計(jì)66100.0a. 如果權(quán)重有效,請(qǐng)參見(jiàn)分類(lèi)表以獲得案例總數(shù)。給出了數(shù)據(jù)進(jìn)入模型的記錄數(shù) 29h模型系數(shù)的檢驗(yàn)結(jié)果8.4 二元Logistic回歸分析其中常數(shù)項(xiàng)系數(shù)為0.000,其相伴概率為1,可見(jiàn)常數(shù)項(xiàng)不顯著。X1,X2和X3的相伴概率分別是0.000,0.000和0.094,如果以5%為置信的話,X1和X2的系數(shù)通過(guò)了檢驗(yàn),即這兩個(gè)變量是顯著的。BS.E,WalsdfSig.Exp (B)步驟 0常量.000.246.00011.00

24、01.000得分dfSig.步驟 0變量X131.6211.000X219.3581.000X32.8001.094總統(tǒng)計(jì)量37.6133.00030h模型全局檢驗(yàn)結(jié)果表8.4 二元Logistic回歸分析共采用了三種檢驗(yàn)方法,分別是步與步間的相對(duì)似然比檢驗(yàn)、塊(Block)間的相對(duì)似然比檢驗(yàn)和模型間的相對(duì)似然比檢驗(yàn)。由于本例中只有一個(gè)自變量組且采取強(qiáng)行進(jìn)入法將所有變量納入模型,所以三種檢驗(yàn)方法的結(jié)果是一致的,模型有顯著的統(tǒng)計(jì)意義。模型情況摘要表。主要給出-2對(duì)數(shù)似然值的兩個(gè)決定系數(shù),從數(shù)據(jù)上看,模型的擬合度不錯(cuò)??ǚ絛fSig.步驟 1步驟85.6833.000塊85.6833.000模型8

25、5.6833.000步驟-2 對(duì)數(shù)似然值Cox & Snell R 方Nagelkerke R 方15.813a.727.969a. 因?yàn)閰?shù)估計(jì)的更改范圍小于 .001,所以估計(jì)在迭代次數(shù) 12 處終止。31h模型分類(lèi)預(yù)測(cè)值表8.4 二元Logistic回歸分析此時(shí)模型的預(yù)測(cè)準(zhǔn)確率已達(dá)到97%。表格從左到右依次表示變量及常數(shù)項(xiàng)的系數(shù)值(B)、標(biāo)準(zhǔn)誤差(S.E.)、Wald卡方值、自由度(df)、相伴概率(Sig.)、Exp(B)。由于各回歸系數(shù)均為正數(shù),取相應(yīng)的指數(shù)后會(huì)大于1,表示X1,X2和X3的取值越大,“兩年后具有償付能力”的可能性比“兩年后破產(chǎn)”的可能性就越大, 已觀測(cè)已預(yù)測(cè)Y百分比

26、校正兩年后破產(chǎn)兩年后仍有償付能力步驟 1Y兩年后破產(chǎn)32197.0兩年后仍有償付能力13297.0總計(jì)百分比97.0a. 切割值為 .500。Logistic模型的參數(shù)擬合表BS.E,WalsdfSig.Exp (B)EXP(B)的95% C.I.下限上限步驟 1aX1.331.3011.2131.2711.393.7722.511X2.181.1072.8621.0911.198.9721.478X35.0875.0821.0021.317161.979.0083430718.695常量-10.15310.840.8771.349.000a. 在步驟 1 中輸入的變量: X1, X2, X3

27、.32hLogistic回歸模型8.4 二元Logistic回歸分析33hThe End34h第九章聚類(lèi)和判別分析35h主要內(nèi)容9.1 聚類(lèi)與判別分析概述9.2 二階聚類(lèi)9.3 K-均值聚類(lèi)9.4 系統(tǒng)聚類(lèi)9.5 判別分析36h9.1 聚類(lèi)與判別分析概述9.1.1 基本概念(1) 聚類(lèi)分析 聚類(lèi)分析的基本思想是找出一些能夠度量樣本或指標(biāo)之間相似程度的統(tǒng)計(jì)量,以這些統(tǒng)計(jì)量為劃分類(lèi)型的依據(jù),把一些相似程度較大的樣本(或指標(biāo))聚合為一類(lèi),把另外一些彼此之間相似程度較大的樣本又聚合為一類(lèi)。根據(jù)分類(lèi)對(duì)象的不同,聚類(lèi)分析可分為對(duì)樣本的聚類(lèi)和對(duì)變量的聚類(lèi)兩種。 (2) 判別分析 判別分析是判別樣本所屬類(lèi)型的

28、一種統(tǒng)計(jì)方法。37h9.1 聚類(lèi)與判別分析概述9.1.2 樣本間親疏關(guān)系的度量(1)連續(xù)變量的樣本間距離常用度量 主要方法有歐氏距離(Euclidean Distance)、歐氏平方距離(Squared Euclidean Distance)、切比雪夫距離(Chebychev Distance)、明可斯基距離(Minkowski Distance)、用戶(hù)自定義距離(Customize Distance)、Pearson相關(guān)系數(shù)、夾角余弦(Cosine)等。(公式見(jiàn)教材表7.9)(2)順序變量的樣本間距離常用度量 常用的有 統(tǒng)計(jì)量(Chi-square measure)和 統(tǒng)計(jì)量(Phi-squ

29、are measure)。(公式見(jiàn)教材表7.10)38h9.1 聚類(lèi)與判別分析概述9.1.1 基本概念(3) 二者區(qū)別 不同之處在于,判別分析是在已知研究對(duì)象分為若干類(lèi)型(或組別)并已取得各種類(lèi)型的一批已知樣本的觀測(cè)量數(shù)據(jù)的基礎(chǔ)上,根據(jù)某些準(zhǔn)則建立判別式,然后對(duì)未知類(lèi)型的樣本進(jìn)行差別分析。 39h9.1 聚類(lèi)與判別分析概述說(shuō)明:聚類(lèi)分析的目的是找到樣本中數(shù)據(jù)的特點(diǎn),因此應(yīng)注意所選擇的變量是否已經(jīng)能夠反應(yīng)所要聚類(lèi)樣本的主要特點(diǎn)。聚類(lèi)分析時(shí)應(yīng)注意所選擇的變量是否存在數(shù)量級(jí)上的差別。如果一個(gè)樣本包含不同數(shù)量的變量,則應(yīng)先對(duì)變量進(jìn)行標(biāo)準(zhǔn)化處理,而后再進(jìn)行聚類(lèi)。變量間的關(guān)系度量模型與樣本間相類(lèi)似,只不過(guò)

30、一個(gè)用矩陣的行進(jìn)行計(jì)算,另一個(gè)用矩陣的列進(jìn)行計(jì)算。40h主要內(nèi)容9.1 聚類(lèi)與判別分析概述9.2 二階聚類(lèi)9.3 K-均值聚類(lèi)9.4 系統(tǒng)聚類(lèi)9.5 判別分析41h9.2 二階聚類(lèi)9.2.1 基本概念及統(tǒng)計(jì)原理(1)基本概念 二階聚類(lèi)(TwoStep Cluster)(也稱(chēng)為兩步聚類(lèi))是一個(gè)探索性的分析工具(),為揭示自然的分類(lèi)或分組而設(shè)計(jì),是數(shù)據(jù)集內(nèi)部的而不是外觀上的分類(lèi)。它是一種新型的分層聚類(lèi)算法(Hierarchical Algorithms),目前主要應(yīng)用到數(shù)據(jù)挖掘(Data Mining)和多元數(shù)據(jù)統(tǒng)計(jì)的交叉領(lǐng)域模式分類(lèi)中。該過(guò)程主要有以下幾個(gè)特點(diǎn):分類(lèi)變量和連續(xù)變量均可以參與二階聚

31、類(lèi)分析;該過(guò)程可以自動(dòng)確定分類(lèi)數(shù);可以高效率地分析大數(shù)據(jù)集;用戶(hù)可以自己定制用于運(yùn)算的內(nèi)存容量。 42h9.2 二階聚類(lèi)9.2.1 基本概念及統(tǒng)計(jì)原理(2) 統(tǒng)計(jì)原理 兩步法的功能非常強(qiáng)大,而原理又較為復(fù)雜。他在聚類(lèi)過(guò)程中除了使用傳統(tǒng)的歐氏距離外,為了處理分類(lèi)變量和連續(xù)變量,它用似然距離測(cè)度,它要求模型中的變量是獨(dú)立的,分類(lèi)變量是多項(xiàng)式分布,連續(xù)變量是正態(tài)分布的。分類(lèi)變量和連續(xù)變量均可以參與兩步聚類(lèi)分析。43h9.2 二階聚類(lèi)9.2.1 基本概念及統(tǒng)計(jì)原理(3)分析步驟第1步 預(yù)聚類(lèi):對(duì)每個(gè)觀測(cè)變量考察一遍,確定類(lèi)中心。根據(jù)相近者為同一類(lèi)的原則,計(jì)算距離并把與類(lèi)中心距離最小的觀測(cè)量分到相應(yīng)的各

32、類(lèi)中去。這個(gè)過(guò)程稱(chēng)為構(gòu)建一個(gè)分類(lèi)的特征樹(shù)(CF)。 第2步 正式聚類(lèi):使用凝聚算法對(duì)特征樹(shù)的葉節(jié)點(diǎn)分組,凝聚算法可用來(lái)產(chǎn)生一個(gè)結(jié)果范圍。44h9.2 二階聚類(lèi)9.2.2 SPSS實(shí)例分析 【例9-1】 某機(jī)構(gòu)為了調(diào)查學(xué)生性別和所學(xué)專(zhuān)業(yè)與畢業(yè)后初始工資的情況,調(diào)查抽取了60個(gè)學(xué)生的數(shù)據(jù),如表9.1所示(其中“性別”1代表男性,0代表女性;“學(xué)科”1代表農(nóng)學(xué),2代表建筑,3代表地質(zhì),4代表商務(wù),5代表林學(xué),6代表教育,7代表工程,8代表藝術(shù)),試根據(jù)樣本指標(biāo)進(jìn)行聚類(lèi)分析。(數(shù)據(jù)參見(jiàn)教材P206)第1步 分析:由于自變量中不僅有連續(xù)屬性,也有分類(lèi)變量,故采用二階聚類(lèi)進(jìn)行分析。 第2步 數(shù)據(jù)組織:按表

33、所示定義變量,輸入數(shù)據(jù)并保存。 45h9.2 二階聚類(lèi)第3步 二階聚類(lèi)設(shè)置:按“分析分類(lèi)兩步聚類(lèi)”順序打開(kāi)“二階聚類(lèi)分析”對(duì)話框,并按下圖進(jìn)行設(shè)置。 46h9.2 二階聚類(lèi)第4步 主要結(jié)果及分析:二階聚類(lèi)的模型概要和聚類(lèi)質(zhì)量情況聚類(lèi)個(gè)案情況圖從中可以看出,此算法采用的是兩步(二階)聚類(lèi),共輸入3個(gè)變量,將所有個(gè)案聚成3類(lèi)。聚類(lèi)的平均輪廓值為0.6(其范圍值為-1.01.0,值越大越好),說(shuō)明聚類(lèi)質(zhì)量較好。 可以看出各類(lèi)所占的比例情況47h9.2 二階聚類(lèi)第4步 主要結(jié)果及分析:各個(gè)案所屬的分類(lèi)號(hào)情況48h主要內(nèi)容9.1 聚類(lèi)與判別分析概述9.2 二階聚類(lèi)9.3 K-均值聚類(lèi)9.4 系統(tǒng)聚類(lèi)9.

34、5 判別分析49h9.3 K-均值聚類(lèi)9.3.1 基本概念及統(tǒng)計(jì)原理(1)基本概念 K-均值聚(也稱(chēng)快速聚類(lèi))是由用戶(hù)指定類(lèi)別數(shù)的大樣本資料的逐步聚類(lèi)分析。它先對(duì)數(shù)據(jù)進(jìn)行初始分類(lèi),然后逐步調(diào)整,得到最終分類(lèi)數(shù)。分類(lèi)變量和連續(xù)變量均可以參與兩步聚類(lèi)分析。(2)統(tǒng)計(jì)原理 如果選擇了n個(gè)數(shù)值型變量參與聚類(lèi)分析,最后要求聚類(lèi)數(shù)為k。由系統(tǒng)首先選擇k個(gè)觀測(cè)量(也可以是用戶(hù)指定)作為聚類(lèi)的目標(biāo),n個(gè)變量組成n維空間。每個(gè)觀測(cè)量在n維空間中是一個(gè)點(diǎn)。K個(gè)事先選定的觀測(cè)量就是k個(gè)聚類(lèi)中心,也稱(chēng)為初始類(lèi)中心。按照距這幾個(gè)類(lèi)中心的距離最小的原則把觀測(cè)量分派到各類(lèi)中心所在的類(lèi)中去;形成第一次迭代形成的k類(lèi)。 50h

35、9.3 K-均值聚類(lèi)根據(jù)組成每一類(lèi)的觀測(cè)量計(jì)算每個(gè)變量的均值,每一類(lèi)中的n個(gè)均值在n維空間中又形成k個(gè)點(diǎn),這就是第二次迭代的類(lèi)中心。按照這種方法迭代下去,直到達(dá)到指定 的迭代次數(shù)或達(dá)到中止迭代的判據(jù)要求時(shí),迭代就停止了,聚類(lèi)過(guò)程也就結(jié)束了。(3)分析步驟第1步 指定聚類(lèi)數(shù)目k;第2步 確定k個(gè)初始類(lèi)中心;第3步 根據(jù)距離最近原則進(jìn)行分類(lèi);第4步 重新確定k個(gè)類(lèi)中心;第5步 迭代計(jì)算。51h9.3 K-均值聚類(lèi)9.3.2 SPSS實(shí)例分析【例9-2】測(cè)量12名大學(xué)生對(duì)高等數(shù)學(xué)的心理狀況和學(xué)習(xí)效果,主要包括四個(gè)因素:學(xué)習(xí)動(dòng)機(jī)、學(xué)習(xí)態(tài)度、自我感覺(jué)、學(xué)習(xí)效果,具體數(shù)據(jù)如下表所示。試將該12名學(xué)生分成3

36、類(lèi)以分析不同心理狀況下學(xué)生的學(xué)習(xí)效果。編號(hào)學(xué)習(xí)動(dòng)機(jī)學(xué)習(xí)態(tài)度自我感覺(jué)學(xué)習(xí)效果140805444237735646343707558450778577547878963667708469777375710088037738298340769610874375911160577085127050699052h9.3 K-均值聚類(lèi)第1步 分析:由于已知分成3類(lèi),故可采用快速分類(lèi)法。第2步 數(shù)據(jù)組織:按如上表的表頭所示建立變量,將“編號(hào)”變量的數(shù)據(jù)類(lèi)型設(shè)為字符型(作為標(biāo)識(shí)變量)。第3步 快速聚類(lèi)設(shè)置,按“分析分類(lèi)K-均值聚類(lèi)”順序打開(kāi)“K-均值聚類(lèi)分析”對(duì)話框,將“學(xué)習(xí)動(dòng)機(jī)”、“學(xué)習(xí)態(tài)度”、“自我感覺(jué)”

37、、“學(xué)習(xí)效果”四個(gè)變量選入“變量”列表框。將“編號(hào)”變量移入“個(gè)案標(biāo)記依據(jù)”框中;將“聚類(lèi)數(shù)”設(shè)為3。其余“迭代”、“保存”和“選項(xiàng)”設(shè)置參見(jiàn)教材。53h9.3 K-均值聚類(lèi)第4步 主要結(jié)果及分析:初始聚類(lèi)中心表 Cluster123學(xué)習(xí)動(dòng)機(jī)406777學(xué)習(xí)態(tài)度807037自我感覺(jué)548457學(xué)習(xí)效果4469100迭代歷史表 由表可知,第一次迭代后,3個(gè)類(lèi)的中心點(diǎn)分別變化了8.193,9.889和13.472。一共進(jìn)行了10次迭代,達(dá)到聚類(lèi)結(jié)果的要求(達(dá)到最大迭代次數(shù)),聚類(lèi)分析結(jié)束。由于沒(méi)有指定初始聚類(lèi)中心,列出了由系統(tǒng)指定的類(lèi)中心。與原數(shù)據(jù)比較,發(fā)現(xiàn)它們分別是第1、第6和第7號(hào)個(gè)案。迭代聚

38、類(lèi)中心內(nèi)的更改12318.1939.88913.47223.9097.6314.70131.3031.526.6724.434.305.0965.145.061.0146.048.012.0027.016.002.0008.005.0003.996E-59.0029.768E-55.709E-610.0011.954E-58.155E-7a. 迭代已停止,因?yàn)橥瓿闪俗畲蟠螖?shù)的迭代。迭代無(wú)法收斂。任何中心的最大絕對(duì)坐標(biāo)更改為 .000。當(dāng)前迭代為 10。初始中心間的最小距離為 48.518。54h9.3 K-均值聚類(lèi)最終聚類(lèi)中心表如第1類(lèi)的學(xué)習(xí)動(dòng)機(jī)值為39,學(xué)習(xí)態(tài)度值為77,自我感覺(jué)值為55,學(xué)

39、習(xí)效果值為45。樣本數(shù)情況可看出第1,2,3類(lèi)中分別含有2,4,6個(gè)樣本聚類(lèi)123學(xué)習(xí)動(dòng)機(jī)395276學(xué)習(xí)態(tài)度777644自我感覺(jué)558370學(xué)習(xí)效果456791聚類(lèi)12.00024.00036.000有效12.000缺失.00055h9.3 K-均值聚類(lèi)分類(lèi)保存情況查看數(shù)據(jù)文件,可看到多出兩個(gè)變量,分別表示每個(gè)個(gè)案的具體分類(lèi)歸屬和與類(lèi)中心的距離。56h主要內(nèi)容9.1 聚類(lèi)與判別分析概述9.2 二階聚類(lèi)9.3 K-均值聚類(lèi)9.4 系統(tǒng)聚類(lèi)9.5 判別分析57h9.4 系統(tǒng)聚類(lèi)9.4.1 基本概念與統(tǒng)計(jì)原理(1)基本概念 系統(tǒng)聚類(lèi)是效果最好且經(jīng)常使用的方法之一,國(guó)內(nèi)外對(duì)它進(jìn)行了深入的研究,系統(tǒng)聚

40、類(lèi)在聚類(lèi)過(guò)程中是按一定層次進(jìn)行的。具體分成兩種,分別是Q型聚類(lèi)和R型聚類(lèi),Q型聚類(lèi)是對(duì)樣本(個(gè)案)進(jìn)行的分類(lèi),它將具有共同特點(diǎn)的個(gè)案聚集在一起,以便對(duì)不同類(lèi)的樣本進(jìn)行分析;R型聚類(lèi)是對(duì)變量進(jìn)行的聚類(lèi),它使具有共同特征的變量聚在一起,以便對(duì)不同類(lèi)的變量進(jìn)行分析。 58h9.4 系統(tǒng)聚類(lèi)9.4.1 基本概念與統(tǒng)計(jì)原理(2) 統(tǒng)計(jì)原理 系統(tǒng)聚類(lèi)是根據(jù)個(gè)案或變量之間的親疏程度,將最相似的對(duì)象聚集在一起。根據(jù)系統(tǒng)聚類(lèi)過(guò)程的不同,又分為凝聚法和分解法兩種。凝聚法的原理是將參與聚類(lèi)的每個(gè)個(gè)案(或變量)視為一類(lèi),根據(jù)兩類(lèi)之間的距離或相似性,逐步合并直到合并為一個(gè)大類(lèi)為止;分解法的原理是將所有個(gè)案(或變量)都視

41、為一類(lèi),然后根據(jù)距離和相似性逐層分解,直到參與聚類(lèi)的每個(gè)個(gè)案(或變量)自成一類(lèi)為止。 在層次聚類(lèi)中,度量數(shù)據(jù)之間的親疏程度是極為關(guān)鍵的。在衡量樣本與樣本之間的距離時(shí),一般使用的距離有Eulcidean Distance、Squared Euclidean Distance、切比雪夫距離、Block距離、明可斯基距離(Minkowshi)、夾角余弦(Cosine)等。 59h9.4 系統(tǒng)聚類(lèi)9.4.1 基本概念與統(tǒng)計(jì)原理(2) 統(tǒng)計(jì)原理 衡量樣本數(shù)據(jù)與小類(lèi)、小類(lèi)與小類(lèi)之間親疏程度的度量方法主要有以下7種:最短距離法(Nearest Neighbor) ;最短距離法(Nearest Neighbo

42、r) ;最長(zhǎng)距離法(Furthest Neighbor) ;類(lèi)間平均鏈鎖法(Between-groups Linkage); 類(lèi)內(nèi)平均鏈鎖法(Within-groups Linkage) ;重心法(Centriod Clustering) ;中間距離法(Median Clustering); 離差平方和(Wards Method)。 60h9.4 系統(tǒng)聚類(lèi)9.4.2 SPSS實(shí)現(xiàn)舉例【例9-3】已知29例兒童的血中血紅蛋白、鈣、鎂、鐵、錳、銅的含量如下表,試對(duì)數(shù)據(jù)進(jìn)行變量聚類(lèi)分析。ordercamgfemncuhemoglordercamgfemncuhemogl154.8930.86448.

43、70.0121.0113.51672.2840.12430.801.210.75272.4942.61467.30.0081.64131755.1333.02445.80.0120.91810.5353.8152.86425.610.0041.2213.751870.0836.81409.80.0121.1910.25464.7439.18469.80.0051.22141963.0535.07384.100.85310558.837.67456.550.0121.0114.252048.7530.53342.90.0180.9249.75643.6726.18395.780.0010.594

44、12.752152.2827.14326.290.0040.8179.5754.8930.86448.70.0121.0112.52252.2136.18388.540.0241.029.25886.1243.79440.130.0171.7712.252349.7125.43331.10.0120.8979960.3538.2394.40.0011.14122461.0229.27258.940.0161.198.751054.0434.23405.60.0081.311.752553.6828.79292.80.0481.328.51161.2337.354460.0221.3811.52

45、650.2229.17292.60.0061.048.251260.1733.67383.20.0010.91411.252765.3429.99312.80.0061.0381369.6940.01416.70.0121.35112856.3929.292830.0161.357.81473.8932.94312.50.0641.157.252966.1231.93344.200.6897.51547.3128.55294.70.0050.838761h9.4 系統(tǒng)聚類(lèi)第1步 分析:根據(jù)題目要求,需進(jìn)行變量聚類(lèi)分析(即R型聚類(lèi)),故采用系統(tǒng)聚類(lèi)分析中的R型聚類(lèi)進(jìn)行處理。第2步 數(shù)據(jù)組織:如上

46、表定義七個(gè)變量:“order”(編號(hào))、“ca”(鈣)、“mg”(鎂)、“fe”(鐵)、“mn”(錳)、“cu”(銅)和“hemogl”(血紅蛋白),其中“order”為字符串型,其余變量為數(shù)值型。第3步 進(jìn)行按變量聚類(lèi)的設(shè)置:按“分析分類(lèi)系統(tǒng)聚類(lèi)”打開(kāi)“系統(tǒng)聚類(lèi)分析”對(duì)話框,將“ca”(鈣)、“mg”(鎂)、“fe”(鐵)、“mn”(錳)、“cu”(銅)和“hemogl”(血紅蛋白)幾個(gè)變量選入“變量”列表框。設(shè)置按“變量”分類(lèi),并選擇輸出“統(tǒng)計(jì)量”和“圖”,以激活“統(tǒng)計(jì)量(S)”和“繪制(T)“兩個(gè)按鈕。 具體如下面圖所示。62h9.4 系統(tǒng)聚類(lèi)63h9.4 系統(tǒng)聚類(lèi)第4步 主要結(jié)果及分析

47、:凝聚順序表 第1步是第4個(gè)變量和第5個(gè)變量進(jìn)行聚類(lèi),變量間的距離系數(shù)為6.028,這個(gè)結(jié)果將在第2步中用到;第2步是經(jīng)過(guò)第1步聚類(lèi)后的變量4和變量5與變量6進(jìn)行聚類(lèi),變量間的距離系數(shù)為54.938,這個(gè)結(jié)果將在第4步中用到。以此類(lèi)推,這6個(gè)變量經(jīng)過(guò)5步聚類(lèi)最終聚成一個(gè)大類(lèi)。階群集組合系數(shù)首次出現(xiàn)階群集下一階群集 1群集 2群集 1群集 21456.02800224654.938104312144.078004414235.5303255131966.19240064h9.4 系統(tǒng)聚類(lèi)第4步 主要結(jié)果及分析:系統(tǒng)聚類(lèi)的冰柱圖圖的縱坐標(biāo)表示聚類(lèi)的數(shù)目,我們從圖的最下方看起,從5類(lèi),逐漸到4類(lèi)、3

48、類(lèi)、2類(lèi),最后聚成一個(gè)大類(lèi)。首先是“銅”和“錳”聚成一類(lèi),其余每個(gè)變量各為一類(lèi)。第2步再將“血紅蛋白”聚到“銅”和“錳”一類(lèi)中,原先的6個(gè)變量就變成了4類(lèi)。以此類(lèi)推,經(jīng)過(guò)5步聚類(lèi),最后將所有變量聚成了一個(gè)大類(lèi)。65h9.4 系統(tǒng)聚類(lèi)第4步 主要結(jié)果及分析:系統(tǒng)聚類(lèi)的樹(shù)狀圖第1步將“cu(銅)”和“mn(錳)”聚成一類(lèi),第2步將“hemogl(血紅蛋白)”聚到“cu(銅)”和“mn(錳)”類(lèi)中,第3步將“ca(鈣)”和“mg(鎂)”聚成一類(lèi)。以此類(lèi)推,最后聚成一個(gè)大類(lèi)。這與聚類(lèi)順序表和聚類(lèi)冰柱圖的分析結(jié)果是一致的。66h主要內(nèi)容9.1 聚類(lèi)與判別分析概述9.2 二階聚類(lèi)9.3 K-均值聚類(lèi)9.4

49、 系統(tǒng)聚類(lèi)9.5 判別分析67h9.5 判別分析9.5.1 基本概念與統(tǒng)計(jì)原理基本概念 判別分析(Discriminant Analysis)是多元統(tǒng)計(jì)分析中用于判別樣本所屬類(lèi)型的一種統(tǒng)計(jì)方法。它要解決的問(wèn)題是在一些已知研究對(duì)象用某種方法已分成若干類(lèi)的情況下,確定新的觀察數(shù)據(jù)屬于已知類(lèi)別中的哪一類(lèi)。判別分析是應(yīng)用很強(qiáng)的一種多元統(tǒng)計(jì)分析方法。 (2) 統(tǒng)計(jì)原理 判別分析按判別組數(shù)來(lái)分,有兩組判別分析和多組判別分析,按區(qū)分不同總體所用的數(shù)學(xué)模型來(lái)分,有線性差別和非線性判別。判別分析可以從不同的角度提出問(wèn)題,因此有不同的判別準(zhǔn)則,如費(fèi)歇爾(Fisher)準(zhǔn)則和貝葉斯(Bayes)準(zhǔn)則。 判別函數(shù)的一

50、般形式是 68h9.5 判別分析分析步驟第1步 計(jì)算特征值:計(jì)算需要用到的一些反映樣本的特征值,比如均值、協(xié)方差矩陣等。第2步 建立判別函數(shù):判別函數(shù)的一般形式如式10.1建立判別函數(shù)就是要確定這些系數(shù)。第3步 確定判別準(zhǔn)則:如費(fèi)歇爾(Fisher)準(zhǔn)則和貝葉斯(Bayes)準(zhǔn)則。第4步 檢驗(yàn)判別效果:驗(yàn)證判別函數(shù)用來(lái)進(jìn)行判別時(shí)的準(zhǔn)確度。第5步 分類(lèi):根據(jù)所建立的判別函數(shù)對(duì)待判樣本進(jìn)行分類(lèi)。69h9.5 判別分析9.5.1 SPSS實(shí)例分析【例9-4】 下表是健康人(c = 1)、硬化癥患者(c = 2)和冠心病患者(c = 3)三種人群的心電圖的5個(gè)指標(biāo)(x1x5)數(shù)據(jù),其中有19個(gè)樣本是確

51、定的分類(lèi),另又測(cè)出4個(gè)人的相關(guān)指標(biāo),試根據(jù)確定分類(lèi)的樣本對(duì)這未確定的樣本進(jìn)行分類(lèi)。 orderx1x2x3x4x5corderx1x2x3x4x5c18.11261.0113.235.467.361133.71316.1217.126.048.17229.36185.399.025.665.991145.37274.5716.754.989.67239.85249.5815.616.066.111159.89409.4219.475.1910.49242.55137.139.216.114.351165.22330.3418.194.969.61356.01231.3414.275.218.7

52、91174.71352.520.795.0711369.64231.3813.034.868.531183.36347.3117.94.6511.19374.11260.2514.725.3610.021198.27189.5912.745.466.94388.9259.5114.164.919.791207.71273.8416.015.158.79待定98.06231.0314.415.726.151217.51303.5919.145.78.53待定106.8308.915.115.528.492228.1476.697.385.3211.32待定118.68258.6914.024.797.162234.71331.47

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論