




版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、聚類(lèi)分析的SPSS實(shí)現(xiàn)課件聚類(lèi)分析的SPSS實(shí)現(xiàn)課件用SPSS作聚類(lèi)分析以經(jīng)濟(jì)效益數(shù)據(jù)為例,用聚類(lèi)分析法對(duì)各省市作分類(lèi) (見(jiàn)spssex-4/全國(guó)各省市經(jīng)濟(jì)效益數(shù)據(jù))以城鎮(zhèn)居民消費(fèi)資料為例,用聚類(lèi)分析法對(duì)各省市作分類(lèi) (見(jiàn)spssex-4/城鎮(zhèn)居民消費(fèi)支出資料) 用SPSS作聚類(lèi)分析以經(jīng)濟(jì)效益數(shù)據(jù)為例,用聚類(lèi)分析法對(duì)各省市SPSS中的聚類(lèi)分析Spss中的聚類(lèi)功能常用的有兩種:快速聚類(lèi)(迭代過(guò)程): K-Means Cluster系統(tǒng)聚類(lèi):Hierarchical ClusterSPSS中的聚類(lèi)分析Spss中的聚類(lèi)功能常用的有兩種:一、Hierarchical Cluster聚類(lèi)系統(tǒng)聚類(lèi)由兩種方
2、法:分解法和凝聚法。系統(tǒng)聚類(lèi)的功能:即可進(jìn)行樣品的聚類(lèi),也可進(jìn)行變量的聚類(lèi)。系統(tǒng)聚類(lèi)的原理:即我們前面介紹過(guò)的系統(tǒng)聚類(lèi)方法的原理和過(guò)程。一、Hierarchical Cluster聚類(lèi)系統(tǒng)聚類(lèi)由兩系統(tǒng)聚類(lèi)的中要進(jìn)行以下的選擇:數(shù)據(jù)的標(biāo)準(zhǔn)化測(cè)度方法的選擇:距離方法的選擇或相似性、關(guān)聯(lián)程度的選擇。聚類(lèi)方法的選擇:即以什么方法聚類(lèi),spss中提供了7中方法可進(jìn)行選擇。輸出圖形的選擇:樹(shù)形圖或冰柱圖。系統(tǒng)聚類(lèi)的中要進(jìn)行以下的選擇:系統(tǒng)聚類(lèi)系統(tǒng)聚類(lèi)見(jiàn)(一)聚類(lèi)方法見(jiàn)( 二)各種距離和相似系數(shù)見(jiàn)(一)聚類(lèi)方法見(jiàn)( 二)各種距離和相似系數(shù)Method聚類(lèi)方法標(biāo)準(zhǔn)化變換親疏關(guān)系指標(biāo)Method聚類(lèi)方法標(biāo)準(zhǔn)化變
3、換親疏關(guān)系指標(biāo)(一)聚類(lèi)方法1.Between-groups linkage 類(lèi)間平均法 兩類(lèi)距離為兩類(lèi)元素兩兩之間平均平方距離2.Within-groups linkage 類(lèi)內(nèi)平均法兩類(lèi)距離為合并后類(lèi)中可能元素兩兩之間平均平方距離3.Nearest neighbor 最短距離法 4. Furthest neighbor 最長(zhǎng)距離法5.Centroid clustering 重心法 (歐式距離)6.Median clustering 中間距離法 (歐式距離)7.Ward Method 離差平方法 (歐式距離)(一)聚類(lèi)方法 1.squared euclidean distance 平方歐式距
4、離2. euclidean distance 歐式距離3.cosine 夾角余弦(R型)4.pearson correlation 皮爾遜相關(guān)系數(shù)(R)5.chebychev 切比雪夫距離(二)各種距離和相似系數(shù)(親疏關(guān)系指標(biāo)) (二)各種距離和相似系數(shù)(親疏關(guān)系指標(biāo))6.block 絕對(duì)值距離7.minkowski 明考斯基8.customized 6.block 絕對(duì)值距離聚類(lèi)分析的SPSS實(shí)現(xiàn)課件Statistics聚類(lèi)進(jìn)度表相似矩陣樣品或變量的分類(lèi)情況Statistics聚類(lèi)進(jìn)度表相似矩陣樣品或變量的分類(lèi)情況聚類(lèi)分析的SPSS實(shí)現(xiàn)課件 凝聚狀態(tài)表的第一列表示聚類(lèi)分析的第幾步;第二列、第
5、三列表示本步聚類(lèi)中哪兩個(gè)樣本或小類(lèi)聚成一類(lèi);第四列是相應(yīng)的樣本距離或小類(lèi)距離;第五列、第六列表明本步聚類(lèi)中,參與聚類(lèi)的是樣本還是小類(lèi)。0表示樣本,數(shù)字n(非0)表示由第n步聚類(lèi)產(chǎn)生的小類(lèi)參與本步聚類(lèi);第七列表示本步聚類(lèi)的結(jié)果將在下面聚類(lèi)的第幾步中用到。 凝聚狀態(tài)表的第一列表示聚類(lèi)分析的第幾步聚類(lèi)分析的SPSS實(shí)現(xiàn)課件Plot樹(shù)狀結(jié)構(gòu)圖冰柱圖冰柱的方向Plot樹(shù)狀結(jié)構(gòu)圖冰柱圖冰柱的方向Number of clustersCase X7 X5 X4 X3 X6 X8 X2 X11XXXXXXXXXXXXXXX2XXXXXXXXXXXXX X3X XXXXXXXXXXX X4X XXXXX XXXX
6、X X5X XXX X XXXXX X6X X X X XXXXX X7X X X X X XXX XVertical Icicle67Number of clustersCase X5 X4 冰柱圖因其樣子非常象冬天房頂垂下的冰柱得名,它以圖形的方式顯示層次聚類(lèi)分析結(jié)果,一般從冰柱圖的最后一行開(kāi)始觀(guān)察,第一列表示類(lèi)數(shù)。兩樣品之間的“”表示將其兩邊的樣品(類(lèi))聯(lián)結(jié)起來(lái)聚成新類(lèi)。 冰柱圖因其樣子非常象冬天房頂垂下的冰柱得聚類(lèi)分析的SPSS實(shí)現(xiàn)課件應(yīng)用舉例:4-1應(yīng)用舉例:4-1 首先對(duì)表4-1中的原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化變換處理,經(jīng)過(guò)運(yùn)算使數(shù)據(jù)標(biāo)準(zhǔn)化得到表4-2,使它的每列數(shù)據(jù)的平均值為0,方差為1,
7、這樣表4-1中5列具有不同量綱、不同數(shù)量級(jí)的數(shù)據(jù)不同地區(qū)數(shù)據(jù)求出歐氏距離。就能放在一起比較;其次用表4-2中經(jīng)過(guò)標(biāo)準(zhǔn)化處理后的30個(gè) 首先對(duì)表4-1中的原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化變換處聚類(lèi)分析的SPSS實(shí)現(xiàn)課件聚類(lèi)分析的SPSS實(shí)現(xiàn)課件表4-1表4-1聚類(lèi)分析的SPSS實(shí)現(xiàn)課件表 4-2表 4-2聚類(lèi)分析的SPSS實(shí)現(xiàn)課件聚類(lèi)分析的SPSS實(shí)現(xiàn)課件K-Means Cluster聚類(lèi)K-Means Cluster聚類(lèi)K-Means Cluster原理首先,選擇n個(gè)數(shù)值型變量參與聚類(lèi)分析,最后要求的聚類(lèi)數(shù)為k個(gè);其次,由系統(tǒng)選擇k個(gè)(聚類(lèi)的類(lèi)數(shù))觀(guān)測(cè)量(也可由用戶(hù)指定)作為聚類(lèi)的種子。第三,按照距離這些類(lèi)
8、中心的距離最小的原則把所有觀(guān)測(cè)量(樣品)分派到各類(lèi)重心所在的類(lèi)中去。第四,這樣每類(lèi)中可能由若干個(gè)樣品,計(jì)算每個(gè)類(lèi)中各個(gè)變量的均值,以此作為第二次迭代的中心;第五,然后根據(jù)這個(gè)中心重復(fù)第三、第四步,直到中心的迭代標(biāo)準(zhǔn)達(dá)到要求時(shí),聚類(lèi)過(guò)程結(jié)束。K-Means Cluster原理首先,選擇n個(gè)數(shù)值型變量參K-Means Cluster聚類(lèi)過(guò)程由AnalyzeClassify K-Means Cluster將個(gè)變量放入Variable ;輸入最后聚類(lèi)的個(gè)數(shù);K-Means Cluster聚類(lèi)過(guò)程由AnalyzeC例 飲料數(shù)據(jù)(spssex/drink.sav )16種飲料的熱量、咖啡因、鈉及價(jià)格四種變
9、量 例 飲料數(shù)據(jù)(spssex/drink.sav )16種飲 快速聚類(lèi) 快速聚類(lèi)選項(xiàng)讀寫(xiě)凝聚點(diǎn)人為固定分類(lèi)數(shù)ANOVA表,初始凝聚點(diǎn)等選項(xiàng)讀寫(xiě)凝聚點(diǎn)人為固定分類(lèi)數(shù)ANOVA表,快速聚類(lèi)法的聚類(lèi)數(shù)由用戶(hù)指定,分類(lèi)是唯一的。1.分類(lèi)數(shù):如希望聚成K類(lèi)2.聚類(lèi)方法:method: iterate and clussify(聚類(lèi)分析的 clussify only(聚類(lèi)分析過(guò)程類(lèi)中心3.聚類(lèi)中心:centers4.迭代次數(shù):iterate5.保存分類(lèi)結(jié)果:save每一步都重新計(jì)算新的類(lèi)中心點(diǎn))點(diǎn)始終為初始類(lèi)中心點(diǎn),僅作一次迭代)快速聚類(lèi)法的聚類(lèi)數(shù)由用戶(hù)指定,分類(lèi)是唯一的。每一步都重新計(jì)算Initial
10、 Cluster Center:快速聚類(lèi)的初始類(lèi)中心點(diǎn)(本例由系統(tǒng)自行指定四個(gè)類(lèi)的初始類(lèi)中心點(diǎn))指定聚成四類(lèi)Initial Cluster Center:快速聚類(lèi)的初始Iteration History:快速聚類(lèi)的迭代步驟 在迭代過(guò)程中,完成第一次迭代后形成的四個(gè)新類(lèi)中心點(diǎn)距初始類(lèi)中心點(diǎn)的歐氏距離分別為5.065、12.532、12.275、25.901。第四次迭代后形成的四個(gè)新類(lèi)中心點(diǎn)幾乎與上次確定的中心點(diǎn)沒(méi)有差別。經(jīng)過(guò)四次迭代,快速聚類(lèi)完成。Iteration History:快速聚類(lèi)的迭代步驟快速聚類(lèi)的最終類(lèi)中心點(diǎn)快速聚類(lèi)的最終類(lèi)中心點(diǎn)Number of Cases in each Cl
11、uster:快速聚類(lèi)的最終結(jié)果快速聚類(lèi)的類(lèi)成員情況各樣本距其所在的類(lèi)中心的歐氏距離各類(lèi)中的成員數(shù)Number of Cases in 快速聚類(lèi)的類(lèi)成員情況各判別分析的SPSS實(shí)現(xiàn)判別分析的SPSS提供的建立判別函數(shù)的方法有:1.全模型法:把所有的變量放入判別函數(shù)中2.逐步判別法判別分析的步驟對(duì)于分為m類(lèi)的研究對(duì)象,建立m個(gè)線(xiàn)性判別函數(shù),對(duì)測(cè)試的樣本代入判別函數(shù),得出判別得分,從而確定該樣本屬于哪一類(lèi)。聚類(lèi)分析的SPSS實(shí)現(xiàn)課件Discriminant Discriminant Discriminant對(duì)話(huà)框 Discriminant對(duì)話(huà)框 Grouping Variable:已知的觀(guān)測(cè)量所屬類(lèi)
12、別的變量(分類(lèi)變量)Independents:觀(guān)測(cè)量,即參與判別分析的變量。Use Stepwise method :當(dāng)不認(rèn)為所有自變量都能對(duì)觀(guān)測(cè)量特性提供豐富的信息時(shí),使用該選擇項(xiàng)。因此根據(jù)對(duì)判別貢獻(xiàn)的大小進(jìn)行選擇。Enter independent together :當(dāng)所有自變量都能對(duì)觀(guān)測(cè)量特性提供豐富的信息時(shí),使用該選擇項(xiàng)。選擇該項(xiàng)將不加選擇地使用所有自變量進(jìn)行判別分析,建立全模型。不需要進(jìn)一步進(jìn)行選擇。 Grouping Variable:已知的觀(guān)測(cè)量所屬類(lèi)別的變選擇分類(lèi)變量及其范圍 在主對(duì)話(huà)框中左面的矩形框中選擇表明已知的觀(guān)測(cè)量所屬類(lèi)別的變量(一定是離散變量,按上面一個(gè)箭頭按鈕,使
13、該變量名移到箭頭按鈕右面,“Grouping Variable”下面的矩形框此時(shí)矩形框下面的“Define range”按鈕加亮,按該按鈕,屏幕顯示一個(gè)小對(duì)話(huà)框,供指定該分類(lèi)變量的數(shù)值范圍。定義分類(lèi)變量范圍的小對(duì)話(huà)框如下圖 所示。 在Minimum:后面的矩形框中輸入該分類(lèi)變量的最小值;在Muximurn:后面的矩形框中輸入該分類(lèi)變量的最大值。 選擇分類(lèi)變量及其范圍 在主對(duì)話(huà)框中左面的矩形框中選擇分類(lèi)變量范圍對(duì)話(huà)框 2分類(lèi)變量范圍對(duì)話(huà)框 2指定判別分析的自變量 在主對(duì)話(huà)框的左面的變量表中選擇表明觀(guān)測(cè)量特征的變量,按下面一個(gè)箭頭按鈕,把選中的變量移到“Independents:”下面的矩形框中,
14、作為參與判別分析的變量。指定判別分析的自變量 Indepents對(duì)話(huà)框數(shù)據(jù)變量輸入框 Indepents對(duì)話(huà)框數(shù)據(jù)變量輸入框數(shù)據(jù)判別分析 完成前面四步驟的操作即可使用各種系統(tǒng)默認(rèn)值對(duì)工作數(shù)據(jù)集的數(shù)據(jù)進(jìn)行判別分析了。可以使用的方法有兩種: (1)直接運(yùn)行:在主對(duì)話(huà)框中按(用鼠標(biāo)單擊)Ok按鈕 (2)生成SPSS命令程序后再運(yùn)行:在主對(duì)話(huà)框中按Paste按鈕,激活Syntax窗,在該窗中按Run按鈕執(zhí)行該語(yǔ)句窗中的程序。 無(wú)論哪種方法均可在output窗中顯示出分析結(jié)果。 完全使用系統(tǒng)默認(rèn)值進(jìn)行判別分析,其結(jié)果有時(shí)不能令人滿(mǎn)意,因此根據(jù)以下步驟指定選擇項(xiàng)是很有必要的。 數(shù)據(jù)判別分析選擇觀(guān)測(cè)量 如果
15、希望使用一部分觀(guān)測(cè)量進(jìn)行判別函數(shù)的推導(dǎo),而且有一個(gè)變量的某個(gè)值可以作為某些觀(guān)測(cè)量的標(biāo)識(shí),則用Select功能進(jìn)行選擇。操作方法是,單擊“Select”按鈕展開(kāi)小選擇框,在“Vaiable:”后面矩形框中輸入該變量的變量名,在“Value:”后面輸入標(biāo)識(shí)參與分析的觀(guān)測(cè)量所具有的該變量值。一般均使用數(shù)據(jù)文件中的所有合法觀(guān)測(cè)量。此步驟可以省略。 選擇觀(guān)測(cè)量Select功能選擇Select功能選擇選擇分析方法 在主對(duì)話(huà)框中自變量矩形框下面有兩個(gè)選擇項(xiàng),被選中的方法前面的圓圈中加有黑點(diǎn)。這兩個(gè)選擇項(xiàng)是選擇判別分析方法的。(1)Enter independent together 當(dāng)你認(rèn)為所有自變量都能對(duì)
16、觀(guān)測(cè)量特性提供豐富的信息時(shí),使用該選擇項(xiàng)。選擇該項(xiàng)將不加選擇地使用所有自變量進(jìn)行判別分析,建立全模型。不需要進(jìn)一步進(jìn)行選擇。 選擇分析方法(2)Use Stepwise method 當(dāng)你不認(rèn)為所有自變量都能對(duì)觀(guān)測(cè)量特性提供豐富的信息時(shí),使用該選擇項(xiàng)。因此根據(jù)對(duì)判別貢獻(xiàn)的大小進(jìn)行選擇。當(dāng)鼠標(biāo)單擊該項(xiàng)時(shí),Method按鈕加亮。可以進(jìn)一步判別分析方法。 單擊“Method”按鈕,展開(kāi)“Stepwise method”對(duì)話(huà)框(子對(duì)話(huà)框)如下圖所示。 (2)Use Stepwise method Stepwise method對(duì)話(huà)框 Stepwise method對(duì)話(huà)框 選擇進(jìn)行逐步判別分析的方法 選
17、擇判別分析方法在Method組的矩形框中進(jìn)行。可供選擇的判別分析方法有: Wilkslambda 使Wilk的統(tǒng)計(jì)量最小化法。Unexplained variance 使各類(lèi)不可解釋的方差和最小化法。Mahalanobisdistance 使最近兩類(lèi)間的 Mahalanobis距離最大化法。 選擇進(jìn)行逐步判別分析的方法 Smallest F ratio。使任何兩類(lèi)間的最小的F值最大化法。 Rao V 使 RaoV統(tǒng)計(jì)量最大化??梢詫?duì)一個(gè)要加入到模型中的變量的V值指定一個(gè)最小增量。選擇此種方法后,應(yīng)該在該項(xiàng)下面的V to dntce后的矩形框中輸這個(gè)增量的指定值。 Smallest F rati
18、o。使任何兩類(lèi)間的最小的 選擇逐步判別停止的判據(jù) 選擇逐步判別停止的判據(jù)在criteria組的矩形框中進(jìn)行??晒┻x擇的判據(jù)有: Use F value:使用F值,是系統(tǒng)默認(rèn)的判據(jù),默認(rèn)值是:Entry:3.84;removal:2.71。即當(dāng)被加入的變量F值=3.84時(shí)才把該變量加入到模型中,否則變量不能進(jìn)入模型;或者,當(dāng)要從模型中移出的變量F值=2.71時(shí),該變量才被移出模型,否則模型中的變量不會(huì)被移出。應(yīng)該使Entry值(加入變量的F值)removal值(移出變量的F值) 選擇逐步判別停止的判據(jù)Use probability of F:使用F值的概率。加入變量的F值概率的默認(rèn)值是0.05(
19、5);移出變量的q值概率是0.10(10)。removal值(移出變量的正值概率)Entry值(加入變量的F值概率)。 Use probability of F:使用F值的概率。加顯示內(nèi)容的選擇 對(duì)于逐步選擇變量的過(guò)程和最后結(jié)果的顯示可以通過(guò)Method對(duì)話(huà)框最下面的Display矩形框中的三項(xiàng)進(jìn)行選擇: Resul at each step要求在逐步選擇變量過(guò)程中的每一步之后顯示每個(gè)變量的統(tǒng)計(jì)量。 Summary僅要求顯示加入或移出模型的變量的綜計(jì)量。即選擇變量的小結(jié)。 F for Pairwise distances要求顯示兩兩類(lèi)之間的兩兩 F值矩陣。 當(dāng)以上三項(xiàng)都給予了確定的選擇后,單擊
20、continue按鈕,返回主對(duì)話(huà)框。 顯示內(nèi)容的選擇指定輸出的統(tǒng)計(jì)量單擊“statistics”按鈕,展開(kāi)相應(yīng)的子對(duì)話(huà)框,如下圖所示??梢赃x擇的輸出統(tǒng)計(jì)量分為以下三類(lèi):(1)描述統(tǒng)計(jì)量 在Descriptives組的矩形框中可以選擇對(duì)原始數(shù)據(jù)的描述統(tǒng)計(jì)量的輸出: Means選擇此項(xiàng)可以輸出各類(lèi)中各自變量的均值MEAN、標(biāo)準(zhǔn)差Std Dev和各自變量總樣本的均值和標(biāo)準(zhǔn)差。 Univariate ANOVA對(duì)各類(lèi)中同一自變量均值都相等的假設(shè)進(jìn)行檢驗(yàn),輸出單變量的方差分析結(jié)果。 Boxs M對(duì)每類(lèi)的協(xié)方差矩陣是從同一總體中采樣得來(lái)的假設(shè)進(jìn)行檢驗(yàn),輸出檢驗(yàn)結(jié)果。 指定輸出的統(tǒng)計(jì)量StatisticsS
21、tatistics(2)判別函數(shù)系數(shù) 在Fuction coefficients組的矩形框中選擇判別函數(shù)系數(shù)的輸出形式: Fishers可以直接用于對(duì)新樣本進(jìn)行判別分類(lèi)的費(fèi)雪系數(shù)。 Unstandardized未經(jīng)標(biāo)準(zhǔn)化處理的判別系數(shù)??捎糜谟?jì)算判別分?jǐn)?shù)。 (2)判別函數(shù)系數(shù)(3)自變量的系數(shù)矩陣 在Matrices組的矩形框中選擇要求給出的矩陣: within-groups correlation matrix類(lèi)內(nèi)相關(guān)矩陣 within-groups covariance matrix類(lèi)內(nèi)協(xié)方差矩陣 Separate-groups covariance matrices對(duì)每類(lèi)輸出一個(gè)類(lèi)間協(xié)方
22、差矩陣 Total covariance matrix總樣本的協(xié)方差矩陣 以上三項(xiàng)都給予了確定的選擇后,單擊continue按鈕,返回主對(duì)話(huà)框。 (3)自變量的系數(shù)矩陣指定分類(lèi)參數(shù)和判別結(jié)果 在主對(duì)話(huà)框中單擊“classify”按鈕,展開(kāi)相應(yīng)的子對(duì)話(huà)框,如下圖所示。 (1)在Prior Probabilities組的矩形框中選擇先驗(yàn)概率,兩者選其一。 All groups equal各類(lèi)先驗(yàn)概率相等。若分為m類(lèi),則各類(lèi)先驗(yàn)概率均為1m。 computer from group sizes由各類(lèi)的樣本量計(jì)算決定在各類(lèi)的先驗(yàn)概率與其樣本比。 指定分類(lèi)參數(shù)和判別結(jié)果 Classifiction對(duì)話(huà)框
23、 Classifiction對(duì)話(huà)框(2)選擇分類(lèi)使用的協(xié)方差矩陣 在Use covariance Matrix組的矩形框中選擇分析使用的協(xié)方差矩陣。兩者選其一。 Within-groups指定使用組內(nèi)協(xié)方差矩陣。 Seperate-groups指定使用組間協(xié)方差矩陣。(2)選擇分類(lèi)使用的協(xié)方差矩陣 (3)選擇要求輸出的統(tǒng)計(jì)圖 在Plots組的矩形框中選擇,可以并列選擇。 combined-groups 所有類(lèi)放在一張散點(diǎn)圖中。便于比較。此選擇項(xiàng)生成一張散點(diǎn)圖。 Seperate-groups對(duì)每一類(lèi)生成一張散點(diǎn)圖。共分為幾類(lèi)就生成幾張散點(diǎn)圖。 Territoreal map 如果對(duì)一個(gè)觀(guān)測(cè)量只
24、能計(jì)算出一個(gè)判別分?jǐn)?shù),則利用觀(guān)測(cè)量的判別做作圖,如果有兩個(gè)以上判別分?jǐn)?shù),則用頭兩個(gè)判別分?jǐn)?shù)作圖。此種統(tǒng)計(jì)圖力圖把一張圖的平面劃分出與類(lèi)數(shù)相同的區(qū)域。每一類(lèi)占據(jù)一個(gè)區(qū)。 (3)選擇要求輸出的統(tǒng)計(jì)圖(4)選擇生成到輸出窗中的分類(lèi)結(jié)果 在 Displsy組的矩形框中選擇輸出項(xiàng): Results for each case要求輸出每個(gè)觀(guān)測(cè)量的分類(lèi)結(jié)果。 Summary table要求輸出分類(lèi)的小結(jié),給出錯(cuò)分率。(4)選擇生成到輸出窗中的分類(lèi)結(jié)果 在 Displsy組的矩(5)缺失值處理方式 在classification子對(duì)話(huà)框的最下面有一個(gè)選擇項(xiàng),用以選擇對(duì)缺失值的處理方法。 Replace mis
25、sing value with mean用該變量的均值代替缺失值。該選擇項(xiàng)前面的小矩形框中出現(xiàn)x時(shí)表示選定所示的處理方法。 以上五項(xiàng)都給予了確定的選擇后,單擊continue按鈕,返回主對(duì)話(huà)框。 (5)缺失值處理方式 指定生成并保存在數(shù)據(jù)文件中的新變量 Descriminant過(guò)程可以在數(shù)據(jù)文件中建立新變量,通過(guò)Save New Vaiables子對(duì)話(huà)框進(jìn)行選擇。 在主對(duì)話(huà)框中單擊“Save”按鈕,展開(kāi)“Save New Vaiables”子對(duì)話(huà)框。如下圖所示。 指定生成并保存在數(shù)據(jù)文件中的新變量 Save對(duì)話(huà)框 Save對(duì)話(huà)框 在工作數(shù)據(jù)文件中建立以下三個(gè)新變量,可以選擇。 Predicte
26、d group membership要求建立一個(gè)新變量,表明預(yù)測(cè)的類(lèi)成員。指定此項(xiàng)后,每行一次Descriminant過(guò)程,就建立一個(gè)表明使用判別函數(shù)預(yù)測(cè)的各觀(guān)測(cè)量屬于哪一類(lèi)的新變量。第一次運(yùn)行建立新變量的變量名為dis-1,如果在工作數(shù)據(jù)文件中不把前一次建立的新變刪除,第n次運(yùn)行Descriminant過(guò)程建立的新變量默認(rèn)的變量名為dis-n。 在工作數(shù)據(jù)文件中建立以下三個(gè)新變量,可以選擇。 Descriminant score要求建立表明判別分?jǐn)?shù)的新變量。每次運(yùn)行 Descriminant過(guò)程都給出組表明判別分?jǐn)?shù)的新變量。建立幾個(gè)典則判別函數(shù)就有幾個(gè)判別分?jǐn)?shù)變量。參與分析的觀(guān)測(cè)量共分為m類(lèi)
27、,則建立ml個(gè)典則判別函數(shù),指定該選擇項(xiàng),就可以生成ml個(gè)表明判別數(shù)的新變量。例如,原始數(shù)據(jù)觀(guān)測(cè)量共分為3類(lèi),建立兩個(gè)典則判別函數(shù)。第一次運(yùn)行判別過(guò)程建立的新變量名為dis1_1,dis2_1,第二次運(yùn)行判別過(guò)程建立的新變量名為dis1_2,dis2_2依此類(lèi)推。分別表示代入第一和第二個(gè)判別函數(shù)所得到的判別分?jǐn)?shù)。 Descriminant score要求建立表 Probabilities of group membership要求建立新變量表明觀(guān)測(cè)量屬于某一類(lèi)的概率。有m類(lèi),對(duì)一個(gè)觀(guān)測(cè)量就會(huì)給出m個(gè)概率值,因此建立m個(gè)新變量。例如,原始和預(yù)測(cè)分類(lèi)數(shù)是:指定該選擇項(xiàng),在第一次運(yùn)行判別過(guò)程后,給出
28、的表明分類(lèi)概率的新變量名為dis1_2,dis2_2,dis3_2. 選擇了新變量類(lèi)型后,按continue Probabilities of group memb運(yùn)行帶有選擇項(xiàng)的判別分析過(guò)程 運(yùn)行Descriminant過(guò)程有兩種方法: (1)在主對(duì)話(huà)框中按Ok按鈕,直接運(yùn)行Descriminant過(guò)程。 (2)在主對(duì)話(huà)框中按Paste按鈕,將以上操作結(jié)果轉(zhuǎn)換成Descriminant過(guò)程的命令程序,顯示在Syntax窗中。 在Syntax窗中可以按照Descriminant命令語(yǔ)句格式進(jìn)一步修改粘貼則窗中的各子命令語(yǔ)句。然后按Run按鈕,將窗中的程序語(yǔ)句提交給系統(tǒng)執(zhí)行。 運(yùn)行帶有選擇項(xiàng)的判
29、別分析過(guò)程逐步判別分析 (1)逐步判別分析方法與判據(jù)的選擇 逐步判別在操作步驟方面只有在選擇方法一點(diǎn)上與前面所敘述的方法有所區(qū)別,即在Discriminant過(guò)程主對(duì)話(huà)框中應(yīng)該選擇Use stepwise method。當(dāng)單擊該選擇項(xiàng)時(shí),其前面的圓圈中出現(xiàn)黑點(diǎn),同時(shí)Method按鈕加亮表示可以進(jìn)一步選擇分析方法或判據(jù)了。 逐步判別分析 單擊Method按鈕,展開(kāi)stepwise method對(duì)話(huà)框。在對(duì)話(huà)框中顯示出系統(tǒng)默認(rèn)的逐步區(qū)別方法是Milks Lambra。其判據(jù)是:進(jìn)入模型的F值為3.84;從模型中剔除變量的F值為2.71。不熟悉統(tǒng)計(jì)分析的用戶(hù)可以不再進(jìn)一步選擇,直接使用系統(tǒng)默認(rèn)的分析
30、方法和判據(jù). 單擊Method按鈕,展開(kāi)stepwise 逐步判別方法的選擇Milks Lambra使Milks統(tǒng)計(jì)量最小。是系統(tǒng)默認(rèn)的方法。Unexplained variance使各類(lèi)不可解釋的方差和最小。Mahalanobis distance使最近的兩組間的馬哈拉諾比斯距離最小。smallest F ratio。使任何兩組間的最小的 F值最大。 Raos V使 Rao的 V統(tǒng)計(jì)量最大。在選擇并指定使用此種方法后,該項(xiàng)下面的文字加亮,可以在V to enter毫米的矩形框中輸入一個(gè)變量進(jìn)入模型的 V值的最小增量。 逐步判別方法的選擇關(guān)于判據(jù)的選擇方法 可以從兩者指定判據(jù)的方法中選擇一種,
31、并在每種方法的兩個(gè)矩形框中輸入判據(jù)的具體數(shù)值。 Use F value用F值作判據(jù)。在該項(xiàng)下面的兩個(gè)矩形框中輸人: Entry:后面的矩形框中輸入進(jìn)入模型的F值。只有變量的F值大于這個(gè)指定值時(shí),變量進(jìn)入模型。 Remove:在后面的矩形框中輸入把變量移出模型的F值。當(dāng)變量的F值小于該值時(shí),變量從模型中剔除。 應(yīng)該注意,Entry值必須大于Remove值,否則,模型中將不會(huì)有變量。 關(guān)于判據(jù)的選擇方法顯示內(nèi)容的選擇 在Stepwise Method對(duì)話(huà)框的最下面一行可以選擇要求顯示在輸出窗中的內(nèi)容。對(duì)于逐測(cè)分析可以選擇以下輸出: Results at each step給出每一步選擇變量工作完成
32、后各變量的統(tǒng)計(jì)量。給出哪些統(tǒng)計(jì)量要看使用什么判據(jù)。使用F值作判據(jù)則給出各變量的F值;使用F值的概率作判據(jù)則給出量的F值的概率。 Summery僅對(duì)被加入或移出模型的變量給出統(tǒng)計(jì)量。 F for pairwise distances顯示 F比值矩陣。對(duì)每?jī)深?lèi)顯示一對(duì)F比值。 顯示內(nèi)容的選擇 (2)逐步判別分析操作步驟 我們采用Milks Lambra方法進(jìn)行逐步判別分析。使用F值作為判據(jù)統(tǒng)計(jì)量。當(dāng)F=30時(shí)變量進(jìn)入模型;當(dāng)F=5時(shí),變量從模型中移出。 (2)逐步判別分析操作步驟操作步驟如下: 第一、從主菜單的Statistics,經(jīng)classify到Discriminant Analysis逐一選擇各菜單的菜單直到展開(kāi)Discriminant Analysis對(duì)話(huà)框。 第二、Independents:slen、swidPlen、Pwid;Group variables:spno(1,3)選擇變量slen、swidPlen、Pwid作為判別分析的自變量;spno作為分類(lèi)變量。 操作步驟如下: 第三、按Method按鈕,展
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- XX國(guó)家濕地公園管委會(huì)合同管理制度
- 2025年室外環(huán)境清潔電器項(xiàng)目合作計(jì)劃書(shū)
- 2025年貿(mào)易經(jīng)紀(jì)與代理服務(wù)項(xiàng)目發(fā)展計(jì)劃
- 黃大年事跡在心理健康教育中的借鑒心得體會(huì)
- 品牌文化對(duì)消費(fèi)者購(gòu)買(mǎi)行為的影響-全面剖析
- 護(hù)理服務(wù)效率優(yōu)化策略-全面剖析
- 羽毛球俱樂(lè)部團(tuán)隊(duì)建設(shè)計(jì)劃
- 2025秋部編版二年級(jí)道德與法治多元文化計(jì)劃
- 2025年公共關(guān)系專(zhuān)員工作總結(jié)與工作計(jì)劃
- 大殿建筑規(guī)劃方案范本
- 供應(yīng)鏈管理環(huán)境下包鋼采購(gòu)物流優(yōu)化問(wèn)題的研究與應(yīng)用共3篇
- 我和我的祖國(guó)-電影賞析
- XK3201(F701L)稱(chēng)重控制儀使用說(shuō)明書(shū)
- 數(shù)據(jù)中心機(jī)電安裝施工方案附圖豐富
- 函數(shù)y=Asin(ωx+φ)(第一課時(shí)) 教學(xué)設(shè)計(jì)
- 《長(zhǎng)津湖》電影賞析PPT
- GB/T 1000-2016高壓線(xiàn)路針式瓷絕緣子尺寸與特性
- 商業(yè)街定位借鑒案例-俄羅斯阿爾巴特街
- GB 4962-2008氫氣使用安全技術(shù)規(guī)程
- 王盡美事跡學(xué)習(xí)PPT王盡美生平介紹PPT課件(帶內(nèi)容)
- 上交所股票期權(quán)適當(dāng)性考試題庫(kù)(附答案)
評(píng)論
0/150
提交評(píng)論