多元統(tǒng)計分析思考題答案

上傳人：d*** IP屬地：天津上傳時間：2022-03-12 格式：DOCX 頁數：8 大?。?3.04KB 積分：15 舉報 版權申訴

已閱讀5頁，還剩3頁未讀，繼續(xù)免費閱讀

版權說明：本文檔由用戶提供并上傳，收益歸屬內容提供方，若內容存在侵權，請進行舉報或認領

文檔簡介

1、多元統(tǒng)計分析思考題答案如下九道題題目中有錯誤的或不清楚記得老師課堂上說過考試內容不會超出這九道思考題,的地方，歡迎大家指出、更改、補充。1、簡述信度分析答題提示：要答可靠度概念，可靠度度量，克朗巴哈系數、拆半系數、單項與總體相關系數、稀釋相關系數等（至少要答四個系數，至少要給出兩個指標的公式）答：信度（Reliability）即可靠性，它是指采用同樣的方法對同一對象重復測量時所得結果的一致性程度。信度指標多以相關系數表示，大致可分為三類：穩(wěn)定系數（跨時間的一致性）等值系數（跨形式的一致性）和內在一致性系數（跨項目的一致性）。信度分析的方法主要有以下四種：1）、重測信度法這一方法是用同樣的問卷對

2、同一組被調查者間隔一定時間重復施測，計算兩次施測結果的相關系數。重測信度屬于穩(wěn)定系數。重測信度法特別適用于事實式問卷，如果沒有突發(fā)事件導致被調查者的態(tài)度、意見突變，這種方法也適用于態(tài)度、意見式問卷。由于重測信度法需要對同一樣本試測兩次，被調查者容易受到各種事件、活動和他人的影響，而且間隔時間長短也有一定限制，因此在實施中有一定困難。2）、復本信度法復本信度法是讓同一組被調查者一次填答兩份問卷復本，計算兩個復本的相關系數。復本信度屬于等值系數。復本信度法要求兩個復本除表述方式不同外，在內容、格式、難度和對應題項的提問方向等方面要完全一致，而在實際調查中，很難使調查問卷達到這種要求，因此采用這種方

3、法者較少。3）、折半信度法折半信度法是將調查項目分為兩半，計算兩半得分的相關系數，進而估計整個量表的信度。折半信度屬于內在一致性系數，測量的是兩半題項得分間的一致性。這種方法一般不適用于事實式問卷（如年齡與性別無法相比），常用于態(tài)度、意見式問卷的信度分析。在問卷調查中，態(tài)度測量最常見的形式是5級李克特（Likert）量表。進行折半信度分析時，如果量表中含有反意題項，應先將反意題項的得分作逆向處理，以保證各題項得分方向的一致性，然后將全部題項按奇偶或前后分為盡可能相等的兩半，計算二者的相關系數。為了校正差異，兩半測驗的方差相等時，常運用斯皮爾曼-布朗公式（Spearman-BrownFormul

4、a）:rxx=2rhh/（1+rhh）,其中，rhh：兩半測驗的相關系數；rxx:估計或修正后的信度。該公式可以估計增長或縮短一個測驗對其信度系數的影響。當兩半測驗的方差不同時，應采用盧倫公式（RulonFormula）或弗拉納根公式（FlanaganFormula）進行修正。4）、“信度系數法Cronbach”信度系數是目前最常用的信度系數，其公式為:nVSi21SXS2一，、，S、，2.,、，其中，Si為每一項目的方差；SX為測驗總分方差。從公式中可以看出，a系數評價的是量表中各題項得分間的一致性，屬于內在一致性系數。這種方法適用于態(tài)度、意見式問卷（量表）的信度分析。2、簡述多元尺度分析在

5、你工作中的應用答：多元尺度分析（Multi-dimensionAnalysis）是市場研究的一種有力手段，是市場調查、分析數據的統(tǒng)計方法之一。它可以通過低維空間（通常是二維空間）展示多個研究對象（比如品牌）之間的聯(lián)系，利用平面距離來反映研究對象之間的相似程度。由于多維尺度分析法通常是基于研究對象之間的相似性（距離）的，只要獲得了兩個研究對象之間的距離矩陣，我們就可以通過相應統(tǒng)計軟件做出他們的相似性知覺圖。在實際應用中，距離矩陣的獲得主要有兩種方法：一種是采用直接的相似性評價，先對所有評價對象進行兩兩組合，然后要求被訪者對所有的這些組合間進行直接相似性評價，這種方法我們稱之為直接評價法；另一種為

6、間接評價法，由研究人員根據事先經驗，找出影響人們評價研究對象相似性的主要屬性，然后對每個研究對象，讓被訪者對這些屬性進行逐一評價，最后將所有屬性作為多維空間的坐標，通過距離變換計算對象之間的距離。多維尺度分析的主要思路是利用對被訪者對研究對象的分組，來反映被訪者對研究對象相似性的感知，這種方法具有一定直觀合理性。在工作中，通過多維尺度分析，可以將消費者對商品相似性的判斷產生一張能夠看出這些商品間相關性的圖形。例如：有十個百貨商場，讓消費者排列出對這些百貨商場兩兩間相似的感知程度，根據這些數據，用多維尺度分析，可以判斷消費者認為哪些商場是相似的，從而可以判斷競爭對手。用于反映多個研究事物間相似（

7、不相似）程度，通過適當的降維方法，將這種相似（不相似）程度在低維度空間中用點與點之間的距離表示出來，并有可能幫助識別那些影響事物間相似性的潛在因素。這種方法在市場研究中應用得非常廣泛。3、簡述兩個變量之間的相關分析答題提示：答什么是相關，對連續(xù)型變量用相關系數，對離散型變量用質相關系數答：相關分析（correlationanalysis）,研究隨機變量之間的相關關系的一種統(tǒng)計方法。相關關系是一種非確定性的關系。相關性探討的是兩變量間相關情況的的大致趨勢。相關分析涉及兩個變量：應變量和自變量。應變量（responsevariable）是度量研究結果的變量；自變量是解釋或影響反應變量的變量。兩變量

8、數據相關檢驗的步驟：一、圖示兩變量數據以及各個統(tǒng)計數字；二、查看整體狀態(tài)及數據的離散情況；三、如果有較穩(wěn)定的關系，就用簡單的數學模式描述該關系。對連續(xù)型變量常用相關系數刻畫兩個變量之間的相關性，而對離散型變量則用質相關系數。4、聚類和判別分析的異同答：聚類分析是把研究目標分割成為具有相同屬性的小的群體。對變量的聚類稱為R型聚類,而對觀測值聚類稱為Q型聚類。它們在數學上是無區(qū)別的。聚類的基本想法：根據某種距離，把最近的聚在一起。這里的距離含義很廣，如歐氏距離、馬氏距離等距離，相似系數也可看作為距離。判別分析的基本思路是：設有G1、G2、，GK個總體，從不同的總體中抽出不同的樣本,當然，根據不同的

9、方法，建立的Fisher判別、Bayes判別。根據樣本一建立判別法則一判別新的樣品屬于哪一個總體。判別法則也是不同的。常用的判別方法有：距離判別、判別分析和聚類分析都是分類。其主要不同點就是，在聚類分析中一般人們事先并不知道或一定要明確應該分成幾類，完全根據數據來確定。而在判別分析中，至少有一個已經明確知道類別的“訓練樣本”，利用這個數據，就可以建立判別準則，并通過預測變量來為未知類別的觀測值進行判別了?？梢韵染垲愐缘弥愋?，再進行判別.5、因子分析和主成分分析的異同答：主成分分析和因子分析是多元統(tǒng)計方法中關系密切的兩種方法，應用范圍十分廣泛，可以解決經濟、教育、科技、社會等領域中的綜合評價問

10、題。主成分分析采用降維的思想，將研究對象的多個相關變量（指標）綜合為少數幾個不相關的變量，反映原變量提供的主要信息。因子分析是主成分分析的推廣和發(fā)展，它將具有錯綜復雜關系的變量綜合為數量較少的幾個因子，以再現原始變量與因子之間的相互關系，同時根據不同因子還可以對變量進行分類，它屬于多元分析中處理降維的一種統(tǒng)計方法。但是，在許多論文中用SPSS進行綜合分析時，出現這兩種方法運用混淆的錯誤。比如，主成分分析中對變量進行了因子旋轉，因子分析的公因子系數錯誤等問題。本文就此對主成分分析和因子分析的異同進行比較，并在SPSSDPSa件上如何實現給予說明。一、主成分分析與因子分析的異同點兩者的相同點：1、

11、思想一致：都是降維的思想；2、應用范圍一致：都要求變量之間具有不完全的相關性；3、數據處理過程一致：數據的無量綱化，求相關系數矩陣的特征值和特征向量，通過累計貢獻率確定主成分個數、因子個數；4、合成方法一致：都沒有考慮原始變量之間的關系，直接用線性關系處理變量與主成分和因子之間的關系。兩者的不同點：1、方差損失上：主成分解釋了原始變量的全部方差，無方差損失；因子模型中除了有公因子外還有特殊因子，公因子只解釋了部分信息，有方差損失；2、唯一性：主成分分析不存在因子旋轉，主成分是唯一的；因子分析進行因子旋轉，解不唯一；3、實際意義：主成分沒有實際意義；公因子有實際意義；4、應用：主成分側重信息貢獻

12、、影響力綜合評價；因子分析側重成因清晰性的綜合評價。1 .因子分析中是把變量表示成各因子的線性組合,變量的線性組合。2 .主成分分析的重點在于解釋個變量的總方差，協(xié)方差。3 .主成分分析中不需要有假設（assumptions）,包括：各個共同因子之間不相關，特殊因子（和特殊因子之間也不相關。而主成分分析中則是把主成分表示成幾個而因子分析則把重點放在解釋各變量之間的因子分析則需要一些假設。因子分析的假設specificfactor）之間也不相關，共同因子4.主成分分析中，當給定的協(xié)方差矩陣或者相關矩陣的特征值是唯一的時候，的主成分一般是獨特的；而因子分析中因子不是獨特的，可以旋轉得到不到的因子。

13、5.在因子分析中，因子個數需要分析者指定（spss根據一定的條件自動設定，只要是特征值大于1的因子進入分析），而指定的因子數量不同而結果不同。在主成分分析中，成分的數量是一定的，一般有幾個變量就有幾個主成分。和主成分分析相比，由于因子分析可以使用旋轉技術幫助解釋因子，在解釋方面更加有優(yōu)勢。大致說來，當需要尋找潛在的因子，并對這些因子進行解釋的時候，更加傾向于使用因子分析，并且借助旋轉技術幫助更好解釋。而如果想把現有的變量變成少數幾個新的變量（新的變量幾乎帶有原來所有變量的信息）來進入后續(xù)的分析，則可以使用主成分分析。當然，這中情況也可以使用因子得分做到。所以這中區(qū)分不是絕對的?？偟脕碚f，主成分

14、分析主要是作為一種探索性的技術，在分析者進行多元數據分析之前，用主成分分析來分析數據，讓自己對數據有一個大致的了解是非常重要的。主成分分析一般很少單獨使用：a,了解數據。（screeningthedata）,b,和clusteranalysis一起使用，c,和判別分析一起使用，比如當變量很多，個案數不多，直接使用判別分析可能無解，這時候可以使用主成份發(fā)對變量簡化。（reducedimensionality）d,在多元回歸中，主成分分析可以幫助判斷是否存在共線性（條件指數），還可以用來處理共線性。在算法上，主成分分析和因子分析很類似，不過，在因子分析中所采用的協(xié)方差矩陣的對角元素不在是變量的方差

15、，而是和變量對應的共同度（變量方差中被各因子所解釋的部分。）。6、系統(tǒng)聚類與K-means聚類的基本原理答：系統(tǒng)聚類法基本原理和步驟為：1、先計算n個樣本兩兩間的距離2、構造n個類，每個類只包含一個樣本3、合并距離最近的兩類為一新類4、計算新類與當前各類的距離5、類的個數是否等于1,如果不等于回到3在做6、畫出聚類圖7、決定分類個數和類K-means聚類的基本原理：聚類可以走著瞧，不一定事先確定有多少類；但是K-means聚類卻要求先說好要分多少類?？雌饋碛行┲饔^。假定分3類，這個方法還進一步要求你事先確定3個點為“聚類種子”（多數軟件會自動選種子）；也就是說，把這3個點作為三類中每一類的基石

16、。然后根據和這三個點的距離遠近，把所有點分成三類。再把這三類的中心（均值）作為新的基石或種子（原來“種子”就沒用了），再重新按照距離分類。如此疊代下去，直到達到停止疊代的要求（比如，各類最后變化不大了，或者疊代次數太多了）。顯然，前面的聚類種子的選擇并不必太認真，它們很可能最后還會分到同一類中呢。7、Fisher判別和貝葉斯判別的基本原理答：Fisher判別法是一種先投影的方法。使多維問題簡化為一維問題來處理。選擇一個適當的投影軸，使所有的樣品點都投影到這個軸上得到一個投影值。對這個投影軸的方向的要求是：使每一類內的投影值所形成的類內離差盡可能小，而不同類間的投影值所形成的類間離差盡可能大。進

17、行投影后，再根據距離判別思想由距離的遠近得到判別準則，從而進行判別分析。貝葉斯（BAYES判別思想是根據先驗概率求出后驗概率，并依據后驗概率分布作出統(tǒng)計推斷。所謂先驗概率，就是用概率來描述人們事先對所研究的對象的認識的程度；所謂后驗概率，就是根據具體資料、先驗概率、特定的判別規(guī)則所計算出來的概率。它是對先驗概率修正后的結果。8、舉例說明你在工作中如何應用主成分分析和因子分析（因主成分分析有什么什么缺點，可用因子分析什么什么旋轉,）答：主成分分析：將多個變量通過線性變換以選出較少個數重要變量的一種多元統(tǒng)計分析方法。在分析問題的時候，往往提出很多有關的變量來描述一個事物，在宏觀經濟研究領域中，表述

18、國家基本經濟面貌的時有很多指標，如人口、國土面積、公路里程、GDP財政收入等等。在對人的描述的時候，有身高、體重、學歷、年齡、工作等多項可直接測量的指標。眾多的指標中，有很多是相互關聯(lián)的，不能清晰的反應數據問題，人們希望能將這些指標進行高度概括，用有限的指標精煉的概括，清晰地反應數據全貌。將原有變量重新組合成幾個相互無關的新變量，同時根據實際從中選出較少的變量盡可能多地反映原有變量統(tǒng)計信息，在數學上也叫做降維處理。當我們展開區(qū)域競爭力研究的時候，可以利用主成分分析法。首先要根據區(qū)域競爭力選擇適合的指標體系，以綜合競爭力開展的研究的指標體系如：國內生產總值（GDP、第三產業(yè)比重、工業(yè)占第二產業(yè)比

19、重、郵電業(yè)務總量、用電量、全社會固定資產投資、外商直接投資、科學研究等。取得31個?。ㄊ小⒆灾螀^(qū)）的數據。對原始指標數據白標準化采集p維隨機向量x=（X1,X2,.,Xp）T）,31個樣品xi=（xi1,xi2,.,xip）T,i=1,2,31,由于指標間量綱不同，將數據進行標準化操作。求的相關系數矩陣R的特征方程及p個特征根，及特征向量。將標準化的指標量轉化成主成分，并根據特征根的大小確定主成分貢獻率，將前n個主成分累計貢獻率超過85%寸各個樣本的權系數重新組合，計算各個樣本在n個主成分上的得分，根據得分將不同地區(qū)劃成不同的組合，這樣就可以將原有因指標眾多而無法分清的地區(qū)間區(qū)別，可以通過有限

20、個主成分將各地區(qū)區(qū)分出來，將競爭力相近的地區(qū)主成分得分基本靠近，幾何做圖的意義是，在主軸上的各樣本點分別集中在各自的主軸附近。進一步分析各個主軸的經濟學含義。完成主成分分析。因子分析：它的目的在于研究原始變量的內部關系，通過尋找變量的共同因素來簡化和分析變量中存在的復雜關系。它把每個變量分解為兩部分因素，一部分是由這些變量內含的共同因素所構成，即所謂公共因素部分，另一部分是每個變量各種獨有的因素，即所謂獨特因素或單一因素部分。仍然沿用對地區(qū)競爭力分析的案例，由于根據主成分分析得到的n個主成分，將多個指標投影到少量的主成分之上，簡化了數據結構，但仍然無法明確主成分的含義，也無法明確指標間的關系。

21、這樣利用因子分析，將各個變量中的公共因子找到，也就是造成地區(qū)間競爭力不同的的共性因素，同時找到各地區(qū)不同的獨特因素。首先對各省數據進行標準化處理。根據正交因子模型：X=p+A*F+e,其中F為X的公共因子，為X的特殊因子，A為因子載荷矩陣。根據標準化數據計算協(xié)方差陣，并且求的其特征根和標準化特征向量，確定m個方差累積貢獻率達到85%以上的公因子個數。由于公因子解不唯一，為了取得更好對公因子的經濟學解釋，對公因子進行方差最大的正交旋轉，將各列載荷向?；?兩極方向分化，將大大有利于對公因子進行解釋。本案例中，得到2個公因子，gdp等指標在第一公因子上的載荷比較高，可以將第一公因子解釋為經濟層面的硬件因素，而教育投入、科研投入等指標在第二公因子上載荷較高，可以將第二公因子解釋為軟件因素。最后還可以將公因子反過來表示為不同變量的線性組合，即得到每個樣本（每個?。┑囊蜃拥梅?，來判斷各個省在兩個公因子的得分情況，清晰的看到有些省份在兩個公因子的得分都很到，有的部分得分高，有的都很低，體現出東、中、西部的差距，與人們普遍感受是一致的。同時根據地區(qū)間差距，找到具體得分差在哪里，對今后該地區(qū)提高綜合競爭力有很好的指導意義。9、給定典型相關系數運行結果，解讀結果。提問內容涉及（記不全了）：canoni

人人文庫> 全部分類> 應用文書 > 作業(yè)報告

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網頁內容里面會有圖紙預覽，若沒有圖紙預覽就沒有圖紙。
4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
5. 人人文庫網僅提供信息存儲空間，僅對用戶上傳內容的表現方式做保護處理，對用戶上傳分享的文檔內容本身不做任何修改或編輯，并不能對任何下載內容負責。
6. 下載文件中如有侵權或不適當內容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

多元統(tǒng)計分析思考題答案

文檔簡介

溫馨提示

最新文檔

評論

多元統(tǒng)計分析思考題答案

文檔簡介

溫馨提示

最新文檔

評論

相關文檔