




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
營(yíng)銷調(diào)研第15章揭示事物之間的聯(lián)系性第一節(jié)事物之間聯(lián)系性概述事物之間聯(lián)系性概述1兩個(gè)對(duì)象間聯(lián)系性的度量2一個(gè)對(duì)象與一組對(duì)象聯(lián)系性的度量3關(guān)聯(lián)規(guī)則4一、事物之間聯(lián)系性概述事物之間的聯(lián)系性:如果兩個(gè)變量有某種程度的聯(lián)系,那么當(dāng)一個(gè)變量值發(fā)生改變時(shí),會(huì)帶來另一個(gè)變量值的改變。蝴蝶效應(yīng)一對(duì)一一對(duì)多多對(duì)多二、變量之間聯(lián)系的類型聯(lián)系類型數(shù)據(jù)類型統(tǒng)計(jì)方法一對(duì)一數(shù)值←→數(shù)值簡(jiǎn)單相關(guān)系數(shù)定類←→定類二維列聯(lián)表分析定序←→定序或定序←→數(shù)值等級(jí)相關(guān)系數(shù)一對(duì)多數(shù)值←→(數(shù)值、定類、定序)一元或多元回歸分析多對(duì)多定類←→定類多維列聯(lián)表分析定序←→定序典型相關(guān)分析數(shù)值←→數(shù)值路徑分析復(fù)雜情況定類←→定類關(guān)聯(lián)規(guī)則在分析前首先要判斷聯(lián)系類型,然后判斷數(shù)據(jù)類型,最后才能選擇相應(yīng)合適的統(tǒng)計(jì)分析方法。三、事物之間聯(lián)系性分析步驟1、變量的數(shù)據(jù)類型是怎樣的?數(shù)值型,定類型,還是定序型變量2、相關(guān)關(guān)系是否存在?散點(diǎn)圖,假設(shè)檢驗(yàn)3、相關(guān)關(guān)系的方向?正的或負(fù)的,很難或無法確定4、相關(guān)關(guān)系的大???強(qiáng)相關(guān),弱相關(guān)四、圖形化初步探索1、散點(diǎn)圖(scattergraphs)通??梢杂脕韽闹庇^上觀察兩個(gè)數(shù)值變量之間的相關(guān)關(guān)系。四、圖形化初步探索2、柱形圖往往可以描述非單調(diào)的關(guān)聯(lián),適用于定類或定序數(shù)據(jù)。四、圖形化初步探索3、箱線圖(Boxplot)利用數(shù)據(jù)中的五個(gè)統(tǒng)計(jì)量:最小值、第一四分位數(shù)、中位數(shù)、第三四分位數(shù)與最大值來描述數(shù)據(jù)的一種方法,它也可以粗略地看出數(shù)據(jù)是否具有有對(duì)稱性,分布的分散程度等信息。第二節(jié)兩個(gè)對(duì)象間聯(lián)系性的度量事物之間聯(lián)系性概述1兩個(gè)對(duì)象間聯(lián)系性的度量2一個(gè)對(duì)象與一組對(duì)象聯(lián)系性的度量3關(guān)聯(lián)規(guī)則4一、簡(jiǎn)單相關(guān)系數(shù)簡(jiǎn)單相關(guān)系數(shù)(由KarlPearson提出,有時(shí)也稱作Pearson相關(guān)系數(shù))用來度量變量間的線性相關(guān)關(guān)系的強(qiáng)弱程度以及方向。1、方向相關(guān)系數(shù)的符號(hào)(+或-)代表變量間線性相關(guān)關(guān)系的方向(正相關(guān)或負(fù)相關(guān))。2、關(guān)聯(lián)強(qiáng)度相關(guān)系數(shù)值的大小顯示了變量間線性相關(guān)關(guān)系的強(qiáng)弱相關(guān)系數(shù)()相關(guān)程度1.00完全相關(guān)0.70~0.99高度相關(guān)0.40~0.69中度相關(guān)0.10~0.39低度相關(guān)0.10以下微弱或無相關(guān)一、簡(jiǎn)單相關(guān)系數(shù)3、可信度原假設(shè):
0(不存在線性相關(guān));備擇假設(shè):
0(存在一定的線性相關(guān))如果我們得到的統(tǒng)計(jì)量的P值很小,拒絕了原假設(shè)的話,我們就可以認(rèn)為兩個(gè)變量之間可能存在著一定的線性相關(guān)關(guān)系。二、幾種簡(jiǎn)單相關(guān)情況線性正相關(guān)線性負(fù)相關(guān)曲線相關(guān)不相關(guān)x軸代表自變量,y軸代表因變量三、應(yīng)用實(shí)例對(duì)營(yíng)業(yè)人員服務(wù)態(tài)度的評(píng)價(jià)對(duì)營(yíng)業(yè)人員業(yè)務(wù)素質(zhì)的評(píng)價(jià)對(duì)營(yíng)業(yè)廳服務(wù)設(shè)施的評(píng)價(jià)對(duì)營(yíng)業(yè)廳工作效率的評(píng)價(jià)簡(jiǎn)單相關(guān)系數(shù)值0.6340.6480.5300.676P值0.0000.0000.0000.0001、觀察出可能存在線性正相關(guān)2、測(cè)算簡(jiǎn)單相關(guān)系數(shù)大小,并進(jìn)行假設(shè)檢驗(yàn)4、應(yīng)用簡(jiǎn)單相關(guān)系數(shù)的注意點(diǎn)如果兩個(gè)變量相關(guān)且簡(jiǎn)單相關(guān)系數(shù)很大,我們不能武斷地認(rèn)為他們之間是因果關(guān)系。銷售收入和廣告花費(fèi)如果兩個(gè)變量之間簡(jiǎn)單相關(guān)系數(shù)很小,我們也不能武斷地認(rèn)為他們之間就沒有關(guān)聯(lián)性。非線性關(guān)聯(lián)(例如S或J型曲線)二、Spearman等級(jí)相關(guān)系數(shù)
對(duì)等級(jí)數(shù)據(jù)的相關(guān)性的測(cè)度主要用等級(jí)相關(guān)系數(shù),它是把相關(guān)聯(lián)的兩個(gè)變量按等級(jí)次序排列,形成兩個(gè)等級(jí)序列,然后測(cè)定這兩個(gè)等級(jí)序列之間的相關(guān)程度。計(jì)算過程舉例下表是某歌唱比賽中專家和聽眾根據(jù)十位歌手的表現(xiàn)給出的排名,計(jì)算斯皮爾曼等級(jí)相關(guān)系數(shù)。歌手編號(hào)一二三四五六七八九十專家排名52718436109聽眾排名43529617810等級(jí)差1121122121等級(jí)差的平方1141144141n=10,α=0.05,查表得臨界值為0.648,由于0.867>0.648,故說明等級(jí)相關(guān)系數(shù)是具有統(tǒng)計(jì)意義的,即專家排名和聽眾排名是相關(guān)的三、列聯(lián)表列聯(lián)表(contingencytable)又稱交互分類表(crossclassification)是指抽自某一總體的樣本同時(shí)按照兩個(gè)或兩個(gè)以上標(biāo)志進(jìn)行分類全球通動(dòng)感地帶神州行合計(jì)是8310059242否323269275867合計(jì)40636933411091兩個(gè)或兩個(gè)以上變量;2分類變量;3交叉的頻數(shù)分布表特征二維列聯(lián)表三維列聯(lián)表時(shí)裝購買率男性婚姻狀況女性婚姻狀況已婚未婚已婚未婚高1404875108低2607222572合計(jì)400120300180高維列聯(lián)表1、中國(guó)移動(dòng)三大品牌:全球通、動(dòng)感地帶和神州行2、使用12580情況:是、否1、性別2、婚姻狀況3、時(shí)裝購買情況1.列聯(lián)表形式2.列聯(lián)表的分布列聯(lián)表分布觀察值分布條件頻數(shù)行百分比列百分比總百分比期望值分布全球通動(dòng)感地帶神州行合計(jì)是8310059242否323269275867合計(jì)4063693341109全球通動(dòng)感地帶神州行是20.4%27.1%17.7%否79.6%72.9%82.3%合計(jì)100.0%100.0%100.0%全球通動(dòng)感地帶神州行合計(jì)是34.3%41.3%24.4%100.0%否37.3%31.0%31.7%100.0%全球通動(dòng)感地帶神州行合計(jì)是7.5%9.0%5.3%21.8%否29.1%24.3%24.8%78.2%合計(jì)36.6%33.3%30.1%100.0%12580是由中國(guó)移動(dòng)提供的綜合信息服務(wù)平臺(tái)。在全國(guó)各地,都可以撥打該號(hào)碼,進(jìn)行機(jī)票酒店等商旅信息的查詢和預(yù)訂,餐飲、娛樂、交通、旅游、便民等信息的查詢服務(wù)。3.卡方檢驗(yàn)列聯(lián)表分析中的卡方檢驗(yàn)獨(dú)立性檢驗(yàn)一致性檢驗(yàn)區(qū)別1、抽樣方法不同2、原假設(shè)不同3、期望頻數(shù)計(jì)算公式不同調(diào)查后再按照三大品牌分類原假設(shè):使用12580服務(wù)與品牌間沒有關(guān)系原假設(shè):各品牌間使用12580服務(wù)的比例一致在三大品牌中分別進(jìn)行抽樣觀察頻數(shù)×期望概率使用12580情況全球通動(dòng)感地帶神州行合計(jì)使用過8310059242未使用過323269275867合計(jì)4063693341109例:使用12580情況
全球通
動(dòng)感地帶
神州行
使用過
8389
10081
5973
未使用過
323317
269288
275261
這里的關(guān)鍵是計(jì)算期望頻數(shù)。在第一行,使用過12580服務(wù)的合計(jì)為242,用242/1109作為使用過該服務(wù)比例的估計(jì)值;在第一列,全球通的合計(jì)為406,用406/1109作為全球通比例的估計(jì)值;如果使用12580服務(wù)情況與移動(dòng)品牌間是獨(dú)立的,根據(jù)獨(dú)立性的概率乘法公式,有P(第一單元)=P(AB)=P(A)P(B)=(242/1109)(406/1109)=0.07988第一單元相應(yīng)的期望頻數(shù)為:.07988×1109=89期望頻數(shù)表觀測(cè)頻數(shù)表原假設(shè):各品牌和使用12580服務(wù)之間是獨(dú)立的(不存在依賴關(guān)系)備擇假設(shè):各品牌和使用12580服務(wù)之間不獨(dú)立(存在依賴關(guān)系)3.卡方檢驗(yàn)檢驗(yàn)中國(guó)引動(dòng)各品牌和使用12580服務(wù)之間是否存在依賴關(guān)系。在原假設(shè)下,該統(tǒng)計(jì)量服從自由度為(R-1)
×(C-1)的卡方分布0.05拒絕原假設(shè)5.99結(jié)論:在0.05的顯著性水平下,拒絕原假設(shè)。移動(dòng)用戶使用的產(chǎn)品品牌與使用12580的情況之間存在依賴關(guān)系。使用12580情況
全球通
動(dòng)感地帶
神州行
使用過
8389
10081
5973
未使用過
323317
269288
275261
3.卡方檢驗(yàn)1.匯總數(shù)據(jù)例:全球通、動(dòng)感地帶和神州行用戶分別有多少人使用過12580服務(wù)?2.獨(dú)立性檢驗(yàn)(1)使用12580服務(wù)與移動(dòng)品牌之間有關(guān)系嗎?(2)對(duì)產(chǎn)品的熟悉程度與教育程度有關(guān)嗎?3.一致性檢驗(yàn)(1)集團(tuán)公司下屬四個(gè)分公司對(duì)改革的態(tài)度是否存在差異?(2)不同收入群體對(duì)某種特定商品是否有相同的購買習(xí)慣?全球通動(dòng)感地帶神州行是20.4%27.1%17.7%否79.6%72.9%82.3%合計(jì)100.0%100.0%100.0%分公司1分公司2分公司3分公司4合計(jì)贊成68755779279反對(duì)32453331141合計(jì)10012090110420全球通動(dòng)感地帶神州行合計(jì)是???242否???867合計(jì)4063693341109項(xiàng)目低收入組偏低收入組偏高收入組高收入組經(jīng)常購買25404746不夠買69517457有時(shí)購買362619374.列聯(lián)表分析在市場(chǎng)營(yíng)銷研究中的應(yīng)用1.列聯(lián)表分析及其結(jié)果易于非統(tǒng)計(jì)背景的人員理解;2.列聯(lián)表分析易于進(jìn)行,適用于不十分熟悉的研究者;3.清晰的解釋易于將研究結(jié)果與管理行動(dòng)相結(jié)合;4.一系列的列聯(lián)表分析比單個(gè)變量分析能提供更多的信息百分比全球通36.6%動(dòng)感地帶33.3%神州行30.1%合計(jì)100.0%百分比是21.8%否78.2%合計(jì)100.0%卡方檢驗(yàn),P值<0.05?全球通動(dòng)感地帶神州行是20.4%27.1%17.7%否79.6%72.9%82.3%合計(jì)100.0%100.0%100.0%全球通動(dòng)感地帶神州行合計(jì)是7.5%9.0%5.3%21.8%否29.1%24.3%24.8%78.2%合計(jì)36.6%33.3%30.1%100.0%5.列聯(lián)表分析在市場(chǎng)營(yíng)銷研究中廣泛應(yīng)用的原因變量的分類值比較多時(shí),不易直接觀察、判斷;變量分類值較多但樣本量不足夠大時(shí),卡方檢驗(yàn)可能變得不適用;側(cè)重揭示兩變量之間的聯(lián)系,卻淡化了變量各分類之間的內(nèi)在聯(lián)系;以圖形方式直觀展示變量間關(guān)系方面,列聯(lián)分析方法顯得不盡如人意當(dāng)有多個(gè)定類變量時(shí),無法同時(shí)對(duì)多個(gè)變量之間的內(nèi)在聯(lián)系進(jìn)行剖析無法估計(jì)變量間交互作用的大小對(duì)應(yīng)分析對(duì)數(shù)線性模型6.列聯(lián)表分析的局限性第三節(jié)一個(gè)對(duì)象與一組對(duì)象聯(lián)系性的度量事物之間聯(lián)系性概述1兩個(gè)對(duì)象間聯(lián)系性的度量2一個(gè)對(duì)象與一組對(duì)象聯(lián)系性的度量3關(guān)聯(lián)規(guī)則4一、回歸分析概述回歸分析是研究一個(gè)變量關(guān)于另一個(gè)(些)變量的具體依賴關(guān)系的計(jì)算方法和理論。由于變量間關(guān)系的隨機(jī)性,回歸分析關(guān)心的是根據(jù)解釋變量的已知或給定值,考察被解釋變量的總體均值,即當(dāng)解釋變量取某個(gè)確定值時(shí),與之統(tǒng)計(jì)相關(guān)的被解釋變量所有可能出現(xiàn)的對(duì)應(yīng)值的平均值。由于總體的信息往往無法掌握,現(xiàn)實(shí)的情況只能是在一次觀測(cè)中得到總體的一組樣本。問題是能從一次抽樣中獲得總體的近似的信息嗎?如果可以,如何從抽樣中獲得總體的近似信息?隨機(jī)干擾:各種偶然因素、觀察誤差和其他被忽視因素的影響X對(duì)y的線性影響而形成的系統(tǒng)部分,反映兩變量的平均變動(dòng)關(guān)系,即本質(zhì)特征。二、回歸模型⒈出租汽車費(fèi)用與行駛里程:總費(fèi)用=行駛里程每公里單價(jià)⒉家庭收入與恩格爾系數(shù):家庭收入高,則恩格爾系數(shù)低。函數(shù)關(guān)系(確定性關(guān)系)相關(guān)關(guān)系(非確定性關(guān)系)三、回歸分析與函數(shù)關(guān)系統(tǒng)計(jì)相關(guān)關(guān)系嚴(yán)格函數(shù)關(guān)系深入了解觀測(cè)誤差不完全確定完全確定四、回歸分析與相關(guān)分析回歸分析相關(guān)分析y(因變量)處在被解釋的特殊地位x與y處于平等的地位y是隨機(jī)變量,x可以是隨機(jī)變量,也可以是非隨機(jī)的不僅可以揭示x對(duì)y的影響大小,還可以進(jìn)行預(yù)測(cè)和控制x與y都是隨機(jī)變量?jī)蓚€(gè)變量之間的密切程度五、回歸分析示意六、回歸分析原理(最小二乘法)模型:yi=α+βxi+εi(i=1,2…n)idxy------------------------1x1y12x2y2……ixiyi……nxnyn。。。。。。。。。。。。xy0。。。一元線性回歸模型(xi,yi)εiy=α+βx最小二乘法的基本思想:
找到這樣一條直線,使各個(gè)觀測(cè)點(diǎn)到這條直線的距離的平方和最小,就說這條直線最能代表或者最佳擬合了各個(gè)自變量X和因變量Y之間的關(guān)系。七、對(duì)回歸模型結(jié)果的解釋1、自變量X的回歸系數(shù)回歸系數(shù)的含義是在其他變量保持變化時(shí),某一自變量對(duì)因變量的影響?;貧w系數(shù)的大小反應(yīng)了它代表的自變量對(duì)因變量影響的方向和強(qiáng)弱。只有變量量綱相同時(shí)才能比較參數(shù)大小?;貧w系數(shù)也是一個(gè)隨機(jī)變量,而且它服從t分布,P值越小說明我們估計(jì)的系數(shù)值的代表性就越強(qiáng)。方差分析表七、對(duì)回歸模型結(jié)果的解釋2、整體擬合度總方差=回歸方程能解釋的方差+隨機(jī)誤差項(xiàng)帶來的方差變動(dòng)原因平方和自由度方差回歸SSRk-1SSR/(k-1)誤差SSEn-kSSE/(n-k)合計(jì)SSTn-1SST/(n-1)F值也是越大越好,因?yàn)镕值越大,代表回歸方程能解釋總方差的比例越高。F值的作用和可決系數(shù)的作用類似,只不過是總方差變成了隨機(jī)誤差項(xiàng)的方差,并且去掉了樣本量大小的影響。八、模型的診斷數(shù)據(jù)應(yīng)滿足的假設(shè)條件:自變量之間不存在多重共線性;自變量與殘差獨(dú)立;殘差的均值為零,方差為常數(shù);殘差之間相互獨(dú)立;殘差服從正態(tài)分布。不滿足條件導(dǎo)致的后果:結(jié)論不唯一;模型中缺少重要自變量;參數(shù)估計(jì)出現(xiàn)偏倚;結(jié)果失真;統(tǒng)計(jì)檢驗(yàn)結(jié)果出現(xiàn)偏倚。回歸模型建立有許多前提條件,當(dāng)這些條件無法得到滿足時(shí),建立的回歸模型就會(huì)出現(xiàn)很多問題,因此,我們有必要在建立模型后對(duì)模型診斷,看其是否滿足假設(shè)條件。1、檢驗(yàn)正態(tài)分布假設(shè)正態(tài)分布假設(shè)之所以需要是因?yàn)槲覀冊(cè)谧龌貧w系數(shù)顯著性檢驗(yàn)和回歸方程整體顯著性檢驗(yàn)時(shí),其檢驗(yàn)統(tǒng)計(jì)量的分布是基于正態(tài)分布假設(shè)推出的。如果正態(tài)分布假設(shè)不滿足的話,那么回歸模型的顯著性檢驗(yàn)結(jié)果也就失去了意義。有三種檢驗(yàn)一個(gè)統(tǒng)計(jì)量為正態(tài)分布的方法:觀察它的頻數(shù)分布圖;P-P圖或Q-Q圖;K-S檢驗(yàn)。(1)觀察頻數(shù)分布圖標(biāo)準(zhǔn)化的殘差的頻數(shù)分布圖可以看到大致呈對(duì)稱分布,且均值約等于0,標(biāo)準(zhǔn)差約等于1,因此,和標(biāo)準(zhǔn)正態(tài)分布N(0,1)近似。(2)P-P圖P-P圖如果所有的點(diǎn)都落在對(duì)角線的附近,我們就說該統(tǒng)計(jì)量的分布接近于正態(tài)分布。(3)K-S檢驗(yàn)k-s檢驗(yàn)亦稱擬合優(yōu)度檢驗(yàn)法,用來檢驗(yàn)?zāi)愕臄?shù)據(jù)的分布是不是符合一個(gè)理論的已知分布。
在這里我們假設(shè)已知分布是正態(tài)分布,所以如果檢驗(yàn)的P值很小,那么就有理由拒絕原假設(shè),認(rèn)為隨機(jī)誤差項(xiàng)的分布不服從正態(tài)分布。2、檢驗(yàn)同方差假設(shè)同方差假設(shè)
是指無論自變量x取怎樣的值,對(duì)應(yīng)的殘差的方差都應(yīng)該相等,它不應(yīng)隨解釋變量或被解釋變量取值的變化而變化,否則就認(rèn)為出現(xiàn)了異方差現(xiàn)象。隨著預(yù)測(cè)值y的增大,隨機(jī)誤差項(xiàng)的方差在增大,因此,存在著異方差現(xiàn)象。檢驗(yàn)異方差還可以用white檢驗(yàn),G-Q檢驗(yàn)等等。3、檢驗(yàn)獨(dú)立性假設(shè)當(dāng)回歸模型中涉及到與時(shí)間相關(guān)的變量時(shí),便會(huì)有可能涉及到獨(dú)立性假設(shè)的內(nèi)容。獨(dú)立性假設(shè)要求殘差序列的前期和后期數(shù)值之間不存在相關(guān)關(guān)系,即不存在自相關(guān)。當(dāng)存在自相關(guān)時(shí),會(huì)存在許多問題,使模型有效性降低。我們可以通過殘差隨時(shí)間變化的散點(diǎn)圖來觀察獨(dú)立性。etetet無相關(guān)性有曲線相關(guān)有直線相關(guān)九、多重共線性與逐步回歸法1、多重共線性由于自變量之間存在著相關(guān),造成回歸參數(shù)估計(jì)時(shí)出現(xiàn)偏差,以及顯著性檢驗(yàn)失效的后果。分析結(jié)果不穩(wěn)定顯著性消失
符號(hào)錯(cuò)誤1、檢驗(yàn)多重共線性的方法ToleranceVIF對(duì)營(yíng)業(yè)廳工作效率的評(píng)價(jià)0.641991.557652對(duì)營(yíng)業(yè)人員服務(wù)態(tài)度的評(píng)價(jià)0.539471.85367對(duì)營(yíng)業(yè)廳服務(wù)設(shè)施的評(píng)價(jià)0.773541.292755對(duì)營(yíng)業(yè)人員業(yè)務(wù)素質(zhì)的評(píng)價(jià)0.502531.989928觀察特征根容忍度和方差膨脹引子容忍度(tolerance)和方差膨脹因子(VIF)。這兩個(gè)數(shù)值互為倒數(shù)。容忍度范圍在0~1之間,越接近于0表示多重共線性越強(qiáng),越接近于1表示多重共線性越弱。特征根值的大小代表了其解釋因變量作用的強(qiáng)弱。觀察各單位根是否同時(shí)代表了兩個(gè)以上的自變量。2、逐步回歸法逐步回歸問題其實(shí)就是多元回歸分析的自變量選擇問題,自變量選擇方式有三種:向前引入(forward),向后消去(backward)和逐步分解(step)。自變量選擇方法原理特點(diǎn)向前引入起初沒有自變量,然后引入最重要變量,再引入第二重要變量一旦引入就一直保留,無法消去??赡芤胫貜?fù)變量,引起多重共線性。向后消去起初將所有變量都引入方程,然后首先消去最不重要變量,再消去第二不重要變量一旦消去就無法再次引入??赡苷`刪某些重要變量。逐步分解首先應(yīng)用向前引入的規(guī)則,但是在引入變量的同時(shí),可以逐步消去不重要的變量。結(jié)合了向前引入和向后消去。2、逐步回歸法模型1調(diào)整的R2
估計(jì)的標(biāo)準(zhǔn)誤變化F變化10.461.150.462089.4220.571.020.12674.7330.620.960.04290.7440.640.930.02163.34識(shí)別相對(duì)重要變量的方法是通過引入或消去某一自變量時(shí),考察R2值的相對(duì)變化(或F統(tǒng)計(jì)量值的變化,有時(shí)也叫偏F檢驗(yàn))。如果引入某一自變量時(shí),R2值增大很多,就說這個(gè)自變量相對(duì)重要;如果消去某一自變量時(shí)R2值減少很少,就說這個(gè)自變量相對(duì)不重要。2、逐步回歸法模型自變量回歸系數(shù)T值1(Constant)3.59433.558對(duì)營(yíng)業(yè)廳工作效率的評(píng)價(jià)0.57345.7102(Constant)2.09418.835對(duì)營(yíng)業(yè)廳工作效率的評(píng)價(jià)0.40631.607對(duì)營(yíng)業(yè)人員服務(wù)態(tài)度的評(píng)價(jià)0.34625.9763(Constant)1.43412.792對(duì)營(yíng)業(yè)廳工作效率的評(píng)價(jià)0.34727.488對(duì)營(yíng)業(yè)人員服務(wù)態(tài)度的評(píng)價(jià)0.29923.161對(duì)營(yíng)業(yè)廳服務(wù)設(shè)施的評(píng)價(jià)0.19117.0514(Constant)1.13710.240對(duì)營(yíng)業(yè)廳工作效率的評(píng)價(jià)0.30323.821對(duì)營(yíng)業(yè)人員服務(wù)態(tài)度的評(píng)價(jià)0.20814.442對(duì)營(yíng)業(yè)廳服務(wù)設(shè)施的評(píng)價(jià)0.16715.144對(duì)營(yíng)業(yè)人員業(yè)務(wù)素質(zhì)的評(píng)價(jià)0.19412.780最終的模型是模型4依次引入這些變量時(shí)R2是一直保持增大的。R2增大的幅度是越來越小的,這就說明引入變量的重要性在逐漸減弱。之所以沒有消去某些自變量是因?yàn)闆]有出現(xiàn)減少的情況。十、關(guān)于回歸分析的幾點(diǎn)注意事項(xiàng)
即使建立了回歸式并且統(tǒng)計(jì)檢驗(yàn)證明相關(guān)關(guān)系成立,也只能說研究的變量是統(tǒng)計(jì)相關(guān)的,而不能就此斷定變量之間有因果關(guān)系?;貧w的因變量選定后,自變量的選擇十分重要。用回歸方程作預(yù)報(bào)或控制,必須考慮對(duì)要研究的變量有影響的各種未引入模型中的因素是否有變化,即問題的背景是否發(fā)生變化。判斷一個(gè)模型是否是一個(gè)最優(yōu)模型,除了評(píng)估各種統(tǒng)計(jì)檢驗(yàn)指標(biāo)外,還要結(jié)合專業(yè)知識(shí)全面權(quán)衡各個(gè)指標(biāo)變量系數(shù)的實(shí)際意義,如符號(hào),數(shù)值大小等。第四節(jié)關(guān)聯(lián)規(guī)則事物之間聯(lián)系性概述1兩個(gè)對(duì)象間聯(lián)系性的度量2一個(gè)對(duì)象與一組對(duì)象聯(lián)系性的度量3關(guān)聯(lián)規(guī)則4關(guān)聯(lián)規(guī)則挖掘用于發(fā)現(xiàn)隱藏在大型數(shù)據(jù)集中的令人感興趣的聯(lián)系。
某商店發(fā)現(xiàn)顧客購買的商品組合如下,這些組合之間有何聯(lián)系?{面包,牛奶}{面包,尿布,啤酒,雞蛋}{牛奶,尿布,啤酒,可樂}{面包,牛奶,尿布,啤酒}{面包,牛奶,尿布,可樂}“如果一個(gè)顧客購買了‘尿布’,那么該顧客有75%的可能性購買‘啤酒’”。如果我們采取相應(yīng)的促銷措施,該顧客購買尿布后購買啤酒的可能性會(huì)增大。一、關(guān)聯(lián)規(guī)則概述一、關(guān)聯(lián)規(guī)則概述關(guān)聯(lián)規(guī)則是要找出在某一事件或是數(shù)據(jù)中會(huì)同時(shí)出現(xiàn)的東西。如果ItemA是某一事件的一部分,則ItemB也出現(xiàn)在該事件中的概率有X%。即同一個(gè)交易中,一個(gè)item出現(xiàn)也會(huì)引起另一個(gè)item的出現(xiàn)。例如,如果一個(gè)顧客買了若顧客購買面包,則他很可能也會(huì)購買牛奶概率是85%Associationrule:面包-->
牛奶二、相關(guān)的術(shù)語與概念1.項(xiàng)集項(xiàng)的集合稱為項(xiàng)集(Itemset)。每個(gè)項(xiàng)都是一個(gè)屬性值,項(xiàng)集包含一組屬性值。k-項(xiàng)集:包含k項(xiàng)的項(xiàng)集{病征=“發(fā)燒”,病征=“咳嗽”,病名=“上呼吸道感染”},那么{發(fā)燒,咳嗽,上呼吸道感染}就是一個(gè)大小為3的項(xiàng)集,即3-項(xiàng)集,“發(fā)燒”項(xiàng)是“病征”屬性的一個(gè)屬性值。頻繁項(xiàng)集:是在數(shù)據(jù)集中出現(xiàn)頻率相當(dāng)高的那些項(xiàng)集。頻繁出現(xiàn)頻率的閾值用支持度來定義。2.支持度(Support)關(guān)聯(lián)規(guī)則A-->B支持度為:A與B同時(shí)出現(xiàn)之機(jī)率
P(A,B)support(A→B)=P(A∪B),即A和B這兩個(gè)項(xiàng)集在事務(wù)集D中同時(shí)出現(xiàn)的概率。例子:資料庫中的交易紀(jì)錄如下:t1:(…,面包,…,牛奶,…)t2:(…,面包,…………..)t3:(…,面包,…,牛奶,…)t4:(……)請(qǐng)問面包-->
牛奶之支持度為多少?最小支持度(minsup)商品的熱門程度事件組合機(jī)率牛奶35%面包50%牛奶和面包25%3.可信度(confidence)關(guān)聯(lián)規(guī)則A-->B可信度為:在A出現(xiàn)之條件下出現(xiàn)B之概率。confidence(A→B)=P(B|A),即在出現(xiàn)項(xiàng)集A的事務(wù)集D中,項(xiàng)集B也同時(shí)出現(xiàn)的概率。例子:資料庫中的交易紀(jì)錄如下:t1:(…,面包,…,牛奶,…)t2:(…,面包,…………..)t3:(…,面包,…,牛奶,…)t4:(……)請(qǐng)問面包-->牛奶之可信度為多少?一起買的可能性有多少事件組合機(jī)率牛奶35%面包50%牛奶和面包25%假設(shè)minsup是最小支持度閥值;
minconf是最小信心度閥值。如果交易集合T中的關(guān)聯(lián)規(guī)則AB同時(shí)滿足:則AB稱為T中的強(qiáng)關(guān)聯(lián)規(guī)則。買面包的人二者都買的人買牛奶的人可信度與支持度比較4.重要性(importance)關(guān)聯(lián)規(guī)則A-->B使用這條規(guī)則預(yù)測(cè)的結(jié)果時(shí)比隨機(jī)決定的結(jié)果好多少。重要性:important(A,B)=P(A∩B)/P(A)*P(B)=P(B|A)/P(B)例子:資料庫中的交易紀(jì)錄如下:t1:(…,面包,…,牛奶,…)t2:(…,面包,…………..)t3:(…,面包,…,牛奶,…)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 全麻患者圍手術(shù)期的護(hù)理
- 拍賣網(wǎng)絡(luò)平臺(tái)合同
- 外國(guó)人士租賃協(xié)議
- 工程項(xiàng)目建材合作合同
- 商品質(zhì)量問題檢測(cè)與解決合同(2篇)
- 工程項(xiàng)目招投標(biāo)管理
- 地基與基礎(chǔ)材料合同
- 數(shù)字貨幣使用協(xié)議
- 幼兒園春季傳染病知識(shí)預(yù)防
- 拍賣工作人員責(zé)任協(xié)議
- 籍貫對(duì)照表完整版
- 中等職業(yè)學(xué)校英語課程標(biāo)準(zhǔn)(2020年版)(word精排版)
- XX醫(yī)院年度經(jīng)濟(jì)運(yùn)營(yíng)分析報(bào)告范本參考醫(yī)療
- 干部履歷表(國(guó)家機(jī)關(guān)事業(yè)單位)
- DN400輸油臂總體及立柱設(shè)計(jì)畢業(yè)設(shè)計(jì)說明書
- DMA原理與應(yīng)用解讀課件
- 六年級(jí)下冊(cè)數(shù)學(xué)課件-《探索規(guī)律》 人教新課標(biāo) (共14張PPT)
- 2022年小升初入學(xué)考試數(shù)學(xué)真題重慶市巴川中學(xué)初一新生入學(xué)水平測(cè)試
- 中國(guó)大宗商品交易市場(chǎng)名單-Version 3.0
- 2021年阿勒泰市法院書記員招聘考試試題及答案解析
- PDC鉆頭設(shè)計(jì)課件解讀
評(píng)論
0/150
提交評(píng)論