a010w航空客運(yùn)信息挖掘_第1頁(yè)
a010w航空客運(yùn)信息挖掘_第2頁(yè)
a010w航空客運(yùn)信息挖掘_第3頁(yè)
a010w航空客運(yùn)信息挖掘_第4頁(yè)
a010w航空客運(yùn)信息挖掘_第5頁(yè)
已閱讀5頁(yè),還剩35頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

公公摘要:

用戶價(jià)值評(píng)估和流失預(yù)測(cè)模型,區(qū)分客戶群,并提出相應(yīng) 策略,從而達(dá)到提高上座率和效的目個(gè)方法利用層次分析法(AHP)計(jì)算各維度的權(quán)重,再對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化,并用SPSS軟件實(shí)現(xiàn)K-means法將所有客戶劃分32客戶類(lèi)別及其類(lèi)型特點(diǎn)。接著利用權(quán)重計(jì)算各客戶群綜合得分,機(jī)次數(shù)比值)0.5和0.8為兩個(gè)臨界值將老客戶劃分為流失客戶、準(zhǔn)流失客戶、未流失客戶三種最后,根據(jù)已建立的客戶細(xì)分、價(jià)值評(píng)估和流失模型所得的結(jié)論,針對(duì)各個(gè)不同的客戶群不同的服務(wù)和策略,吸引客戶乘坐航班,來(lái)提高上座率和效益:LRFMC聚類(lèi)分析 主成分分 決策 神經(jīng)網(wǎng)Airline tion:ImprovingtheattendancesofsccanalsoincreasethebenefitoftheSegmentationModel,CustomerValu

kefulluseofaviationresources,butmeetthisgoal,webuildCustomerodel,usingmassdataofmembersoftheairline,bydatamining,todistinguishcustomerbasesandputforwardthecorrespondingstrategies.Sothat,theairlineisabletoimprovetheattendencesandFirstly,theCustomerSegmentationModelmustbebuilt.Accordingtothereferences,wepreprocessthedatafirst,andthenscreenout5indexes(L,R,F,MandC),ascoredimensionsofcustomersegmentation.WeuseLRFMC-clusterysistosegmentcustomersandpreliminaryevaluatethem.ThismethodcalculatestheweightsofseveralcoredimensionsbyAHP,standardizethedata,andthenimplementK-meansclusteringmethodbySPSS,tosegmentallthecustomersinto32groups.Wecanalsoknowthecharacteristicsofallthe32groups.Atlast,wecalculatethecompositescoresusingtheweightsofcoredimensions,anddividethecustomergroupsoftheairlineinto5levelsofcustomerbases:Important-maintainings,Important-develoings,Important-retainings,generalsandlow-values.Secondly,webuildtheCustomerValueModel.Wepreprocessthedata,comingfromtheresultoftheCustomerSegmentationModel,andchoose14attributeswhichinfluencecustomervaluemostlyasfactorsusingintheprincipalcomponsis.ByusingSPSS,factorysisanddatareductionarecarriedout.Fromtheresultwhichweget,2principalcomponentscansubstituteforthe14attributesandatthesametime,theweightsofalltheattributestakinginthe2principalcomponentscanalsobeknown.Bydatastandardization,thecompositescoresofallthe5customerbasescanbecalculated,usingtheweightswhichareknown.Thecompositescoresarewhatweusetoevaluatethecustomers.Thirdly,CustomerChurnModelistobebuilt.Wedefinetheconceptofcustomerretention(theratioofsecondyear’sflighttimeandfirstyear’stimeofthecustomer),anddivideregularcustomersinto3types:lostcustomers,prospectivelostcustomersandno-lostcustomers,using0.5and0.8ascriticalvalues.Atthesametime,wechoosesomedimensionsandthedimensionsderivingfromthesedimensionswhichhavebeenknowntobuildCustomerChurnModelwiththetwomethodsofdecisiontreesandneuralnetworks.Sothat,wecanfindoutthekeyfactorswhichinfluencecustomerchurn.Andafterthecomparisonofthesetwomethods,wefinallyfindoutthattherelativelyimportantfactorswhichaffectcustomerchurnareaveragediscountfactor,unitagefareandunitageintegral.Intheend,accordingtotheconclusionsofthethreemodels,differentservicesandmarketingstrategiesareputforwardfordifferentcustomergroups.Withthesestrategies,it’spossiblethatmorecustomerswilltakeflightsofthisairlineandattendenceswillbeimprovedaswell.:LRFMC-cluster principal decision neural 數(shù)據(jù)抽 數(shù)據(jù)規(guī)約技 數(shù)據(jù)規(guī)約優(yōu) 數(shù)據(jù)清 數(shù)據(jù)集 數(shù)據(jù)變 基于航空公司常旅客價(jià)值的客戶分 客戶分群的意義及目標(biāo)概 數(shù)據(jù)基本信息描述及數(shù)據(jù)準(zhǔn) 數(shù)據(jù)描 維度的選 模型建 聚類(lèi)方法分 常用的聚類(lèi)算 LRFMC聚類(lèi)分析 層次分析 權(quán)重計(jì) 數(shù)據(jù)標(biāo)準(zhǔn) K-means聚類(lèi)方 K-means算法的基本原 K-means算法的框 K-means算法的優(yōu) 模型實(shí)現(xiàn)及評(píng)價(jià)分 客戶群特征描述及分 客戶類(lèi)型判 客戶價(jià)值比較分 實(shí)證分 建模評(píng)價(jià)與分 航空公司客戶價(jià)值所參考的指 模型構(gòu) 計(jì)算相關(guān)系數(shù)矩陣獻(xiàn)計(jì)算特征值與特征向量獻(xiàn)計(jì)算主成分貢獻(xiàn)率及累計(jì)計(jì)算主成分載荷各主成分得分

方法驗(yàn)證 樣本數(shù)據(jù)準(zhǔn) 客戶價(jià)值模型的建模、評(píng)估和主成分分析過(guò) 模型評(píng)價(jià)和分 客戶流失模型設(shè)計(jì)與實(shí) 流失模型的意義及目標(biāo)概 7.1.2車(chē)主流失模型的設(shè)計(jì)與實(shí) 數(shù)據(jù)基本信息描述及數(shù)據(jù)準(zhǔn) 數(shù)據(jù)樣本說(shuō) 數(shù)據(jù)清 數(shù)據(jù)變 模型建 客戶流失的數(shù)據(jù)挖掘應(yīng) 客戶流失的數(shù)據(jù)特 模型設(shè)計(jì)與實(shí) 訓(xùn)練與檢 模型評(píng)價(jià)與結(jié)果解 模型評(píng) 模型解 參考文 數(shù)據(jù)挖掘技術(shù)數(shù)據(jù)挖掘技術(shù),對(duì)客性化的客戶服務(wù),加深對(duì)客

預(yù)測(cè)出潛在的流失客戶,保留住老客戶,提高航空客運(yùn)的上座率,防止因客戶流失而的營(yíng),提高航空公司的競(jìng)爭(zhēng)力本次數(shù)據(jù)挖掘建模的總體流程如圖Step1:對(duì)航空公司的原始數(shù)據(jù)進(jìn)行數(shù)據(jù)規(guī)約形成兩個(gè)樣本,訓(xùn)練樣本和診Step3:利用Step2形成的已完成數(shù)據(jù)預(yù)處理的訓(xùn)練樣本,基于旅客價(jià)值進(jìn)行客戶分群,建立Step4:利用Step3在大量數(shù)據(jù)上進(jìn)行復(fù)雜,數(shù)據(jù)規(guī)約技術(shù)可以用來(lái)得到數(shù)據(jù)的規(guī)約表示。規(guī)約表示小得整性。在規(guī)約后得到的數(shù)據(jù)集掘?qū)⒏行Вa(chǎn)生相同或幾乎,但仍接,但仍接近地保持原數(shù)據(jù)的同的分析結(jié)果降低無(wú)效、錯(cuò)誤挑選少量且具代表性的數(shù)據(jù)將大幅縮減數(shù)據(jù)挖掘所需的時(shí)間降低數(shù)據(jù)的成本①對(duì)表中的空缺值做丟棄處理③檢測(cè)和處理值①刪除重復(fù)數(shù)據(jù)②實(shí)體識(shí)別③冗余屬性識(shí)別:對(duì)數(shù)據(jù)進(jìn)行和匯概化:使用概念分層,用次概念替換“原始”的低層次的數(shù)入會(huì)時(shí)間距觀測(cè)窗口結(jié)束的月數(shù)觀測(cè)時(shí)間內(nèi)乘坐公司飛機(jī)的次數(shù)的飛行里程、C(具體的計(jì)算方式的飛行里程、C(L(會(huì)員入會(huì)時(shí)間距觀測(cè)窗口結(jié)束的月數(shù))=觀測(cè)窗口的結(jié)束時(shí)間(LOAD_TIME)-入會(huì)時(shí)(FFP_DATE)[單位:月F(客戶在觀測(cè)時(shí)間內(nèi)乘坐公司飛機(jī)的次數(shù))=飛行次數(shù)(FLIGHT_COUNT)[單位:次客戶。這樣一條被表示為由5個(gè)特征屬性(L、R、F、M、C)組成的向量,及其相應(yīng)的。5.1標(biāo)題,企業(yè)對(duì)不同的客戶群要標(biāo)題,企業(yè)對(duì)不同的客戶群要:20數(shù)據(jù)基本信息描述及數(shù)據(jù)準(zhǔn)—4/1/2008、63個(gè)屬性字段機(jī)會(huì),表明該客戶價(jià)值較低并更RFM指標(biāo)高的客戶可能更愿意機(jī)會(huì),表明該客戶價(jià)值較低并更

提出了RFM細(xì)分,通過(guò)三項(xiàng)變量Monetary)來(lái)細(xì)分客戶,用于識(shí)別與企業(yè)進(jìn)因此,RFM模型可以幫與企業(yè)進(jìn) Liu和Shih提出了運(yùn)用AHP(層次分析法)模型預(yù)測(cè)RFM權(quán)重并應(yīng)用K均值聚類(lèi)法對(duì)客戶基于權(quán)重的RFM方法是一種有效的客戶細(xì)分方法。傳統(tǒng)的RFM指標(biāo)做了適當(dāng)?shù)恼{(diào)整,確定了L、R、F、M、C五個(gè)指標(biāo)作為航空公司客戶細(xì)分的參在一定時(shí)間內(nèi)的消費(fèi)頻率,M代表客戶在一定時(shí)間內(nèi)的升級(jí)里程“升級(jí)里程”是指航空公司會(huì)員通過(guò)乘坐本公司及航空合作伙伴的有效航班所累積的基本飛行里程C代表客戶在一定時(shí)間內(nèi)所乘客戶價(jià)值由五個(gè)方面入會(huì)時(shí)間觀測(cè)窗口的結(jié)束時(shí)間最后一次乘機(jī)時(shí)間至觀察窗口末端時(shí)長(zhǎng)F(客戶在觀測(cè)時(shí)間內(nèi)乘坐公司飛機(jī)的次數(shù)飛行次數(shù)M(客戶在觀測(cè)時(shí)間內(nèi)在公司累計(jì)的飛行里程觀測(cè)窗口總飛行公里數(shù)平均折扣率方案數(shù)據(jù)預(yù)處理,包括數(shù)據(jù)、集成、變換、規(guī)約、提取特征維度對(duì)訓(xùn)練樣本進(jìn)行聚類(lèi)分析,實(shí)現(xiàn)客戶分群,并對(duì)每一個(gè)客戶群體的特征于模式識(shí)別、圖像處理、數(shù)據(jù)壓縮等許多領(lǐng)域。聚類(lèi)就是把一組按照相似性歸成若干類(lèi)別,即類(lèi)簇,并且kn。也就是說(shuō),它將數(shù)據(jù)劃分為k個(gè)組,同時(shí)滿足如下要求:每個(gè)組至少包含一個(gè)對(duì)象每個(gè)對(duì)象必須屬于且只屬于一個(gè)組心(每個(gè)簇的中心)分類(lèi),使得評(píng)價(jià)指標(biāo)JC法向聚類(lèi)準(zhǔn)則函數(shù),誤差平方和Mi是類(lèi)Ci中數(shù)據(jù)對(duì)象的均值,p是類(lèi)中的對(duì)象。算法流程是:首先,隨機(jī)的選擇k個(gè)距離,將它指派到最相似的簇,然后計(jì)算此JC的值。最后,重新計(jì)算每個(gè)簇的簇Mi(即法向聚類(lèi)準(zhǔn)則函數(shù),誤差平方和k均值算法需要首先確定簇的數(shù)目k,對(duì)k個(gè)初始聚類(lèi)中心點(diǎn)的選取依賴(lài)性極大,因此易陷入則創(chuàng)建包含p敏感,算法復(fù)雜度高敏感,算法復(fù)雜度高算法,它通過(guò)把數(shù)據(jù)映射到2或3維的特征空間進(jìn)行聚類(lèi)。LRFMC在《航空公司常旅客細(xì)分研究》[2]中闡述了這種聚類(lèi)方法層次分析法(yticHierarchyProcess,簡(jiǎn)稱(chēng)AHP法)是一種對(duì)較為模糊或較為復(fù)雜的決策問(wèn)成熟等優(yōu)點(diǎn),因此選擇AHP法作為確定權(quán)重的方法。權(quán)重系數(shù)具體來(lái)說(shuō)就是計(jì)算出某層次因素相對(duì)于所隸屬的上一層次元素的相對(duì)重要性矩矩nn示因素i和因素j標(biāo)的重要性程度,一般采取9設(shè)判斷矩陣的特征根 ,則有。當(dāng)矩陣具有完全一致性時(shí)CI作為度量判斷矩陣偏離一致性的指標(biāo)。CI的計(jì)算方法如式所示。矩陣的平均隨機(jī)一致性指標(biāo)RI值。對(duì)于3~9階判斷矩陣,RI的值分別列于圖5中。1、2階判斷矩陣總是具有完全一致性。當(dāng)階數(shù)大于2時(shí),判斷矩陣的一致性指標(biāo)CI與同階平均隨機(jī)一致性指標(biāo)RI之比稱(chēng)為隨機(jī)一致性比率,記為CR,如式所示。CR<0.1時(shí),即認(rèn)為判斷采要調(diào)整首先,計(jì)算各個(gè)有效判斷斷矩陣的最大特征根及其特征向響因素的權(quán)重的權(quán)重。這可歸結(jié)為計(jì)算問(wèn)題。計(jì)算方法包括和法、法、冪法。當(dāng)精度要求不響因素的權(quán)重的權(quán)重。這可歸結(jié)為計(jì)算求;當(dāng)精度要求較高時(shí)可用冪法。采用法計(jì)算判斷矩陣每一行元素的乘積,如式所示,i=計(jì) 的n次,如式所示對(duì)向量正規(guī)化,如式所示即為所求的特征向量,也就是相應(yīng)的權(quán)重系數(shù)在上一步中進(jìn)行一致性檢驗(yàn)所需的判斷矩陣的最大特征根計(jì)算方法如式所示,其中 的第i個(gè)元素。計(jì)算出每個(gè)有效判斷矩陣的權(quán)重后對(duì)這些有效判斷的權(quán)重取算術(shù)平均即得到各影響因素權(quán)重采用問(wèn)卷的方式,邀請(qǐng)包括某航空公司客戶部門(mén)經(jīng)理、客戶部門(mén)業(yè)務(wù)骨干、業(yè)出判斷矩陣群。一個(gè)判斷矩陣的例子如圖6所示。最后,根據(jù)《基于常旅客數(shù)據(jù)庫(kù)的航空公司客戶細(xì)分方法研究》確定L、R、F、M、C的相對(duì)重0、標(biāo)準(zhǔn)差1的標(biāo)準(zhǔn)正態(tài)分布;另一種是把數(shù)據(jù)變0~1之間的數(shù)據(jù)。采用第一種標(biāo)準(zhǔn)K-meansK-means算法屬于聚類(lèi)中一種基本的劃分方法,它是很典型的基于距離的聚類(lèi)算法。該類(lèi)算法K-meansK-means算法數(shù)到別的種和為的標(biāo),用求值法得到迭運(yùn)的調(diào)整則means 算法以式離作為似測(cè)度,是對(duì)應(yīng)某初中 象的均值,是類(lèi) K-means算法首先K個(gè)點(diǎn)作為初樣本距離,到離它最近的那個(gè)聚類(lèi)中心所在的類(lèi)。該算法屬于動(dòng)態(tài)聚類(lèi)法,迭代過(guò)程采用按批修改方法,即在每次迭代中都要每個(gè)樣本的分類(lèi)是否正確,若不正確,就要調(diào)整。在全部樣本調(diào)整完后,再修改,給定大小n的數(shù)據(jù)集,令I(lǐng)1K個(gè)初始聚類(lèi)中心計(jì)算每個(gè)數(shù)據(jù)對(duì)象與聚類(lèi)中心的距離,如,則將歸入m類(lèi)計(jì)算誤差平方和準(zhǔn)則函 ,見(jiàn)式 則算法結(jié)束;否則I=I+1,采用如式計(jì)算K個(gè)新的聚類(lèi)中心,返回(2。K-meansK-means聚類(lèi)法具有速度快、計(jì)算量小的特點(diǎn),因此在處理大樣本數(shù)據(jù)時(shí)不占用太多的內(nèi)存間和計(jì)算時(shí)間。而且K-means算法的思想很簡(jiǎn)單,在聚類(lèi)算法中應(yīng)用最為廣泛分的結(jié)果用一個(gè)矩陣表示,如圖最終產(chǎn)生的四種結(jié)果,按照(當(dāng)前價(jià)值,潛在價(jià)值)的描述方式,分別對(duì)應(yīng)著(低,低(低因此,我們應(yīng)該認(rèn)真分析企業(yè)的客戶,并針對(duì)每一類(lèi)客戶采取不同的措施太大潛力可供進(jìn)一步 于當(dāng)前價(jià)值高,他們很后期客戶價(jià)值變化的不確定性也較高,因此企業(yè)應(yīng)太大潛力可供進(jìn)一步 于當(dāng)前價(jià)值高,他們很傾向的那部分群體,應(yīng)該重點(diǎn)關(guān)注,分析原因,積極進(jìn)行關(guān)系恢復(fù)根據(jù)航空公司的特點(diǎn),使用L、R、F、M、C五個(gè)指標(biāo),可以將航空公司的常旅客群體劃分成空公司常旅客細(xì)分及關(guān)系發(fā)展策略如圖8所示。中司的潛價(jià)值客戶,占有較潛力。航空公司要努中司的潛價(jià)值客戶,占有較潛力。航空公司要努

航空公司可以采取的措施主要有以下幾種((3)通(是否經(jīng)(是否經(jīng)常在合作伙伴處,提高這類(lèi)客戶的忠誠(chéng)度與滿意度,盡可能延長(zhǎng)這類(lèi)客戶的高水平消費(fèi)重要挽留客這類(lèi)客戶過(guò)去所乘航班的艙位等級(jí)(C、乘坐頻率(F)或者里程(M)較高,但是較長(zhǎng)時(shí)間已經(jīng)沒(méi)有乘坐本公司的航班(R高)或是乘坐頻率明顯下降。他們客戶價(jià)值變化的不確定性很高。由K-均值聚類(lèi)法對(duì)客戶進(jìn)行聚類(lèi)。使用K-均值聚類(lèi)法時(shí),需要預(yù)先判斷其聚類(lèi)的類(lèi)別數(shù)。本模型中通過(guò)每個(gè)客L、R、F、M、C平均值與總L、R、F、M、C均值相比較來(lái)決定的,而單個(gè)值的比較只能有兩種情況:大于(等于)或小于平均值,因此可能有2×2×2×2×2=32種類(lèi)點(diǎn)參見(jiàn)圖9。通過(guò)L、R、F、M、C分析可將航空公司的客戶群體劃分成重要保持客戶、重要發(fā)展客戶要挽留客戶、忠誠(chéng)型一般客戶、低價(jià)值客戶等五個(gè)級(jí)別利用AHP法分析得到的LRFMC各指標(biāo)權(quán)重,結(jié)合各組客戶的LRFMC指標(biāo)值,可以計(jì)算每一第j組客戶的客戶價(jià)值用表示,計(jì)算方法如式所示其中:分別為第j組客戶聚類(lèi)中心的L、R、F、M、C指標(biāo)標(biāo)準(zhǔn)化后的值,j=1,2,...,32表示聚類(lèi)后的組別, 分別為由AHP法分析得來(lái)的L、R、F、M、C指標(biāo)的權(quán)重。對(duì)于航空公司來(lái)說(shuō)更為重要。這樣相對(duì)于單純采用LRFMC聚類(lèi)分析法更具有意義。使用航空公司62988名常旅客200641200841L、R、F、M、C值原始數(shù)據(jù)總數(shù)結(jié)結(jié)果如 航空公司常旅客樣本數(shù)據(jù)分此外,第6組客戶原本應(yīng)該判斷為重要發(fā)展客戶,但由于該組客戶的C值雖然高于均值,卻析析:重要保持客戶603人(原始樣本的8818人,占總?cè)藬?shù)的重要挽留客戶289人(原始樣本的4409人,占總?cè)藬?shù)的重要發(fā)展客戶675人(原始樣本的10708人占總?cè)藬?shù)的一般客戶和低價(jià)值客戶2513人(原始樣本的39053人62%結(jié)合航空公司客戶的特點(diǎn),使用了對(duì)傳統(tǒng)RFM指標(biāo)進(jìn)行改進(jìn)的LRFMC指標(biāo)作為航空公司結(jié)合客戶生命周期理論,提出不同細(xì)分客戶群的管理策略,為航空公司的常旅客細(xì)分理提供參由于客觀原因的存在,準(zhǔn)確計(jì)算客戶的價(jià)值具有一定戶群體的價(jià)值所在,能讓航判斷公司會(huì)員的價(jià)值高低,從而提供相應(yīng)的服務(wù),提高公司的效益航空公司客戶價(jià)值所參考的會(huì)員入會(huì)時(shí)間距今月數(shù)、客戶最后一次乘機(jī)時(shí)間距今月數(shù)、客戶在觀測(cè)窗口內(nèi)乘機(jī)次數(shù)研究中,為了全面、系統(tǒng)地分析問(wèn)題,須考慮眾多影響因素。因?yàn)槊總€(gè)變量都在不同程度上一定程度上有。在用統(tǒng)計(jì)方法研究多變量問(wèn)題時(shí),變量太多會(huì)增加計(jì)算量和增加分析問(wèn)題的復(fù)客戶價(jià)值模型采用主成分分析,過(guò)程如下2MrMrLMrpRrij(i,j=1,2,…,p)為原變量xi與xj的相關(guān)系數(shù),rij=rji,其計(jì)

n∑(xkixi)(xkjxj kL0 p(i12,Lpei=1∑pe1其中e表示向量e2i雅對(duì)j雅對(duì)j個(gè)分量貢獻(xiàn)率 ∑∑k

(i1,2,L,kii∑p累計(jì)貢獻(xiàn)率:p∑k

(i1,2,L, 個(gè)主ilijp(zi,xj) eij(i,j1,2,L,i Z n 從客戶細(xì)分模型的結(jié)果出發(fā),隨機(jī)抽出大約4000條,將他們按細(xì)分模型的結(jié)果劃分后一次乘機(jī)時(shí)間距今月數(shù)(R)后一次乘機(jī)時(shí)間距今月數(shù)(R)(FFP_TIER(BSE_OINTS_SUM總(WEIGHTED_SEG_KMT_INTERAL間隔(MAX_FLIGHT_INTERVAL合作伙伴、促銷(xiāo)、外航轉(zhuǎn)入等均乘機(jī)時(shí)間間隔觀測(cè)窗口中其他積分(ADD_POINTS_SUM、非乘機(jī)積分總和(Eli_Add_Point_Sum均乘機(jī)時(shí)間間隔觀測(cè)窗口中其他積分(PointChgNotligh得樣本數(shù)據(jù)如圖12、圖13所示。陣如圖14和圖15所示。圖差分解主成分提取分析表(圖16)可知,提取的主成分為2個(gè),即m=2。解釋的總方成初始特征提取平方合方差的累積合方差的累積123456789-4.011E--2.865E--1.159E--8.275E--2.003E--1.431E--2.994E--2.139E--3.423E--2.445E--6.694E--4.782E-窗、明第一主成分基本反映了這窗、明第一主成分基本反映了這

測(cè)窗口內(nèi)乘坐艙位所對(duì)應(yīng)的折扣標(biāo)的信息;客戶在觀測(cè)窗口內(nèi)乘坐但這兩個(gè)新變量的表達(dá)還不能從輸出窗口中直接得到,因?yàn)椤癈omponentMatrix”是指初始因子載成份矩L0R--F--M--C--------0--圖便得到兩個(gè)主成分中每個(gè)指標(biāo)所對(duì)應(yīng)的系數(shù)(17A1和A2列)Step5:將得到的特征向量與標(biāo)準(zhǔn)化后的數(shù)據(jù)相乘,然后就可以得出主成分表達(dá)圖圖即可得到主成分綜合模型群進(jìn)行綜合評(píng)分比較,結(jié)果見(jiàn)圖19。-5-4-321上面用主成分分析對(duì)航空公司5同的客戶群做了價(jià)值評(píng)估,找到了評(píng)價(jià)客戶價(jià)值的關(guān)鍵7.1客戶流失是客戶關(guān)系管理中在、通信等行業(yè)已有研究;標(biāo)重要問(wèn)題之一。客戶流失標(biāo)重要問(wèn)題之一??蛻袅魇Ыj(luò)的條件下,半年時(shí)間內(nèi)沒(méi)有購(gòu)票行為的常旅客一般來(lái)說(shuō),客戶流失可以分為自愿流失和非自愿本部分主要解決以下幾方面內(nèi)容覆蓋綜合上述情況,建立流失模型以?xún)赡陜?nèi)老客戶情況的80%為訓(xùn)練樣本,20%數(shù)據(jù)作為檢測(cè)樣本,建立客戶流失模型總結(jié)兩年內(nèi)各類(lèi)客戶流失的共性與特性本模型的目標(biāo)確定為:針對(duì)目前老客戶進(jìn)行流失狀態(tài)的預(yù)測(cè)。航空老客戶流失狀態(tài)有三類(lèi)50%,90%于90%本質(zhì)上,航空客戶流失問(wèn)題定性為數(shù)據(jù)挖掘中的分類(lèi)定性為數(shù)據(jù)挖掘中的分類(lèi)依據(jù)該模型預(yù)測(cè)未來(lái)客戶數(shù)據(jù)基本信息描述及數(shù)據(jù)準(zhǔn)對(duì)表中的空缺值不做任何處理平滑:消除數(shù)據(jù)中的噪:對(duì)數(shù)據(jù)進(jìn)行和匯概化:使用概念分層,用次概念替換“原始”的低層次的數(shù)規(guī)范化:將屬性數(shù)據(jù)按比例縮放,使其落入一個(gè)小的特定區(qū)屬性構(gòu)造:構(gòu)造新的屬性并添加到屬性集中,幫助挖具體的計(jì)算方第第二年相對(duì)第一年乘機(jī)比例 第單位里程票價(jià)=總票價(jià)/總里另外,標(biāo)識(shí)一個(gè)客戶的維度主要有:會(huì)員號(hào) 0.5的客戶為流失(loss,0.5~0.9則為準(zhǔn)流失(likelyloss出客戶是否具有流失可能性。分析客戶流失問(wèn)題的主要模型是分類(lèi)(預(yù)測(cè))模型,①?zèng)Q策樹(shù)(DT)分②神經(jīng)網(wǎng)絡(luò)(NN)分神經(jīng)網(wǎng)絡(luò)是一組連接的輸入、輸出單元,其中每個(gè)連接都有一個(gè)值。神經(jīng)網(wǎng)絡(luò)的分類(lèi)知識(shí)體現(xiàn)在網(wǎng)絡(luò)連接上,被隱式地在連接的權(quán)值中。神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)過(guò)程是通過(guò)迭代運(yùn)算對(duì)權(quán)值不斷進(jìn)行調(diào)整的過(guò)程。學(xué)習(xí)的目標(biāo)就是通過(guò)權(quán)值的調(diào)整使輸入元組被正確的標(biāo)號(hào)。典型的神經(jīng)網(wǎng)絡(luò)有Hopfield網(wǎng)絡(luò),BP網(wǎng)絡(luò),M和ART網(wǎng)絡(luò)。和其它分類(lèi)技術(shù)進(jìn)行比較,神經(jīng)網(wǎng)絡(luò)能適應(yīng)于大多數(shù)只環(huán)境,間存 能信息處理能力和模擬人腦智能字電子計(jì)算機(jī)的局限,標(biāo)志著人類(lèi)絡(luò)技術(shù)被普遍地用于信用額統(tǒng)的以線性處理統(tǒng)的以線性處理為基礎(chǔ)為能力的一大飛躍。神經(jīng)客戶流失分析具有以下一些性的特點(diǎn)(1)量大、邏輯復(fù)雜,使用歷史數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘的結(jié)果往往存在較大的偏差始數(shù)據(jù)進(jìn)行處理,通常需要花費(fèi)整個(gè)項(xiàng)50%~80%的時(shí)間;留措施,還需要考慮到客戶挽留價(jià)值和成本收益的問(wèn)題;我們的航空客戶流失的模型總體結(jié)構(gòu)如圖20析法,以?xún)赡陜?nèi)的航空老客戶為例根據(jù)兩年內(nèi)能分模決策樹(shù)分 模BPBP神經(jīng)網(wǎng) 76.92前面已經(jīng)提到,由失預(yù)測(cè)問(wèn)題數(shù)據(jù)量大、數(shù)據(jù)極不平衡的特殊性,傳統(tǒng)分類(lèi)算法應(yīng)用據(jù)集稱(chēng)為不平衡數(shù)據(jù)集。不平衡數(shù)據(jù)集的分類(lèi)問(wèn)題大量存在失預(yù)測(cè)問(wèn)題之中。對(duì)于航空客戶,神經(jīng)網(wǎng)絡(luò)示意圖考慮到?jīng)Q策樹(shù)分類(lèi)結(jié)果現(xiàn)直觀、可解釋強(qiáng)的優(yōu)點(diǎn),模型將兩年內(nèi)的客戶乘機(jī)情況為航空老客構(gòu)建決策樹(shù),采用其中80%的數(shù) 。決策樹(shù)算法采用的是傳統(tǒng)的算法,為了避免現(xiàn)實(shí)中流失客戶 一棵空決策樹(shù)的問(wèn)題,模型采用機(jī)采樣平衡的方式,本地訓(xùn)練數(shù)量別進(jìn)行訓(xùn)練。訓(xùn)練后輸出的樹(shù)形如圖23

地客戶每種類(lèi)別隨機(jī)300平均乘機(jī)時(shí)間間隔 流失:-非乘機(jī)積分總和: 準(zhǔn)流失會(huì)員卡等級(jí):B 平均折扣率:C--AO-1CA--BAA0D1A4 <0.408>=0.4081C1C101-10A1-1-1平均乘機(jī)時(shí)間間14.034模式未流非乘機(jī)積0流非乘機(jī)積0and機(jī)積分總3,068非乘機(jī)積分總和>3,068[模式:未流失]會(huì)員卡級(jí)別=

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論