大數(shù)據(jù)挖掘v02_20130220資料_第1頁(yè)
大數(shù)據(jù)挖掘v02_20130220資料_第2頁(yè)
大數(shù)據(jù)挖掘v02_20130220資料_第3頁(yè)
大數(shù)據(jù)挖掘v02_20130220資料_第4頁(yè)
大數(shù)據(jù)挖掘v02_20130220資料_第5頁(yè)
已閱讀5頁(yè),還剩28頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、大數(shù)據(jù)挖掘平臺(tái)(pngti)2012年12月內(nèi)部資料 注意(zh y)保密共三十三頁(yè)目錄(ml)大數(shù)據(jù)挖掘平臺(tái)總體(zngt)架構(gòu)數(shù)據(jù)來(lái)源平臺(tái)功能大數(shù)據(jù)挖掘平臺(tái)的數(shù)據(jù)數(shù)據(jù)安全面臨困難共三十三頁(yè)精細(xì)化運(yùn)營(yíng)(ynyng)總體架構(gòu)視圖層即時(shí)通類(lèi)流媒體類(lèi)網(wǎng)頁(yè)(wn y)類(lèi)彩信類(lèi)互聯(lián)網(wǎng)O域數(shù)據(jù)訂購(gòu)信息消費(fèi)信息三戶(hù)信息使用信息客戶(hù)B域數(shù)據(jù)用戶(hù)上網(wǎng)匯總營(yíng)銷(xiāo)活動(dòng)類(lèi)報(bào)表展示類(lèi)流量運(yùn)營(yíng)類(lèi)其他類(lèi)立方體層客戶(hù)標(biāo)簽客戶(hù)畫(huà)像流量實(shí)時(shí)分析營(yíng)銷(xiāo)活動(dòng)支撐助銷(xiāo)系統(tǒng)其他應(yīng)用層DM層DWADWD層終端信息繳費(fèi)信息P2P類(lèi)郵箱類(lèi)VOIP類(lèi)其他類(lèi)客戶(hù)域用戶(hù)關(guān)鍵字用戶(hù)基本信息URL規(guī)則庫(kù)應(yīng)用規(guī)則庫(kù)產(chǎn)品域關(guān)鍵詞庫(kù)產(chǎn)品訂購(gòu)匯總網(wǎng)頁(yè)瀏覽匯總應(yīng)用

2、使用匯總使用域搜索引擎匯總上網(wǎng)流量匯總基站流量匯總終端流量匯總資源域基站話務(wù)匯總指標(biāo)層用戶(hù)類(lèi)收入類(lèi)使用類(lèi)資源類(lèi)營(yíng)銷(xiāo)類(lèi)基本信息上網(wǎng)喜好行為特征終端屬性接觸信息其他類(lèi)其他信息共三十三頁(yè)目錄(ml)大數(shù)據(jù)挖掘平臺(tái)(pngti)總體架構(gòu)數(shù)據(jù)來(lái)源平臺(tái)功能大數(shù)據(jù)挖掘平臺(tái)的數(shù)據(jù)數(shù)據(jù)安全面臨困難共三十三頁(yè)數(shù)據(jù)(shj)分類(lèi)分類(lèi)數(shù)據(jù)描述舉例采集周期BSS側(cè)數(shù)據(jù)用戶(hù)基本屬性性別、年齡、入網(wǎng)時(shí)長(zhǎng)、住址等;日產(chǎn)品訂購(gòu)信息套餐、增值業(yè)務(wù)訂購(gòu)等日業(yè)務(wù)使用行為語(yǔ)音使用、流量使用、增值業(yè)務(wù)使用等;日用戶(hù)收入信息ARPU、欠費(fèi)、繳費(fèi)等日用戶(hù)接觸信息投訴、咨詢(xún)等;日DM側(cè)數(shù)據(jù)用戶(hù)終端信息操作系統(tǒng)、支撐能力等;日終端與用戶(hù)匹配信息

3、用戶(hù)手機(jī)號(hào)、終端類(lèi)型日GN側(cè)數(shù)據(jù)用戶(hù)上網(wǎng)行為上網(wǎng)時(shí)間、基站、訪問(wèn)URL、客戶(hù)端等1分鐘寬帶數(shù)據(jù)寬帶上網(wǎng)行為上網(wǎng)時(shí)間、地址、訪問(wèn)URL、客戶(hù)端等1分鐘位置信息用戶(hù)位置變得信息小區(qū)、基站、時(shí)間等1分鐘WIFI側(cè)數(shù)據(jù)WIFI上網(wǎng)行為上網(wǎng)時(shí)間、訪問(wèn)URL、客戶(hù)端等1分鐘暫未接入共三十三頁(yè)互聯(lián)網(wǎng)數(shù)據(jù)(shj)采集(Gn數(shù)據(jù)采集)共三十三頁(yè)平臺(tái)數(shù)據(jù)(shj)來(lái)源及處理流程原始數(shù)據(jù)數(shù)據(jù)(shj)沉淀數(shù)據(jù)挖掘分析流量營(yíng)銷(xiāo)數(shù)據(jù)集市(DM)數(shù)據(jù)服務(wù)對(duì)外數(shù)據(jù)服務(wù)通道輸出標(biāo)準(zhǔn)APIFTP服務(wù)WEBSERVICE手機(jī)上網(wǎng)數(shù)據(jù)WIFI上網(wǎng)數(shù)據(jù)分組域GN數(shù)據(jù)電路域LBS數(shù)據(jù)網(wǎng)元側(cè)信息終端屬性信息用戶(hù)終端機(jī)型信息終端信息產(chǎn)品

4、訂購(gòu)信息增值業(yè)務(wù)歸類(lèi)客戶(hù)基本信息用戶(hù)收入信息客戶(hù)基本信息Wifi數(shù)據(jù)固網(wǎng)寬帶數(shù)據(jù)固話通話數(shù)據(jù)固網(wǎng)側(cè)信息互聯(lián)網(wǎng)網(wǎng)站信息互聯(lián)網(wǎng)應(yīng)用軟件信息互聯(lián)網(wǎng)內(nèi)容庫(kù)互聯(lián)網(wǎng)內(nèi)容產(chǎn)品域客戶(hù)域事件域計(jì)費(fèi)域資源域帳務(wù)域市場(chǎng)營(yíng)銷(xiāo)域客戶(hù)投訴信息客戶(hù)咨詢(xún)信息投訴信息抽取模型算法核心積累庫(kù)聚類(lèi)分析神經(jīng)網(wǎng)絡(luò)關(guān)聯(lián)規(guī)則統(tǒng)計(jì)識(shí)別決策樹(shù)對(duì)外服務(wù)數(shù)據(jù)信息客戶(hù)標(biāo)簽庫(kù)產(chǎn)品標(biāo)簽庫(kù)URL/APP識(shí)別庫(kù)營(yíng)銷(xiāo)客戶(hù)群互聯(lián)網(wǎng)實(shí)時(shí)熱點(diǎn)萬(wàn)粉微博號(hào)碼識(shí)別結(jié)構(gòu)化數(shù)據(jù)非結(jié)構(gòu)化數(shù)據(jù)寬帶上網(wǎng)數(shù)據(jù)微博傳播節(jié)點(diǎn)識(shí)別Web網(wǎng)頁(yè)數(shù)據(jù)采集大數(shù)據(jù)平臺(tái)倉(cāng)庫(kù)對(duì)外服務(wù)互聯(lián)網(wǎng)數(shù)據(jù)紅色為目前未接入數(shù)據(jù)采集廣告投放渠道匹配共三十三頁(yè)目錄(ml)大數(shù)據(jù)挖掘平臺(tái)總體(zngt)架構(gòu)數(shù)據(jù)來(lái)源平臺(tái)功

5、能大數(shù)據(jù)挖掘平臺(tái)的數(shù)據(jù)數(shù)據(jù)安全面臨困難共三十三頁(yè)9客戶(hù)畫(huà)像(hu xing)打標(biāo)簽互聯(lián)網(wǎng)內(nèi)容挖掘(wju)分析客戶(hù)價(jià)值產(chǎn)品需求終端屬性行為特征渠道偏好生活軌跡客戶(hù)喜好人文特征增值收入總體收入音樂(lè)收入潛在價(jià)值業(yè)務(wù)訂購(gòu)訂購(gòu)特征退訂特征捆綁類(lèi)型屏幕大小業(yè)務(wù)支持IPhoneAndroid語(yǔ)音行為短信行為彩信行為綜合使用繳費(fèi)渠道訂購(gòu)渠道接觸偏好營(yíng)銷(xiāo)接受時(shí)尚軌跡運(yùn)動(dòng)軌跡生活軌跡購(gòu)物軌跡性 別入網(wǎng)方式姓 名客戶(hù)級(jí)別入網(wǎng)時(shí)間入網(wǎng)套餐音樂(lè)喜好視頻喜好小說(shuō)喜好資訊瀏覽社交通信網(wǎng)上購(gòu)物聚類(lèi)分析算法邏輯回歸模型梯度營(yíng)銷(xiāo)模型動(dòng)態(tài)價(jià)值模型其他統(tǒng)計(jì)算法神經(jīng)網(wǎng)絡(luò)算法線性回歸算法關(guān)聯(lián)分析算法關(guān)鍵詞庫(kù)內(nèi)容分類(lèi)庫(kù)熱門(mén)詞庫(kù)客戶(hù)喜好數(shù)

6、據(jù)倉(cāng)庫(kù)基本信息終端信息業(yè)務(wù)訂購(gòu)業(yè)務(wù)使用業(yè)務(wù)收入客戶(hù)接觸手機(jī)上網(wǎng)數(shù)據(jù)輸出客戶(hù)標(biāo)簽庫(kù)用戶(hù)關(guān)鍵詞庫(kù)互聯(lián)網(wǎng)內(nèi)容分類(lèi)近期熱門(mén)詞庫(kù)網(wǎng)站統(tǒng)計(jì)信息單一客戶(hù)視圖應(yīng)用統(tǒng)計(jì)信息系統(tǒng)功能管道可視化搜索引擎網(wǎng)站統(tǒng)計(jì)應(yīng)用統(tǒng)計(jì)管道可視化網(wǎng)絡(luò)爬蟲(chóng)中文分詞文本分類(lèi)統(tǒng)計(jì)識(shí)別關(guān)聯(lián)規(guī)則分詞庫(kù)數(shù)據(jù)倉(cāng)庫(kù)已經(jīng)規(guī)劃,需要盡快完善補(bǔ)充 客戶(hù)視圖基本信息訂購(gòu)信息消費(fèi)信息終端信息使用信息接觸信息客戶(hù)喜好共三十三頁(yè)1、客戶(hù)畫(huà)像客觀視圖(sht)與主觀視圖(sht)結(jié)合用戶(hù)(yngh)喜好客服評(píng)價(jià)增值訂購(gòu)新增客戶(hù)視圖是在經(jīng)分客觀的客戶(hù)視圖基礎(chǔ)上,結(jié)合對(duì)客戶(hù)興趣喜好的主觀評(píng)價(jià)標(biāo)簽,形成客觀與主觀結(jié)合的360度營(yíng)銷(xiāo)視圖;客戶(hù)畫(huà)像比單純的客觀視圖更全面、更

7、有指導(dǎo)意義??蛻?hù)標(biāo)簽共三十三頁(yè)2、客戶(hù)群提取(tq)每個(gè)標(biāo)簽(bioqin)用戶(hù)數(shù),右鍵看該標(biāo)簽(bioqin)說(shuō)明經(jīng)分?jǐn)?shù)據(jù)網(wǎng)元數(shù)據(jù)客戶(hù)標(biāo)簽樹(shù):是基于客戶(hù)細(xì)分分析結(jié)果,構(gòu)建生成客戶(hù)標(biāo)簽庫(kù),包括人文特征、客戶(hù)價(jià)值、產(chǎn)品需求、終端屬性、行為特征、客戶(hù)服務(wù)、客戶(hù)喜好、客戶(hù)生活軌跡、客戶(hù)關(guān)系圈、渠道接觸偏好等10大類(lèi)一級(jí)架構(gòu),300多個(gè)標(biāo)簽;基于一級(jí)架構(gòu)保持業(yè)務(wù)框架的穩(wěn)定性,保證標(biāo)簽擴(kuò)展有理可依、有序進(jìn)行。共三十三頁(yè)3、基于網(wǎng)絡(luò)(wnglu)爬蟲(chóng)的互聯(lián)網(wǎng)分析通過(guò)對(duì)GGSN手機(jī)用戶(hù)上網(wǎng)信息采集與解碼能對(duì)用戶(hù)上網(wǎng)的基本行為進(jìn)行分析(fnx),比如用戶(hù)手機(jī)終端識(shí)別分析(fnx)、用戶(hù)上網(wǎng)時(shí)段分析(fnx)、

8、用戶(hù)上網(wǎng)流量分析(fnx)等。但我們無(wú)法深層次對(duì)用戶(hù)訪問(wèn)的網(wǎng)站、URL進(jìn)行分析,進(jìn)而分析用戶(hù)的喜好(用戶(hù)上網(wǎng)是看小說(shuō)?找音樂(lè)?看電視?)。通過(guò)搜索引擎技術(shù)我們可以對(duì)用戶(hù)訪問(wèn)的網(wǎng)站、URL進(jìn)行分析歸類(lèi)從而發(fā)現(xiàn)用戶(hù)最終的上網(wǎng)目前即用戶(hù)的喜好。 網(wǎng)絡(luò)爬蟲(chóng)(又被稱(chēng)為 網(wǎng)頁(yè)蜘蛛,網(wǎng)絡(luò)機(jī)器人,在FOAF社區(qū)中間,更經(jīng)常的稱(chēng)為網(wǎng)頁(yè)追逐者),是一種按照一定的規(guī)則,自動(dòng)的抓取萬(wàn)維網(wǎng)信息的程序或者腳本。另外一些不常使用的名字還有螞蟻,自動(dòng)索引,模擬程序或者蠕蟲(chóng)。 對(duì)用戶(hù)訪問(wèn)過(guò)的URL進(jìn)行歸類(lèi)標(biāo)記使用網(wǎng)絡(luò)爬蟲(chóng)對(duì)用戶(hù)訪問(wèn)URL進(jìn)行抓取獲取其網(wǎng)絡(luò)地址的title、關(guān)鍵字等進(jìn)行歸類(lèi)標(biāo)識(shí)URL訪問(wèn)分析網(wǎng)站Title、關(guān)鍵字

9、分析 對(duì)用戶(hù)訪問(wèn)過(guò)的網(wǎng)站域名進(jìn)行歸類(lèi)標(biāo)記域名網(wǎng)站分析通過(guò)三個(gè)層次的分析,對(duì)用戶(hù)訪問(wèn)網(wǎng)站域名,URL進(jìn)行標(biāo)記,能夠有效的檢索出用戶(hù)的喜好共三十三頁(yè)用戶(hù)上網(wǎng)(shn wn)行為-關(guān)鍵字搜索實(shí)時(shí)反應(yīng)當(dāng)天(dngtin)互聯(lián)網(wǎng)詞庫(kù)熱度變化情況。關(guān)鍵詞 訪問(wèn)量(次)用戶(hù)數(shù)(戶(hù))流量(M)戶(hù)均訪問(wèn)量戶(hù)均訪問(wèn)量(次)天氣14922937062448.51 0.01 4.03 北京5691481880.28 0.02 1.18 百度608134681666.94 0.48 1.75 武動(dòng)乾坤52772910113.07 0.04 1.81 違章查詢(xún)助手3012282633.28 0.01 1.07 北京天氣5

10、9042580100.86 0.04 2.29 雙色球36152520123.06 0.05 1.43 遮天4656236189.51 0.04 1.97 天氣預(yù)報(bào)2814181557.21 0.03 1.55 凡人修仙傳3210168668.29 0.04 1.90 總計(jì)189489620462781.01 0.76 18.99 2012年10月25日共三十三頁(yè)流量(liling)分析流量分析:系統(tǒng)分別成應(yīng)用、網(wǎng)站、時(shí)間、地域(dy)、用戶(hù)數(shù)據(jù)、流量等緯度對(duì)手機(jī)上網(wǎng)用戶(hù)進(jìn)行了深入分析。共三十三頁(yè)4、業(yè)務(wù)(yw)監(jiān)控業(yè)務(wù)監(jiān)控:系統(tǒng)對(duì)重點(diǎn)的業(yè)務(wù)進(jìn)行實(shí)時(shí)的監(jiān)控和分析,包括收入分析、地域(dy)分析

11、(風(fēng)險(xiǎn)過(guò)大? )、基站分析、KPI分析等等。(目前基站位置信息來(lái)源于經(jīng)分,但是不全,所以不準(zhǔn)確)共三十三頁(yè)5、助銷(xiāo)平臺(tái)(pngti)16辦理(bnl)業(yè)務(wù)客戶(hù)1數(shù)據(jù)共享(推薦產(chǎn)品列表)推薦產(chǎn)品查詢(xún)將營(yíng)銷(xiāo)結(jié)果反饋給系統(tǒng)我們最近推出了手機(jī)電視業(yè)務(wù)1860000 xxxx助銷(xiāo)平臺(tái),是在營(yíng)業(yè)廳、賣(mài)場(chǎng)接觸用戶(hù)的短時(shí)間內(nèi),通過(guò)數(shù)據(jù)服務(wù)通道獲取適合該用戶(hù)的增值業(yè)務(wù)和應(yīng)用軟件等,抓住機(jī)會(huì)對(duì)客戶(hù)進(jìn)行針對(duì)性銷(xiāo)售,提升銷(xiāo)售命中率。助銷(xiāo)平臺(tái)包括營(yíng)業(yè)廳版、手機(jī)版、PAD版等。IPHONEANDROIDIPAD引導(dǎo)推薦平臺(tái)4依據(jù)用戶(hù)行為分析與業(yè)務(wù)產(chǎn)品匹配,得到適合推薦給用戶(hù)的產(chǎn)品列表,通過(guò)數(shù)據(jù)服務(wù)通道傳給前臺(tái)。數(shù)據(jù)服務(wù)通

12、道自有業(yè)務(wù)短信包流量包彩信包SP業(yè)務(wù)北京晚報(bào)京華時(shí)報(bào)32精細(xì)化運(yùn)營(yíng)平臺(tái)共三十三頁(yè)6、周邊系統(tǒng)(xtng)及營(yíng)銷(xiāo)活動(dòng)支撐3G加油站平臺(tái)智能云管家動(dòng)漫游戲平臺(tái)網(wǎng)格經(jīng)理平臺(tái)各類(lèi)分析報(bào)告上百次助銷(xiāo)系統(tǒng)PUSH精準(zhǔn)推送平臺(tái)業(yè)務(wù)(yw)監(jiān)控:系統(tǒng)同時(shí)實(shí)現(xiàn)了助銷(xiāo)系統(tǒng)、網(wǎng)格盡量、Push精準(zhǔn)推送平臺(tái)等多各平臺(tái)數(shù)據(jù)的實(shí)時(shí)支撐。共三十三頁(yè)P(yáng)USH運(yùn)營(yíng)(ynyng)平臺(tái)發(fā)送(f sn)模塊運(yùn)營(yíng)策劃數(shù)據(jù)導(dǎo)入流程管控能力管控Push 發(fā)送用戶(hù)端代理模塊用戶(hù)匹配終端匹配個(gè)性頁(yè)面適配行為記錄統(tǒng)計(jì)模塊效果評(píng)估用戶(hù)行為分析發(fā)送情況統(tǒng)計(jì)35DBLINK文本導(dǎo)入不使用代理使用代理6頁(yè)面展示PUSH運(yùn)營(yíng)平臺(tái),分為三部分:發(fā)送模塊,保

13、證PUSH按計(jì)劃進(jìn)行發(fā)送,包括策劃、數(shù)據(jù)導(dǎo)入、黑紅名單過(guò)濾、能力管控等;代理模塊,實(shí)現(xiàn)個(gè)性化的PUSH頁(yè)面引導(dǎo)用戶(hù)駐留,包括頁(yè)面配置、NET計(jì)費(fèi)、行為記錄等;統(tǒng)計(jì)模塊,對(duì)運(yùn)營(yíng)效果進(jìn)行統(tǒng)計(jì)評(píng)估,包括發(fā)送統(tǒng)計(jì)、用戶(hù)行為分析、運(yùn)營(yíng)效果評(píng)估等。 每日發(fā)送能力達(dá)到200萬(wàn)條(9:3019:00);平均每包發(fā)送20萬(wàn)左右,分為510個(gè)精細(xì)化數(shù)據(jù)包。通過(guò)net計(jì)費(fèi)接口獲取用戶(hù)手機(jī)號(hào)碼、通過(guò)終端數(shù)據(jù)獲取用戶(hù)終端數(shù)據(jù),為用戶(hù)展示個(gè)性化頁(yè)面。計(jì)算現(xiàn)有通道的能力和已有計(jì)劃的排列,測(cè)算發(fā)送能力124根據(jù)運(yùn)營(yíng)活動(dòng)實(shí)際需求可以靈活的選取是否進(jìn)行個(gè)性化的頁(yè)面PUSH。5發(fā)送訪問(wèn)數(shù)據(jù)發(fā)送Wap Push共三十三頁(yè)營(yíng)銷(xiāo)(yn

14、xio)活動(dòng)支撐業(yè)務(wù)(yw)監(jiān)控:系統(tǒng)累計(jì)支撐各類(lèi)營(yíng)銷(xiāo)運(yùn)營(yíng)活動(dòng)上百次,臨時(shí)數(shù)據(jù)提取分析5百次以上。共三十三頁(yè)目錄(ml)大數(shù)據(jù)挖掘平臺(tái)(pngti)總體架構(gòu)數(shù)據(jù)來(lái)源平臺(tái)功能大數(shù)據(jù)挖掘平臺(tái)的數(shù)據(jù)數(shù)據(jù)安全面臨困難共三十三頁(yè)經(jīng)分?jǐn)?shù)據(jù)總體(zngt)介紹大數(shù)據(jù)平臺(tái)已經(jīng)接入了經(jīng)分很大部分的數(shù)據(jù),如有必要我們可以繼而經(jīng)分更多的數(shù)據(jù),因此(ync)大數(shù)據(jù)平臺(tái)理論上可以完成經(jīng)分系統(tǒng)目前所有的數(shù)據(jù)提取和挖掘功能。它具備如下數(shù)據(jù)內(nèi)容:用戶(hù)的基礎(chǔ)信息用戶(hù)產(chǎn)品訂購(gòu)信息用戶(hù)的收入信息用戶(hù)業(yè)務(wù)使用信息共三十三頁(yè)經(jīng)分基礎(chǔ)(jch)信息信息分類(lèi)數(shù)據(jù)信息客戶(hù)信息業(yè)務(wù)類(lèi)型、客戶(hù)類(lèi)型、客戶(hù)級(jí)別、客戶(hù)狀態(tài)、支付方式、入網(wǎng)渠道、性別、

15、證件類(lèi)型、證件號(hào)碼、名稱(chēng)、入網(wǎng)日期、歸屬區(qū)域、聯(lián)系人姓名、聯(lián)系人地址、信用度等賬戶(hù)信息賬戶(hù)標(biāo)識(shí)、客戶(hù)標(biāo)識(shí)、賬單地址、繳費(fèi)類(lèi)型、賬戶(hù)信用度、賬戶(hù)名稱(chēng)、賬戶(hù)余額、賬戶(hù)狀態(tài)、建立日期等用戶(hù)信息歸屬區(qū)域、業(yè)務(wù)類(lèi)型、入網(wǎng)渠道、用戶(hù)狀態(tài)、停機(jī)方式、入網(wǎng)時(shí)間、用戶(hù)標(biāo)識(shí)、客戶(hù)標(biāo)識(shí)、賬戶(hù)標(biāo)識(shí)、集團(tuán)標(biāo)識(shí)、用戶(hù)信用度、品牌類(lèi)型等共三十三頁(yè)產(chǎn)品(chnpn)訂購(gòu)信息信息分類(lèi)數(shù)據(jù)信息用戶(hù)套餐信息用戶(hù)標(biāo)識(shí)、業(yè)務(wù)標(biāo)識(shí)、用戶(hù)套餐、語(yǔ)音服務(wù)計(jì)劃標(biāo)識(shí)、數(shù)據(jù)服務(wù)計(jì)劃標(biāo)識(shí)等用戶(hù)營(yíng)銷(xiāo)計(jì)劃信息用戶(hù)標(biāo)識(shí)、營(yíng)銷(xiāo)計(jì)劃項(xiàng)目標(biāo)識(shí)、營(yíng)銷(xiāo)計(jì)劃標(biāo)識(shí)、生效日期、失效日期、業(yè)務(wù)標(biāo)識(shí)等用戶(hù)服務(wù)計(jì)劃信息用戶(hù)標(biāo)識(shí)、服務(wù)計(jì)劃標(biāo)識(shí)、服務(wù)計(jì)劃包標(biāo)識(shí)、生效標(biāo)識(shí)、失效標(biāo)識(shí)

16、、業(yè)務(wù)標(biāo)識(shí)等共三十三頁(yè)收入(shur)信息信息分類(lèi)數(shù)據(jù)信息應(yīng)收信息賬務(wù)月份、業(yè)務(wù)類(lèi)型、費(fèi)用類(lèi)型、客戶(hù)標(biāo)識(shí)、賬戶(hù)標(biāo)識(shí)、用戶(hù)標(biāo)識(shí)、業(yè)務(wù)標(biāo)識(shí)、應(yīng)收金額、實(shí)收金額、調(diào)賬金額等欠費(fèi)信息賬務(wù)月份、業(yè)務(wù)類(lèi)型、費(fèi)用類(lèi)型、客戶(hù)標(biāo)識(shí)、賬戶(hù)標(biāo)識(shí)、用戶(hù)標(biāo)識(shí)、業(yè)務(wù)標(biāo)識(shí)、欠費(fèi)金額用戶(hù)繳費(fèi)信息賬務(wù)月份、業(yè)務(wù)類(lèi)型、繳費(fèi)類(lèi)別、賬戶(hù)類(lèi)型、繳費(fèi)途徑、繳費(fèi)方式、業(yè)務(wù)標(biāo)識(shí)、客戶(hù)標(biāo)識(shí)、賬戶(hù)標(biāo)識(shí)、用戶(hù)標(biāo)識(shí)、業(yè)務(wù)標(biāo)識(shí)共三十三頁(yè)業(yè)務(wù)使用(shyng)信息信息分類(lèi)數(shù)據(jù)信息語(yǔ)音使用信息用戶(hù)標(biāo)識(shí)、本方號(hào)碼、對(duì)方號(hào)碼、通話日期、通話時(shí)間、通話時(shí)段、本方歸屬城市、本方通話城市、本方業(yè)務(wù)類(lèi)型、呼叫類(lèi)型、對(duì)方歸屬城市等短信使用信息用戶(hù)標(biāo)識(shí)、本方號(hào)碼、對(duì)方號(hào)

17、碼、本方歸屬城市、本方使用城市、本方業(yè)務(wù)類(lèi)型、信息條數(shù)、短消息話單類(lèi)型、短信業(yè)務(wù)細(xì)分類(lèi)型等GPRS使用信息手機(jī)號(hào)碼、起始時(shí)間、起始時(shí)段、本方業(yè)務(wù)類(lèi)型、漫游類(lèi)型、GPRS業(yè)務(wù)類(lèi)型、位置區(qū)碼、小區(qū)標(biāo)識(shí)、用戶(hù)標(biāo)識(shí)、業(yè)務(wù)標(biāo)識(shí)、計(jì)費(fèi)項(xiàng)目、發(fā)送字節(jié)數(shù)、接受字節(jié)數(shù)等彩信使用信息手機(jī)號(hào)碼、起始時(shí)間、起始時(shí)段、本方業(yè)務(wù)類(lèi)型、漫游類(lèi)型、GPRS業(yè)務(wù)類(lèi)型、位置區(qū)碼、小區(qū)標(biāo)識(shí)、用戶(hù)標(biāo)識(shí)、業(yè)務(wù)標(biāo)識(shí)、計(jì)費(fèi)項(xiàng)目、發(fā)送字節(jié)數(shù)、接受字節(jié)數(shù)等共三十三頁(yè)DM終端(zhn dun)數(shù)據(jù)信息分類(lèi)數(shù)據(jù)信息用戶(hù)終端清單用戶(hù)號(hào)碼、手機(jī)卡串號(hào)、手機(jī)終端串號(hào)、變更時(shí)間、廠商編碼、終端編碼、操作系統(tǒng)、采集月份用戶(hù)終端變更清單用戶(hù)號(hào)碼、手機(jī)卡串號(hào)、

18、手機(jī)終端串號(hào)、變更時(shí)間、廠商編碼、終端編碼、操作系統(tǒng)、采集月份、采集日期共三十三頁(yè)GN手機(jī)(shu j)上網(wǎng)數(shù)據(jù)信息分類(lèi)數(shù)據(jù)信息GN 上網(wǎng)數(shù)據(jù)信息手機(jī)號(hào)碼、位置區(qū)編碼、CI號(hào)碼、終端類(lèi)型、流量類(lèi)型、開(kāi)始時(shí)間、結(jié)束時(shí)間、時(shí)長(zhǎng)(秒)、上行流量(bytes)、下行流量(bytes)、總流量(bytes)、RATType、終端IP、訪問(wèn)IP、狀態(tài)碼、User Agent、APN、IMSI、SGSN IP、GGSN IP、Content-Type、源端口、目的端口、記錄標(biāo)識(shí)、合并記錄數(shù)、網(wǎng)址/特征信息流量類(lèi)型彩信、網(wǎng)頁(yè)、即時(shí)通信、流媒體 、郵件、往來(lái)電話、文件傳輸及P2P、其它衍生信息通過(guò)網(wǎng)絡(luò)爬蟲(chóng),對(duì)用

19、戶(hù)進(jìn)行喜好分析,包括用戶(hù)上網(wǎng)行為,用戶(hù)喜好,用戶(hù)使用APP等相關(guān)信息。共三十三頁(yè)目錄(ml)大數(shù)據(jù)挖掘平臺(tái)總體(zngt)架構(gòu)數(shù)據(jù)來(lái)源平臺(tái)功能大數(shù)據(jù)挖掘平臺(tái)的數(shù)據(jù)數(shù)據(jù)安全面臨困難共三十三頁(yè)29大數(shù)據(jù)挖掘平臺(tái)有大量用戶(hù)隱私數(shù)據(jù),數(shù)據(jù)提取(tq)風(fēng)險(xiǎn)極大!數(shù)據(jù)安全重于泰山(zhng y ti shn)1、系統(tǒng)安全:能訪問(wèn)數(shù)據(jù)庫(kù)服務(wù)器的終端與公網(wǎng)隔離,且封死USB口2、目前臨時(shí)需求現(xiàn)狀:需求以推廣中心居多,合作、規(guī)劃也有不定期需求3、臨時(shí)需求的臨時(shí)提取流程:各三級(jí)部門(mén)經(jīng)各部門(mén)領(lǐng)導(dǎo)口頭同意或書(shū)面同意后,匯總給推廣中心李威,郵件傳送。據(jù)了解,目前集團(tuán)和北分信息化部的臨時(shí)數(shù)據(jù)提取流程也是指定人郵件傳送的方式建議:要兼顧安全與效率,在二者間找到合理的平衡。1、未來(lái)臨時(shí)需求提取流程:通過(guò)辦公網(wǎng)訪問(wèn)7/vass2、固化需求,減少臨時(shí)提取數(shù)據(jù)需求,提高效率共三十三頁(yè)目錄(ml)大數(shù)據(jù)挖掘平臺(tái)(pngti)總體架構(gòu)數(shù)據(jù)來(lái)源平臺(tái)功能大數(shù)據(jù)挖掘平臺(tái)的數(shù)據(jù)數(shù)據(jù)安全面臨困難共三十三頁(yè)面臨巨

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論