




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
7.1商務(wù)大數(shù)據(jù)商務(wù)大數(shù)據(jù)的概念商務(wù)大數(shù)據(jù)是大數(shù)據(jù)的一個類別,是企業(yè)在組織內(nèi)部運轉(zhuǎn)、經(jīng)營活動、客戶關(guān)系管理和數(shù)據(jù)交易等活動中積累的,具有龐大規(guī)模的,對企業(yè)有一定價值的信息資產(chǎn)。隨著計算機的普及應用帶來的商業(yè)模式變革,以及數(shù)據(jù)存儲能力的不斷提升,使得如今的商業(yè)數(shù)據(jù)相較于傳統(tǒng)存儲方式下的商業(yè)數(shù)據(jù)呈指數(shù)級增長。數(shù)據(jù)規(guī)模商務(wù)大數(shù)據(jù)不僅僅局限于文字和數(shù)字,還包括語音、圖像和視頻等多媒體數(shù)據(jù),對企業(yè)決策更具有指導意義,同時其處理手段也更加的靈活多樣。數(shù)據(jù)類型商務(wù)大數(shù)據(jù)的特征商務(wù)大數(shù)據(jù)繼承了大數(shù)據(jù)的“4V”特征,由于其具有的商業(yè)屬性,商務(wù)大數(shù)據(jù)在特征的具體表現(xiàn)上又有其獨特性。VolumeVelocityValueVariety“4V”特征商務(wù)大數(shù)據(jù)快速增長,體量龐大商務(wù)大數(shù)據(jù)的多樣性更明顯商務(wù)大數(shù)據(jù)的產(chǎn)生速度越來越快商務(wù)大數(shù)據(jù)的價值被越來越多的企業(yè)廣泛認識商務(wù)大數(shù)據(jù)的特征——規(guī)模性豐富的企業(yè)活動和消費者行為所產(chǎn)生的數(shù)據(jù)均可被記錄下來并加以利用,這使得商務(wù)大數(shù)據(jù)的體量不斷擴大。存儲單位變大數(shù)據(jù)來源變多數(shù)據(jù)庫技術(shù)升級B、KB、MB、GB、TB、PB、EB、ZB、YB等組織內(nèi)部、商業(yè)交易、社交媒體、傳感器等Hadoop、MongoDB等商務(wù)大數(shù)據(jù)的特征——多樣性商務(wù)大數(shù)據(jù)具有多樣性,數(shù)據(jù)的多樣性加劇了分析和處理的難度,只有利用專業(yè)化的大數(shù)據(jù)分析技術(shù)才能從中揭示出以前很難或不可能確定的重要關(guān)聯(lián)。商務(wù)大數(shù)據(jù)的多樣性體現(xiàn)在數(shù)據(jù)來源和數(shù)據(jù)類型的多樣數(shù)據(jù)來源企業(yè)自身的內(nèi)部數(shù)據(jù)大部分是結(jié)構(gòu)化數(shù)據(jù)可用外部數(shù)據(jù)大部分是非結(jié)構(gòu)化數(shù)據(jù)數(shù)據(jù)類型結(jié)構(gòu)化數(shù)據(jù)具有定義好的結(jié)構(gòu),可以使用傳統(tǒng)的數(shù)據(jù)管理和分析方法進行存儲和分析非結(jié)構(gòu)化數(shù)據(jù)包括圖像、即時通訊對話、博客、上傳視頻、語音記錄和傳感器數(shù)據(jù)等商務(wù)大數(shù)據(jù)的特征——高速性隨著互聯(lián)網(wǎng)在商業(yè)領(lǐng)域的深入應用,商務(wù)大數(shù)據(jù)的產(chǎn)生速度會越來越快,實時數(shù)據(jù)流并行處理有助于從連續(xù)快速流動的數(shù)據(jù)記錄中提取有價值的意見。AmazonWebServicesKinesis,一種處理分析數(shù)據(jù)流的流應用程序商務(wù)大數(shù)據(jù)的特征——價值性在商業(yè)領(lǐng)域,大數(shù)據(jù)已經(jīng)被當成企業(yè)資產(chǎn),企業(yè)不僅可以從商業(yè)大數(shù)據(jù)中挖掘信息為企業(yè)創(chuàng)造價值,還可以直接將數(shù)據(jù)進行交易。商務(wù)大數(shù)據(jù)的分類商務(wù)大數(shù)據(jù)按照其發(fā)展來看,可以分為傳統(tǒng)數(shù)據(jù)和新型數(shù)據(jù)。數(shù)據(jù)類型主要來源傳統(tǒng)數(shù)據(jù)數(shù)據(jù)倉庫主要來源于存放在數(shù)據(jù)倉庫中的企業(yè)內(nèi)部數(shù)據(jù),由企業(yè)日常商務(wù)活動產(chǎn)生。新型數(shù)據(jù)互聯(lián)網(wǎng)主要來源是過去5-10年激增的社交網(wǎng)絡(luò),大多是非結(jié)構(gòu)化數(shù)據(jù),包含了數(shù)以百萬計的社交媒體帖子和其他數(shù)據(jù),通過全球網(wǎng)絡(luò)每秒的用戶互動生成。傳感器可穿戴設(shè)備可以在任何給定的時間點收集個人的數(shù)百項測量數(shù)據(jù),是未來商務(wù)大數(shù)據(jù)的一個重要來源。商務(wù)大數(shù)據(jù)的挑戰(zhàn)企業(yè)通過各種渠道獲得的商務(wù)大數(shù)據(jù)中,并不是所有的數(shù)據(jù)都是高質(zhì)量的數(shù)據(jù)。數(shù)據(jù)準確性問題低質(zhì)量“臟”數(shù)據(jù)數(shù)據(jù)過擬合影響數(shù)據(jù)價值分析存儲維護成本高模型結(jié)果解釋難數(shù)據(jù)收集成本高制定數(shù)據(jù)利用策略分析組織內(nèi)部數(shù)據(jù)集與外部資源集成商務(wù)大數(shù)據(jù)的挑戰(zhàn)利用商務(wù)大數(shù)據(jù),意味著企業(yè)需要對所需的技術(shù)和基礎(chǔ)設(shè)施進行大量投資,能否在企業(yè)接受的范圍內(nèi)以較少的開支獲取想要的資源是企業(yè)必須考慮的因素。高投資成本問題數(shù)據(jù)獲取成本數(shù)據(jù)存儲成本技術(shù)失敗風險獲取完整準確數(shù)據(jù)難度大存儲海量數(shù)據(jù)成本高投資新技術(shù)失敗風險高云計算基礎(chǔ)設(shè)施即服務(wù)(IaaS)軟件即服務(wù)(SaaS)平臺即服務(wù)(PaaS)數(shù)據(jù)即服務(wù)(DaaS)商務(wù)大數(shù)據(jù)的挑戰(zhàn)數(shù)據(jù)的隱私保護是大數(shù)據(jù)分析和處理的一個重要方面,保護個人隱私至關(guān)重要,同時也不能抹殺企業(yè)利用數(shù)據(jù)推動業(yè)務(wù)發(fā)展的能力。數(shù)據(jù)隱私保護問題公開最小化信息技術(shù)安全漏洞透明公開數(shù)據(jù)獲取與處理減小隱私侵犯風險影響數(shù)據(jù)泄露等信息安全數(shù)據(jù)安全問題區(qū)塊鏈技術(shù)分布式數(shù)據(jù)庫加密安全擴展結(jié)構(gòu)商務(wù)大數(shù)據(jù)的挑戰(zhàn)商業(yè)交易的前提是清晰的產(chǎn)權(quán)歸屬,而商務(wù)大數(shù)據(jù)來源廣泛,許多數(shù)據(jù)甚至找不到最初的數(shù)據(jù)提供者。對于企業(yè)所搭建的平臺上的用戶數(shù)據(jù),數(shù)據(jù)的所有權(quán)更是難以界定。數(shù)據(jù)所有權(quán)問題企業(yè)自身生產(chǎn)的數(shù)據(jù)社會公眾產(chǎn)生的數(shù)據(jù)例如:產(chǎn)品數(shù)據(jù)、生產(chǎn)過程數(shù)據(jù)、運營數(shù)據(jù)這類數(shù)據(jù)的產(chǎn)權(quán)清晰例如:經(jīng)授權(quán)許可并進行隱私處理后的數(shù)據(jù)這類數(shù)據(jù)的產(chǎn)權(quán)問題亟待研究小結(jié)本節(jié)的主要內(nèi)容商務(wù)大數(shù)據(jù)的概念商務(wù)大數(shù)據(jù)的特征商務(wù)大數(shù)據(jù)的分類商務(wù)大數(shù)據(jù)的挑戰(zhàn)7.1商務(wù)大數(shù)據(jù)7.2商務(wù)大數(shù)據(jù)的管理決策分析商務(wù)大數(shù)據(jù)的收集商務(wù)大數(shù)據(jù)是由消費者和企業(yè)商務(wù)行為產(chǎn)生的數(shù)據(jù),分布在企業(yè)內(nèi)部系統(tǒng)、各電商平臺、第三方服務(wù)平臺、社交媒體等,商務(wù)大數(shù)據(jù)按收集來源可分為以下三種類型。包括企業(yè)的內(nèi)部信息和外部信息。企業(yè)通過在數(shù)據(jù)采集端上部署大量數(shù)據(jù)庫,并在這些數(shù)據(jù)庫之間進行負載均衡和分片,完成數(shù)據(jù)的采集獲取工作。離線數(shù)據(jù)包括web服務(wù)器上的用戶訪問行為、web用戶的財產(chǎn)記錄、網(wǎng)絡(luò)監(jiān)控的流量管理等。這類日志一般為流式數(shù)據(jù),企業(yè)通過日志采集工具來獲得實時數(shù)據(jù)。實時數(shù)據(jù)指在網(wǎng)絡(luò)空間交互過程中產(chǎn)生的大量數(shù)據(jù),例如抖音、微博等社交媒體產(chǎn)生的數(shù)據(jù)。個體用戶大部分采用API的方法或者爬蟲來獲取互聯(lián)網(wǎng)數(shù)據(jù)?;ヂ?lián)網(wǎng)數(shù)據(jù)商務(wù)大數(shù)據(jù)質(zhì)量標準對于收集得到的商務(wù)大數(shù)據(jù)質(zhì)量,有對其進行評估的標準,以下幾個維度分別從不同方面評估數(shù)據(jù)的質(zhì)量。評價指標具體要求真實性數(shù)據(jù)必須真實反映客觀的實體存在或業(yè)務(wù)。真實的數(shù)據(jù)是經(jīng)營者正確經(jīng)營決策的第一手資料。
準確性用于分析和識別不準確或無效的數(shù)據(jù)。不可靠的數(shù)據(jù)可能會導致嚴重的問題,影響企業(yè)的決策。唯一性不能出現(xiàn)重復數(shù)據(jù)。冗余的數(shù)據(jù)可能導致業(yè)務(wù)無法協(xié)同,決策產(chǎn)生偏差等問題。完整性用來度量哪些數(shù)據(jù)是缺失的或哪些數(shù)據(jù)不可用。任何數(shù)據(jù)集都可能有缺口和數(shù)據(jù)缺失,但是有些缺失的數(shù)據(jù)可能包含重要的信息。一致性所有實例之間的數(shù)據(jù)必須保持一致。它用來描述同一信息主體在不同的數(shù)據(jù)集中信息屬性是否相同,各實體、屬性是否符合一致性約束關(guān)系。及時性能否在需要的時候獲取到數(shù)據(jù)。企業(yè)的數(shù)據(jù)處理速度越快,及時性就越好,企業(yè)的業(yè)務(wù)處理效率和管理效率就越高。關(guān)聯(lián)性指存在數(shù)據(jù)關(guān)聯(lián)的數(shù)據(jù)關(guān)系缺失或錯誤,例如:函數(shù)關(guān)系、相關(guān)系數(shù)、主外鍵關(guān)系、索引關(guān)系等。存在數(shù)據(jù)關(guān)聯(lián)性問題,會直接影響數(shù)據(jù)分析的結(jié)果,進而影響管理決策。商務(wù)大數(shù)據(jù)質(zhì)量提升方法為了提升數(shù)據(jù)質(zhì)量,去除“臟”數(shù)據(jù),得到干凈一致的數(shù)據(jù),常采用數(shù)據(jù)預處理的方法,數(shù)據(jù)預處理主要分為幾下幾個步驟。數(shù)據(jù)清洗重復數(shù)據(jù)清洗缺失數(shù)據(jù)清洗噪聲數(shù)據(jù)清洗數(shù)據(jù)集成模式集成實體識別問題數(shù)據(jù)冗余數(shù)據(jù)值沖突數(shù)據(jù)歸約數(shù)維消減數(shù)據(jù)壓縮離散化......數(shù)據(jù)變換函數(shù)變換數(shù)據(jù)規(guī)范化獲取初始數(shù)據(jù)數(shù)據(jù)分析商務(wù)大數(shù)據(jù)分析方法大數(shù)據(jù)分析指的是通過適當?shù)募夹g(shù)從大量數(shù)據(jù)中獲取有用信息的過程。根據(jù)運籌研究與管理科學研究所,商務(wù)大數(shù)據(jù)的分析被定義以下三個層次。描述性分析預測性分析規(guī)范性分析了解與數(shù)據(jù)相關(guān)的具體情況,分析其潛在趨勢和原因。采用統(tǒng)計技術(shù)和數(shù)據(jù)挖掘技術(shù),確定未來可能發(fā)生什么。識別正在和將要發(fā)生的事情,做出決策以盡可能達到最佳績效。商務(wù)大數(shù)據(jù)的可視化分析商務(wù)大數(shù)據(jù)的可視化是大數(shù)據(jù)生命周期管理的最后一步,也是最重要的一步。為實現(xiàn)信息的有效傳達,挖掘數(shù)據(jù)背后隱藏的價值,數(shù)據(jù)可視化應包含以下4個特征。直觀化關(guān)聯(lián)化交互性藝術(shù)性數(shù)據(jù)可視化商務(wù)大數(shù)據(jù)可視化示例-漏斗圖商務(wù)大數(shù)據(jù)的可視化分析商業(yè)大數(shù)據(jù)的可視化以其極高的研究價值在國內(nèi)外都備受重視,但也面臨著如下三點挑戰(zhàn):數(shù)據(jù)快速動態(tài)變化可感知的交互的擴展性對復雜高維數(shù)據(jù)分析能力不足常以流式數(shù)據(jù)形式存在,缺乏流數(shù)據(jù)的實時分析與可視化方法。從大規(guī)模數(shù)據(jù)庫中查詢數(shù)據(jù)可能導致高延遲,使交互率降低。當前的軟件系統(tǒng)以統(tǒng)計和基本分析為主,分析能力尚有欠缺。商務(wù)大數(shù)據(jù)對推薦系統(tǒng)的影響與傳統(tǒng)推薦系統(tǒng)不同,在商務(wù)大數(shù)據(jù)環(huán)境下,推薦系統(tǒng)數(shù)據(jù)的規(guī)模、類型、形式、價值以及推薦實時性都發(fā)生了顯著的變化,這給推薦系統(tǒng)帶來了一些挑戰(zhàn)。特點傳統(tǒng)推薦系統(tǒng)大數(shù)據(jù)環(huán)境下的推薦系統(tǒng)數(shù)據(jù)規(guī)模數(shù)據(jù)規(guī)模小數(shù)據(jù)規(guī)模大,從TB級別躍升到PB級別數(shù)據(jù)類型以顯式評分數(shù)據(jù)為主以隱式反饋數(shù)據(jù)為主數(shù)據(jù)形式以動態(tài)形式為主,更新頻繁以靜態(tài)形式存儲在硬盤中,更新少,存儲時間長數(shù)據(jù)價值數(shù)據(jù)價值密度高數(shù)據(jù)價值密度低推薦實時性實時性要求低實時性要求高推薦系統(tǒng)面臨的挑戰(zhàn)計算復雜性的提升用戶隱式興趣的發(fā)現(xiàn)可擴展性問題......商務(wù)大數(shù)據(jù)對推薦系統(tǒng)的影響根據(jù)功能的不同,商務(wù)大數(shù)據(jù)環(huán)境下的推薦系統(tǒng)可以分為以下四個層面。商務(wù)大數(shù)據(jù)對推薦系統(tǒng)的影響商務(wù)大數(shù)據(jù)環(huán)境下的推薦系統(tǒng)通常包括數(shù)據(jù)建模、用戶建模、推薦引擎和用戶接口四個部分。商務(wù)大數(shù)據(jù)對預測分析的影響商務(wù)大數(shù)據(jù)環(huán)境下的預測分析主要是利用對商業(yè)領(lǐng)域產(chǎn)生的多源數(shù)據(jù)的洞察來提供關(guān)于未來的商務(wù)智能。從數(shù)據(jù)源角度看,商務(wù)大數(shù)據(jù)環(huán)境下的預測分析需要拓展以下幾種關(guān)鍵技術(shù)領(lǐng)域的研究。文本分析,是指從非結(jié)構(gòu)化文本中提取有用的信息和知識的過程。常見的文本挖掘技術(shù)包括信息提取、主題建模、分類、聚類、觀點挖掘等。文本分析網(wǎng)站分析社交網(wǎng)絡(luò)分析移動分析網(wǎng)站分析旨在從網(wǎng)絡(luò)文檔和服務(wù)中自動檢索、提取和評估用于知識發(fā)現(xiàn)的信息。網(wǎng)站分析研究的一個主要新興組成部分是云計算平臺和服務(wù)的開發(fā)。社交網(wǎng)絡(luò)包含大量的鏈接和內(nèi)容數(shù)據(jù),在社交網(wǎng)絡(luò)的背景下有兩個主要的研究方向:基于鏈接的結(jié)構(gòu)分析和基于內(nèi)容的分析。隨著移動計算的快速發(fā)展,越來越多的移動終端在全球范圍內(nèi)部署,網(wǎng)絡(luò)服務(wù)的輕量級編程模型為移動web服務(wù)的快速發(fā)展做出了貢獻。商務(wù)大數(shù)據(jù)對精準營銷的影響商務(wù)大數(shù)據(jù)提供了消費者行為、購買歷史、購買頻率和許多方面的信息,一些分析工具和軟件可以從數(shù)據(jù)中獲得相關(guān)的見解,從而創(chuàng)造精準營銷優(yōu)勢。消費者、活動和各項組織資源結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)數(shù)據(jù)采集與集成結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)商務(wù)大數(shù)據(jù)分析消費者洞察分析動態(tài)和適應能力分析商務(wù)大數(shù)據(jù)對精準營銷的影響商務(wù)大數(shù)據(jù)的出現(xiàn)對于傳統(tǒng)營銷組合中的4P產(chǎn)生了重要的影響。產(chǎn)品價格渠道協(xié)助新產(chǎn)品和新理念的設(shè)計分析顧客的價格敏感度確定銷售產(chǎn)品的正確渠道的信息促銷預測客戶的反應并提出相關(guān)的營銷策略商務(wù)大數(shù)據(jù)對精準營銷的影響商務(wù)大數(shù)據(jù)的出現(xiàn)對營銷組合的4P進行了擴展,給予了營銷人員更好的合作視角,新的4P包含了以下四個部分。4PProductPlacePromotionPriceNew4PPeopleProcessesProgramPerformance商務(wù)大數(shù)據(jù)對精準營銷的影響商務(wù)大數(shù)據(jù)分析有助于企業(yè)開展與消費者相關(guān)的營銷活動,從而吸引顧客購買產(chǎn)品和服務(wù)。麥當勞根據(jù)時間、天氣和顧客行為數(shù)據(jù)進行動態(tài)化的營銷活動制定。商務(wù)大數(shù)據(jù)對精準營銷的影響商務(wù)大數(shù)據(jù)分析有助于企業(yè)確定產(chǎn)生創(chuàng)造力的最有效方式,促進創(chuàng)造力的正確結(jié)構(gòu),從而創(chuàng)造競爭優(yōu)勢。Airbnb通過商務(wù)大數(shù)據(jù)分析不同國家旅客的出行需求,并對界面不斷調(diào)整,提高地區(qū)轉(zhuǎn)化率。商務(wù)大數(shù)據(jù)對精準營銷的影響商務(wù)大數(shù)據(jù)分析有助于企業(yè)持續(xù)監(jiān)控營銷活動,確定各種營銷活動、促銷活動是否成功,以確??蛻舻挠∠蠛蛥⑴c產(chǎn)生積極影響。美國零食制造公司Nabisco通過分析發(fā)現(xiàn),用戶更加偏愛有趣的產(chǎn)品圖像,從而進行產(chǎn)品包裝的升級。小結(jié)本節(jié)的主要內(nèi)容商務(wù)大數(shù)據(jù)的收集商務(wù)大數(shù)據(jù)質(zhì)量標準商務(wù)大數(shù)據(jù)質(zhì)量提升方法商務(wù)大數(shù)據(jù)的可視化分析商務(wù)大數(shù)據(jù)對推薦系統(tǒng)的影響商務(wù)大數(shù)據(jù)對預測分析的影響商務(wù)大數(shù)據(jù)對精準營銷的影響7.2商務(wù)大數(shù)據(jù)的管理決策分析7.3應用案例——數(shù)據(jù)驅(qū)動的汽車品牌管理系統(tǒng)汽車品牌管理背景汽車是復雜系統(tǒng)的典型代表,其價值高,品牌的建立和維護對產(chǎn)品的銷量和市場份額來說舉足輕重,因此也是最早開展品牌關(guān)系管理的行業(yè)之一。在當前新的營銷方式和傳播渠道下,對于汽車行業(yè)來說,汽車品牌的管理面臨著數(shù)據(jù)基礎(chǔ)和管理方法的挑戰(zhàn),也同時面臨著數(shù)據(jù)缺失、錯誤和難以分析的問題。挑戰(zhàn)和機遇汽車品牌關(guān)系的維護,通過傳統(tǒng)的媒體,如客戶問卷調(diào)查、電話訪問、廣告等方式進行。云計算和大數(shù)據(jù)時代的到來,汽車行業(yè)可收集的數(shù)據(jù)呈爆發(fā)性的增長,傳統(tǒng)的汽車品牌關(guān)系管理不再適合。品牌管理方式面向汽車品牌管理的數(shù)據(jù)工程數(shù)據(jù)工程旨在通過數(shù)據(jù)獲取、數(shù)據(jù)過濾、數(shù)據(jù)結(jié)構(gòu)化等過程,獲取到可應用于品牌關(guān)系管理的大數(shù)據(jù),過濾掉其中的垃圾數(shù)據(jù),融合多源異構(gòu)數(shù)據(jù),實現(xiàn)從非結(jié)構(gòu)化數(shù)據(jù)到結(jié)構(gòu)化的數(shù)據(jù)的轉(zhuǎn)變,從而實現(xiàn)減輕數(shù)據(jù)獲取瓶頸和提高數(shù)據(jù)價值密度以及數(shù)據(jù)利用率的目標。數(shù)據(jù)獲取數(shù)據(jù)過濾數(shù)據(jù)結(jié)構(gòu)化數(shù)據(jù)工程——數(shù)據(jù)獲取針對數(shù)據(jù)分散性問題,面向汽車品牌管理的數(shù)據(jù)工程可開發(fā)面向網(wǎng)絡(luò)媒體的數(shù)據(jù)采集器,采集消費者、汽車和情境等方面相關(guān)數(shù)據(jù)??捎脭?shù)據(jù)示例如下:分類詳細來源消費者論壇數(shù)據(jù)汽車之家、搜狐汽車、網(wǎng)易汽車等八大汽車論壇口碑信息汽車之家汽車零售商、制造商數(shù)據(jù)汽車之家車型參數(shù)數(shù)據(jù)汽車之家銷量數(shù)據(jù)搜狐汽車情境天氣及空氣質(zhì)量數(shù)據(jù)天氣網(wǎng)汽車石油相關(guān)股票信息東方財富網(wǎng)PPI、CPI、進出口數(shù)據(jù)東方財富網(wǎng)數(shù)據(jù)工程——數(shù)據(jù)過濾在品牌關(guān)系管理中,可以采用基于布隆過濾器的海量數(shù)據(jù)過濾方法。首先構(gòu)建品牌關(guān)系管理相關(guān)的本體庫,主要分為兩個環(huán)節(jié):本體庫構(gòu)建構(gòu)建綜合評價指標體系構(gòu)建領(lǐng)域本體在原有評價指標基礎(chǔ)上,從評論內(nèi)容出發(fā),圍繞產(chǎn)品或服務(wù)的特征,綜合多重視角構(gòu)建完善的評價指標體系。選取語料進行人工標注,提取評論內(nèi)容中描述產(chǎn)品或服務(wù)特征或情感的固定搭配,并標注極性,建立特征詞和情感詞的關(guān)聯(lián)關(guān)系。數(shù)據(jù)工程——數(shù)據(jù)過濾布隆過濾器是一種空間效率很高的隨機數(shù)據(jù)結(jié)構(gòu),它利用位數(shù)組表示集合,并判斷一個元素是否屬于該集合。基于本體庫利用布隆過濾器,可以過濾和清洗無用數(shù)據(jù),解決數(shù)據(jù)的冗余問題,確保價值數(shù)據(jù)密度高,從而保障后續(xù)挖掘任務(wù)順利開展。布隆過濾器設(shè)計第一步:利用布隆過濾器多Hash函數(shù)壓縮參數(shù)空間,匹配過濾。第二步:基于語義規(guī)則匹配“特征-情感對”,計算點互信息。數(shù)據(jù)工程——數(shù)據(jù)結(jié)構(gòu)化用戶生成內(nèi)容大多是非結(jié)構(gòu)化的文本信息,需要通過數(shù)據(jù)結(jié)構(gòu)化過程識別文本主題,才能有效的開展商務(wù)分析任務(wù)。利用潛在狄利克雷模型(LatentDirichletAllocation,LDA)可以從汽車論壇的文本數(shù)據(jù)中提取不同主題,實現(xiàn)數(shù)據(jù)結(jié)構(gòu)化。主題序號主題中詞結(jié)果1車滿意一點油耗空間動力外觀好比較內(nèi)飾感覺操控性價比舒適性不錯人開太高點描述小買坐選擇覺得喜歡公里后排2油泵螺絲隨后小姐電路越野鳳凰插頭泵破同學保修精準度顧問漏風進水工作室聯(lián)絡(luò)中線小偷手工費提升機加急旅行動力面向汽車品牌管理的競爭分析汽車企業(yè)視角所得的結(jié)論與消費者的認知不完全一致,企業(yè)視角獲得的競爭性指標與消費者感知的競爭性指標存在差異。與訪談和問卷數(shù)據(jù)的“事后”或者“事前”感知相比,在線數(shù)據(jù)記錄著消費者在購買決策過程中對不同產(chǎn)品的對比和評價,因此能夠更加準確的反映產(chǎn)品之間的競爭關(guān)系。面向汽車品牌管理的競爭分析節(jié)點:汽車車型邊:車型之間的競爭關(guān)系越密集、顏色越深的部分,車型競爭越激烈中低端汽車新能源汽車高端汽車汽車車型的競爭關(guān)系可視化面向汽車品牌管理的品牌畫像對企業(yè)而言,品牌畫像是品牌形象傳播的基礎(chǔ),是品牌戰(zhàn)略管理的關(guān)鍵環(huán)節(jié);對消費者而言,品牌畫像是品牌感知價值的真實寫照,是購買決策行為的重要參考。從消費者角度認知需求出發(fā),選擇產(chǎn)品、服務(wù)、市場、品牌四個方面作為品牌畫像的維度,體現(xiàn)消費者不同的需求層次對應的品牌特征。
品牌畫像一級維度二級維度指標產(chǎn)品價格;外觀;功能;質(zhì)量;性價比
式樣、包裝、配飾;性能;安全性、耐用性、瑕疵性
服務(wù)保養(yǎng)服務(wù);維修服務(wù)增值服務(wù);配送服務(wù)保修期限、保修費用;設(shè)備、環(huán)境、網(wǎng)點體系;個性化、差異性、創(chuàng)新性;安全性、及時性、方便性市場表現(xiàn);目標人群行業(yè)排名、市場占有率、美譽度;年齡、職業(yè)、學歷、收入、性別、地域品牌標識;個性;價值商標、名稱、品類、產(chǎn)地、品牌來源、品牌推廣;真誠、刺激、稱職、教養(yǎng)、粗獷;文化價值、社會價值、利失價值、情感價值面向汽車品牌管理的品牌畫像企業(yè)通常根據(jù)以下步驟構(gòu)建基于用戶生成內(nèi)容的品牌畫像:構(gòu)建品牌本體構(gòu)建品牌個性詞典識別用戶認知標簽識別品牌個性用以描述維度與特征詞之間的關(guān)系網(wǎng)絡(luò),同時可對后續(xù)提取的認知標簽進行組織歸類用于描述品牌類人特征的、具有象征意義的主觀形容詞匯根據(jù)本體特征,提取用戶生成內(nèi)容中對應特征的情感詞,作為特征-情感認知標簽提取用戶生成內(nèi)容中與品牌個性詞典相匹配的特征詞匯,確定品牌個性面向汽車品牌管理的銷量預測銷量預測是商業(yè)分析的重要任務(wù)之一,是對產(chǎn)品的未來銷量進行預測,也是對消費者的需求量進行預測。企業(yè)已經(jīng)不能僅僅通過成本優(yōu)勢占據(jù)市場地位。進行較為準確的產(chǎn)品銷量預測是有效地管理供應鏈的一個重要方面。銷量預測歷史銷售數(shù)據(jù)在線評論歷史同期銷售數(shù)據(jù)利率、節(jié)假日、物價指數(shù)、早期銷量、口碑情感、網(wǎng)絡(luò)活躍度…在線評論:考慮大眾對產(chǎn)品的看法,深入挖掘?qū)I(yè)汽車論壇用戶評論數(shù)據(jù);歷史同期銷售數(shù)據(jù):車市的銷量會隨著季節(jié)的變化而呈現(xiàn)出高峰低谷的規(guī)律性周期變化;其他影響因素:挑選合適的銷量影響因素,避免出現(xiàn)冗余,增加預測模型的復雜性和計算負擔。面向汽車品牌管理的銷量預測汽車銷量常用的預測方法主要分為定性預測和定量預測兩類。隨著統(tǒng)計學習和機器學習等新模型的廣泛使用以及市場對于銷量預測越來越嚴苛的要求,銷量預測的方法也從傳統(tǒng)定性的描述越來越多轉(zhuǎn)向定量的分析
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 會考語法嗎面試題及答案
- 評估師如何提升市場分析能力試題及答案
- 食品安全與公共衛(wèi)生的關(guān)聯(lián)試題及答案
- 傳染病學章節(jié)試題及答案
- Module 10 Unit 1 Its next to the park. 說課(教學設(shè)計)-2023-2024學年外研版(一起)英語二年級下冊
- Unit 6 Numbers in life Part A Lets learn Listen and chant(教學設(shè)計)-2024-2025學年人教PEP版(2024)英語三年級下冊
- Module 3 Unit 2 What's the elephant doing?(教學設(shè)計)-2024-2025學年外研版(三起)英語四年級上冊
- Module 9 Unit 2 He was in Hong Kong (教學設(shè)計)-2023-2024學年外研版(一起)英語三年級下冊
- 食品流通與銷售環(huán)節(jié)檢測試題及答案
- 學校家長會發(fā)言稿范本(10篇)
- 危險化學品理化性質(zhì)培訓
- 危險化學品目錄(2024版)
- 骨科術(shù)后下肢腫脹護理
- 快件處理員(高級)職業(yè)技能鑒定考試題庫(含答案)
- 福建省廈門市雙十中學2024-2025學年九年級上學期期中考試英語試題
- 2024年廣東省深圳市中考英語模擬試卷(三)
- GB/T 625-2024化學試劑硫酸
- 成語故事對牛彈琴
- 湖南省邵陽市2024年六年級數(shù)學第一學期期末檢測模擬試題含解析
- 肥胖微生物組與腸道菌群宏基因組學研究
- 2024年全國統(tǒng)一高考數(shù)學試卷(新高考Ⅱ)含答案
評論
0/150
提交評論