版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
《數(shù)據(jù)挖掘與機器學(xué)習(xí)》教學(xué)大綱教案一、課程性質(zhì)、目的、任務(wù):本課程以數(shù)據(jù)挖掘和機器學(xué)習(xí)為主要內(nèi)容,講述實現(xiàn)數(shù)據(jù)挖掘的主要功能、數(shù)據(jù)挖掘、機器學(xué)習(xí)算法和應(yīng)用,并通過對實際數(shù)據(jù)的分析更加深入地理解常用的數(shù)據(jù)挖掘與機器學(xué)習(xí)模型。本書不僅可以幫助處理具體問題的算法,培養(yǎng)學(xué)生數(shù)據(jù)分析和處理的能力。本課程的主要目的是培養(yǎng)學(xué)生的數(shù)據(jù)挖掘與機器學(xué)習(xí)的理論分析與應(yīng)用實踐的綜合能力。通過本課程的教學(xué),使學(xué)生掌握數(shù)據(jù)挖掘和機器學(xué)習(xí)的一般原理和處理方法,能使用機器學(xué)習(xí)理論解決數(shù)據(jù)挖掘相關(guān)的問題。本書面向高等院校計算機類、軟件工程以及信息管理類專業(yè)教學(xué)需要,也可作為從事大數(shù)據(jù)開發(fā)和信息管理的相關(guān)人員培訓(xùn)教材。二、課程主要教學(xué)內(nèi)容:本書系統(tǒng)地闡述了數(shù)據(jù)挖掘產(chǎn)生的背景、技術(shù)、多種相關(guān)方法及具體應(yīng)用,主要內(nèi)容包括數(shù)據(jù)挖掘概述,數(shù)據(jù)采集、集成與預(yù)處理技術(shù),多維數(shù)據(jù)分析與組織,預(yù)測模型研究與應(yīng)用,關(guān)聯(lián)規(guī)則模型及應(yīng)用,聚類分析方法與應(yīng)用,粗糙集方法與應(yīng)用,遺傳算法與應(yīng)用,基于模糊理論的模型與應(yīng)用,灰色系統(tǒng)理論與方法,基于數(shù)據(jù)挖掘的知識推理。三、課程的教學(xué)環(huán)節(jié)要求:教學(xué)環(huán)節(jié)包括:課堂講授、案例分析課、討論課、課后作業(yè)。通過本課程各個教學(xué)環(huán)節(jié)的教學(xué),使學(xué)生掌握數(shù)據(jù)挖掘的基本方法,培養(yǎng)學(xué)生的自學(xué)能力、動手能力、分析問題和解決問題的能力。通過本課程的學(xué)習(xí),要求學(xué)生達到以下要求。了解數(shù)據(jù)挖掘技術(shù)的整體概貌。了解數(shù)據(jù)挖掘技術(shù)的主要應(yīng)用領(lǐng)域及當(dāng)前的研究熱點問題和發(fā)展方向。掌握最基本的概念、算法原理和技術(shù)方法。本課程課外學(xué)習(xí)與修學(xué)指導(dǎo):由于該課程涉及的技術(shù)都是目前比較熱門的技術(shù),內(nèi)容復(fù)雜,難度較大,且具有很強的理論性和實踐性,所以要學(xué)好本課程,必須做到理論與實踐緊密結(jié)合,才能達到較好的學(xué)習(xí)效果。要求學(xué)生多參閱相關(guān)書籍和資料,多上機實驗,掌握數(shù)據(jù)挖掘的基本功能、主要算法及其實現(xiàn)過程。五、學(xué)時數(shù)分配表:序號授課內(nèi)容學(xué)時1數(shù)據(jù)挖掘概述62Pandas數(shù)據(jù)分析23機器學(xué)習(xí)54分類算法與應(yīng)用65回歸算法與應(yīng)用46無監(jiān)督學(xué)習(xí)57關(guān)聯(lián)規(guī)則和協(xié)同過濾38圖像數(shù)據(jù)分析39自然語言處理與NLTK3合計37第一章數(shù)據(jù)挖掘概述教學(xué)要點:理解和掌握數(shù)據(jù)挖掘與機器學(xué)習(xí)的基本概念、功能與應(yīng)用領(lǐng)域,使讀者掌握數(shù)據(jù)挖掘的基本理念、流程和方法。了解數(shù)據(jù)分析技術(shù)的發(fā)展歷史和未來趨勢,了解數(shù)據(jù)挖掘與機器學(xué)習(xí)的應(yīng)用領(lǐng)域和面臨的問題。3.對數(shù)據(jù)挖掘和機器學(xué)習(xí)能解決的問題和解決問題思路有清晰的認識。教學(xué)時數(shù):6學(xué)時。考核要點:了解數(shù)據(jù)挖掘的定義和功能,理解數(shù)據(jù)挖掘在何種數(shù)據(jù)上進行,數(shù)據(jù)挖掘可以挖掘什么類型的模式,掌握初級的數(shù)據(jù)分析方法。Pandas數(shù)據(jù)分析教學(xué)要點:理解Pandas模塊的語法結(jié)構(gòu),并通過對自行車行駛數(shù)據(jù)與服務(wù)熱線數(shù)據(jù)的分析,使讀者掌握通過Pandas模塊對數(shù)據(jù)進行統(tǒng)計分析的方法。教學(xué)時數(shù):2學(xué)時??己艘c:掌握Python編程基礎(chǔ),理解Pandas的數(shù)據(jù)結(jié)構(gòu),熟悉Pandas統(tǒng)計分析常用的函數(shù),掌握使用Pandas進行數(shù)據(jù)分析的基本方法。機器學(xué)習(xí)教學(xué)要點:理解機器學(xué)習(xí)的基本概念,介紹機器學(xué)習(xí)的框架、機器學(xué)習(xí)的模型、機器學(xué)習(xí)的評判。理解Sklearn模塊的語法結(jié)構(gòu),使讀者掌握搭建機器學(xué)習(xí)流水線的方法。支持向量機概述和特點,過擬合問題。教學(xué)時數(shù):5學(xué)時??己艘c:理解并掌握機器學(xué)習(xí)的基本框架,以及Sklearn模塊的語法結(jié)構(gòu),熟練掌握搭建機器學(xué)習(xí)流水線的方法。分類算法與應(yīng)用教學(xué)要點:學(xué)習(xí)數(shù)據(jù)挖掘分類問題以及分類問題的基本流程。理解概率模型的原理及應(yīng)用場景。理解樸素貝葉斯分類的原理及應(yīng)用場景。理解空間向量模型的原理及應(yīng)用場景。理解KNN算法的原理及應(yīng)用場景。多類問題的原理及應(yīng)用場景。教學(xué)時數(shù):6學(xué)時??己艘c:掌握分類和預(yù)測的基本概念和問題,掌握決策樹分類的方法,理解基于規(guī)則分類的方法,了解貝葉斯分類和后向傳播分類方法,掌握預(yù)測的方法。理解并應(yīng)用分類算法,使讀者掌握通過Sklearn模塊搭建一個分類器并實現(xiàn)分類功能的方法。第五章回歸算法與應(yīng)用教學(xué)要點:掌握回歸分析原理的基本概念。掌握一元線性回歸分析。掌握多元線性回歸分析。掌握邏輯回歸。了解其他回歸分析。介紹線性回歸、嶺回歸和LASSO以及邏輯回歸模型的實驗實現(xiàn)。教學(xué)時數(shù):4學(xué)時??己艘c:理解回歸算法與應(yīng)用的基本原理,使讀者掌握通過Sklearn模塊搭建一個回歸模型并實現(xiàn)回歸功能的方法。第六章無監(jiān)督學(xué)習(xí)教學(xué)要點:理解并掌握無監(jiān)督學(xué)習(xí)的基本概念。闡釋聚類分析的基本概念與原理和降維的基本概念與原理,學(xué)習(xí)聚類問題的基本分析流程。介紹K-Means算法、層次聚類算法等,舉例說明和實現(xiàn)K-Means算法和降維問題。教學(xué)時數(shù):5學(xué)時??己艘c:理解無監(jiān)督學(xué)習(xí)的基本概念,使讀者掌握通過Sklearn模塊搭建一個聚類模型并實現(xiàn)聚類功能的方法。關(guān)聯(lián)規(guī)則和協(xié)同過濾教學(xué)要點:理解并掌握關(guān)聯(lián)規(guī)則的基本概念和挖掘過程。理解并掌握Apriori算法的基本概念和實現(xiàn)原理。理解并掌握協(xié)同過濾的基本概念和實現(xiàn)過程。介紹基于協(xié)同過濾算法的電影推薦。教學(xué)時數(shù):3學(xué)時??己艘c:理解關(guān)聯(lián)規(guī)則和協(xié)同過濾基本概念和實現(xiàn)原理,使讀者掌握通過這些算法實現(xiàn)電影推薦的方法。圖像數(shù)據(jù)分析教學(xué)要點:理解并掌握圖像數(shù)據(jù)的概念,圖像的分類以及與圖像相關(guān)的基本概念等。理解并掌握圖像數(shù)據(jù)的分析方法。介紹圖像數(shù)據(jù)分析的應(yīng)用案例。教學(xué)時數(shù):3學(xué)時??己艘c:介紹圖像數(shù)據(jù)分析的相關(guān)技術(shù),使讀者掌握進行圖像特征提取和人臉識別的方法。使讀者通過學(xué)習(xí)熟練掌握如何使用Python工具包進行圖像讀/寫、顯示、圖像恢復(fù)、增強、特征提取等。請讀者利用公開的圖像分類/識別數(shù)據(jù)集,或者自建數(shù)據(jù)集,對其進行特征提取,利用機器學(xué)習(xí)算法學(xué)習(xí)分類模型,并驗證分類模型的效果。第九章自然語言處理與NLTK教學(xué)要點:理解并掌握自然語言處理的基本概念。介紹常用的自然語言處理技術(shù)。詳細介紹目前應(yīng)用范圍最廣泛的Python自然語言處理模塊—NLTK的應(yīng)用。教學(xué)時數(shù):3學(xué)時。考核要點:介紹自然語言處理的相關(guān)技術(shù),使讀者掌握進行文本特征提取和文本分類的方法。電子商務(wù)數(shù)據(jù)的概念及意義、課程性質(zhì)、目的、任務(wù):本課程以數(shù)據(jù)挖掘和機器學(xué)習(xí)為主要內(nèi)容,講述實現(xiàn)數(shù)據(jù)挖掘的主要功能、數(shù)據(jù)挖掘、機器學(xué)習(xí)算法和應(yīng)用,并通過對實際數(shù)據(jù)的分析更加深入地理解常用的數(shù)據(jù)挖掘與機器學(xué)習(xí)模型。本書不僅可以幫助處理具體問題的算法,培養(yǎng)學(xué)生數(shù)據(jù)分析和處理的能力。本課程的主要目的是培養(yǎng)學(xué)生的數(shù)據(jù)挖掘與機器學(xué)習(xí)的理論分析與應(yīng)用實踐的綜合能力。通過本課程的教學(xué),使學(xué)生掌握數(shù)據(jù)挖掘和機器學(xué)習(xí)的一般原理和處理方法,能使用機器學(xué)習(xí)理論解決數(shù)據(jù)挖掘相關(guān)的問題。本書面向高等院校計算機類、軟件工程以及信息管理類專業(yè)教學(xué)需要,也可作為從事大數(shù)據(jù)開發(fā)和信息管理的相關(guān)人員培訓(xùn)教材。二、課程主要教學(xué)內(nèi)容:本書系統(tǒng)地闡述了數(shù)據(jù)挖掘產(chǎn)生的背景、技術(shù)、多種相關(guān)方法及具體應(yīng)用,主要內(nèi)容包括數(shù)據(jù)挖掘概述,數(shù)據(jù)采集、集成與預(yù)處理技術(shù),多維數(shù)據(jù)分析與組織,預(yù)測模型研究與應(yīng)用,關(guān)聯(lián)規(guī)則模型及應(yīng)用,聚類分析方法與應(yīng)用,粗糙集方法與應(yīng)用,遺傳算法與應(yīng)用,基于模糊理論的模型與應(yīng)用,灰色系統(tǒng)理論與方法,基于數(shù)據(jù)挖掘的知識推理。三、課程的教學(xué)環(huán)節(jié)要求:教學(xué)環(huán)節(jié)包括:課堂講授、案例分析課、討論課、課后作業(yè)。通過本課程各個教學(xué)環(huán)節(jié)的教學(xué),使學(xué)生掌握數(shù)據(jù)挖掘的基本方法,培養(yǎng)學(xué)生的自學(xué)能力、動手能力、分析問題和解決問題的能力。通過本課程的學(xué)習(xí),要求學(xué)生達到以下要求。了解數(shù)據(jù)挖掘技術(shù)的整體概貌。了解數(shù)據(jù)挖掘技術(shù)的主要應(yīng)用領(lǐng)域及當(dāng)前的研究熱點問題和發(fā)展方向。掌握最基本的概念、算法原理和技術(shù)方法。本課程課外學(xué)習(xí)與修學(xué)指導(dǎo):由于該課程涉及的技術(shù)都是目前比較熱門的技術(shù),內(nèi)容復(fù)雜,難度較大,且具有很強的理論性和實踐性,所以要學(xué)好本課程,必須做到理論與實踐緊密結(jié)合,才能達到較好的學(xué)習(xí)效果。要求學(xué)生多參閱相關(guān)書籍和資料,多上機實驗,掌握數(shù)據(jù)挖掘的基本功能、主要算法及其實現(xiàn)過程。五、學(xué)時數(shù)分配表:序號授課內(nèi)容學(xué)時1數(shù)據(jù)挖掘概述62Pandas數(shù)據(jù)分析23機器學(xué)習(xí)54分類算法與應(yīng)用65回歸算法與應(yīng)用46無監(jiān)督學(xué)習(xí)57關(guān)聯(lián)規(guī)則和協(xié)同過濾38圖像數(shù)據(jù)分析39自然語言處理與NLTK3合計37第一章數(shù)據(jù)挖掘概述教學(xué)要點:理解和掌握數(shù)據(jù)挖掘與機器學(xué)習(xí)的基本概念、功能與應(yīng)用領(lǐng)域,使讀者掌握數(shù)據(jù)挖掘的基本理念、流程和方法。了解數(shù)據(jù)分析技術(shù)的發(fā)展歷史和未來趨勢,了解數(shù)據(jù)挖掘與機器學(xué)習(xí)的應(yīng)用領(lǐng)域和面臨的問題。3.對數(shù)據(jù)挖掘和機器學(xué)習(xí)能解決的問題和解決問題思路有清晰的認識。教學(xué)時數(shù):6學(xué)時??己艘c:了解數(shù)據(jù)挖掘的定義和功能,理解數(shù)據(jù)挖掘在何種數(shù)據(jù)上進行,數(shù)據(jù)挖掘可以挖掘什么類型的模式,掌握初級的數(shù)據(jù)分析方法。Pandas數(shù)據(jù)分析教學(xué)要點:理解Pandas模塊的語法結(jié)構(gòu),并通過對自行車行駛數(shù)據(jù)與服務(wù)熱線數(shù)據(jù)的分析,使讀者掌握通過Pandas模塊對數(shù)據(jù)進行統(tǒng)計分析的方法。教學(xué)時數(shù):2學(xué)時。考核要點:掌握Python編程基礎(chǔ),理解Pandas的數(shù)據(jù)結(jié)構(gòu),熟悉Pandas統(tǒng)計分析常用的函數(shù),掌握使用Pandas進行數(shù)據(jù)分析的基本方法。機器學(xué)習(xí)教學(xué)要點:理解機器學(xué)習(xí)的基本概念,介紹機器學(xué)習(xí)的框架、機器學(xué)習(xí)的模型、機器學(xué)習(xí)的評判。理解Sklearn模塊的語法結(jié)構(gòu),使讀者掌握搭建機器學(xué)習(xí)流水線的方法。支持向量機概述和特點,過擬合問題。教學(xué)時數(shù):5學(xué)時。考核要點:理解并掌握機器學(xué)習(xí)的基本框架,以及Sklearn模塊的語法結(jié)構(gòu),熟練掌握搭建機器學(xué)習(xí)流水線的方法。分類算法與應(yīng)用教學(xué)要點:學(xué)習(xí)數(shù)據(jù)挖掘分類問題以及分類問題的基本流程。理解概率模型的原理及應(yīng)用場景。理解樸素貝葉斯分類的原理及應(yīng)用場景。理解空間向量模型的原理及應(yīng)用場景。理解KNN算法的原理及應(yīng)用場景。多類問題的原理及應(yīng)用場景。教學(xué)時數(shù):6學(xué)時??己艘c:掌握分類和預(yù)測的基本概念和問題,掌握決策樹分類的方法,理解基于規(guī)則分類的方法,了解貝葉斯分類和后向傳播分類方法,掌握預(yù)測的方法。理解并應(yīng)用分類算法,使讀者掌握通過Sklearn模塊搭建一個分類器并實現(xiàn)分類功能的方法。第五章回歸算法與應(yīng)用教學(xué)要點:掌握回歸分析原理的基本概念。掌握一元線性回歸分析。掌握多元線性回歸分析。掌握邏輯回歸。了解其他回歸分析。介紹線性回歸、嶺回歸和LASSO以及邏輯回歸模型的實驗實現(xiàn)。教學(xué)時數(shù):4學(xué)時。考核要點:理解回歸算法與應(yīng)用的基本原理,使讀者掌握通過Sklearn模塊搭建一個回歸模型并實現(xiàn)回歸功能的方法。第六章無監(jiān)督學(xué)習(xí)教學(xué)要點:理解并掌握無監(jiān)督學(xué)習(xí)的基本概念。闡釋聚類分析的基本概念與原理和降維的基本概念與原理,學(xué)習(xí)聚類問題的基本分析流程。介紹K-Means算法、層次聚類算法等,舉例說明和實現(xiàn)K-Means算法和降維問題。教學(xué)時數(shù):5學(xué)時。考核要點:理解無監(jiān)督學(xué)習(xí)的基本概念,使讀者掌握通過Sklearn模塊搭建一個聚類模型并實現(xiàn)聚類功能的方法。關(guān)聯(lián)規(guī)則和協(xié)同過濾教學(xué)要點:理解并掌握關(guān)聯(lián)規(guī)則的基本概念和挖掘過程。理解并掌握Apriori算法的基本概念和實現(xiàn)原理。理解并掌握協(xié)同過濾的基本概念和實現(xiàn)過程。介紹基于協(xié)同過濾算法的電影推薦。教學(xué)時數(shù):3學(xué)時。考核要點:理解關(guān)聯(lián)規(guī)則和協(xié)同過濾基本概念和實現(xiàn)原理,使讀者掌握通過這些算法實現(xiàn)電影推薦的方法。圖像數(shù)據(jù)分析教學(xué)要點:理解并掌握圖像數(shù)據(jù)的概念,圖像的分類以及與圖像相關(guān)的基本概念等。理解并掌握圖像數(shù)據(jù)的分析方法。介紹圖像數(shù)據(jù)分析的應(yīng)用案例。教學(xué)時數(shù):3學(xué)時??己艘c:介紹圖像數(shù)據(jù)分析的相關(guān)技術(shù),使讀者掌握進行圖像特征提取和人臉識別的方法。使讀者通過學(xué)習(xí)熟練掌握如何使用Python工具包進行圖像讀/寫、顯示、圖像恢復(fù)、增強、特征提取等。請讀者利用公開的圖像分類/識別數(shù)據(jù)集,或者自建數(shù)據(jù)集,對其進行特征提取,利用機器學(xué)習(xí)算法學(xué)習(xí)分類模型,并驗證分類模型的效果。第九章自然語言處理與NLTK教學(xué)要點:理解并掌握自然語言處理的基本概念。介紹常用的自然語言處理技術(shù)。詳細介紹目前應(yīng)用范圍最廣泛的Python自然語言處理模塊—NLTK的應(yīng)用。教學(xué)時數(shù):3學(xué)時??己艘c:介紹自然語言處理的相關(guān)技術(shù),使讀者掌握進行文本特征提取和文本分類的方法。電子商務(wù)是與數(shù)據(jù)分析關(guān)系非常緊密的重要行業(yè)之一,也是數(shù)據(jù)分析廣泛應(yīng)用的行業(yè)之一。通過數(shù)據(jù)分析對數(shù)據(jù)進行有效的整理和分析,為企業(yè)經(jīng)營決策提供參考依據(jù),進而為企業(yè)創(chuàng)造更多的價值,是數(shù)據(jù)分析在電子商務(wù)領(lǐng)域應(yīng)用的主要目的。電子商務(wù)數(shù)據(jù)分析的相關(guān)概念電子商務(wù)數(shù)據(jù)分析是運用分析工具研究電子商務(wù)數(shù)據(jù)信息,搭建數(shù)據(jù)分析與電子商務(wù)管理的橋梁,指導(dǎo)電子商務(wù)決策的一門新興學(xué)科。通常概念下,電子商務(wù)數(shù)據(jù)分析指的是對電子商務(wù)經(jīng)營過程中產(chǎn)生的數(shù)據(jù)進行分析,在研究大量的數(shù)據(jù)的過程中尋找模式、相關(guān)性和其他有用的信息,從而幫助商家做出決策。通過對相關(guān)數(shù)據(jù)的有效統(tǒng)計、分析和使用,形成多種模型,促進客戶、商業(yè)伙伴之間的溝通及優(yōu)化應(yīng)用,通常需要計算機軟件的支持。數(shù)據(jù)分析“數(shù)據(jù)”是人們通過觀察、實驗或計算得出的結(jié)果。數(shù)據(jù)有很多種,最簡單的就是數(shù)字,也可以是文字、圖像、聲音等。數(shù)據(jù)可用于各類研究、設(shè)計、查證等工作?!胺治觥笔菍⒀芯繉ο蟮恼w分為若干部分、方面、因素和層次,并分別加以考察的認識活動。分析的意義在于細致地尋找能夠解決問題的主線,并以此解決問題。數(shù)據(jù)分析是指用適當(dāng)?shù)慕y(tǒng)計分析方法對收集來的大量數(shù)據(jù)進行分析,將它們加以匯總和理解并消化,以求最大化地開發(fā)數(shù)據(jù)的功能,發(fā)揮數(shù)據(jù)的作用。數(shù)據(jù)分析是為了提取有用信息和形成結(jié)論而對數(shù)據(jù)加以詳細研究和概括總結(jié)的過程。數(shù)據(jù)分析可幫助人們做出正確的判斷,以便采取適當(dāng)行動。數(shù)據(jù)分析的數(shù)學(xué)與統(tǒng)計學(xué)基礎(chǔ)在20世紀早期就已確立,但直到計算機的出現(xiàn)才使得實際操作成為可能,并使得數(shù)據(jù)分析得以推廣。數(shù)據(jù)分析是數(shù)學(xué)、統(tǒng)計學(xué)、計算機科學(xué)等相關(guān)學(xué)科相結(jié)合的產(chǎn)物。數(shù)據(jù)分析的目的數(shù)據(jù)分析的目的是把隱藏在大量看來雜亂無章的數(shù)據(jù)中的信息集中和提煉出來,從而找出所研究對象的內(nèi)在規(guī)律。在實際應(yīng)用中,數(shù)據(jù)分析可幫助人們做出判斷,以便采取適當(dāng)?shù)男袆?。?shù)據(jù)分析是有組織有目的地收集數(shù)據(jù)、分析數(shù)據(jù),使之成為信息的過程。這一過程是質(zhì)量管理體系的支持過程。在產(chǎn)品的整個壽命周期,包括從市場調(diào)研到售后服務(wù)和最終處置的各個過程都需要適當(dāng)運用數(shù)據(jù)分析過程,以提升有效性。例如,設(shè)計人員在開始一個新的設(shè)計以前,要通過廣泛的設(shè)計調(diào)查,分析所得數(shù)據(jù)以判定設(shè)計方向。因此數(shù)據(jù)分析具有極其廣泛的應(yīng)用。數(shù)據(jù)分析的分類一般把數(shù)據(jù)分析分為三類:探索性數(shù)據(jù)分析(ExploratoryDataAnalysis,EDA),驗證性數(shù)據(jù)分析(ConfirmatoryDataAnalysis,CDA)和定性數(shù)據(jù)分析。①EDA是指對已有的數(shù)據(jù)在盡量少的先驗假定下進行探索,側(cè)重于在數(shù)據(jù)之中發(fā)現(xiàn)新的特征。本質(zhì)上是從客觀數(shù)據(jù)出發(fā),探索其內(nèi)在的數(shù)據(jù)規(guī)律,讓數(shù)據(jù)自己說話。②CDA是指在進行分析之前一般都有預(yù)先設(shè)定的模型,側(cè)重于已有假設(shè)的證實或證偽。③定性數(shù)據(jù)分析是依據(jù)預(yù)測者的主觀判斷分析能力來推斷事物的性質(zhì)和發(fā)展趨勢的分析方法。數(shù)據(jù)可視化數(shù)據(jù)可視化旨在將數(shù)據(jù)分析的結(jié)果通過表格、圖標和信息圖的方式直觀地展示出來,使他人更容易、更快速得到并理解數(shù)據(jù)分析結(jié)果。數(shù)據(jù)可視化工具有很多,如Tableau、PowerBI、Python、Excel、World、PowerPoint等?,F(xiàn)代社會已經(jīng)進入一個速讀時代,好的可視化圖表可以清楚地表達數(shù)據(jù)分析的結(jié)果,節(jié)約人們思考的時間。數(shù)據(jù)分析的使用者有大數(shù)據(jù)分析專家和普通客戶,他們對于大數(shù)據(jù)分析最基本的要求就是數(shù)據(jù)可視化,因為數(shù)據(jù)可視化能夠直觀地呈現(xiàn)大數(shù)據(jù)的特點,讓觀者直接看到結(jié)果,發(fā)現(xiàn)數(shù)據(jù)規(guī)律,獲取敏銳洞察,讓數(shù)據(jù)分析更簡單、更智能。大數(shù)據(jù)大數(shù)據(jù)(bigdata)是指無法在一定時間范圍內(nèi)用常規(guī)軟件工具進行捕捉、管理和處理的數(shù)據(jù)集合,是需要新處理模式才能具有更強的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn)。大數(shù)據(jù)的特點IBM提出大數(shù)據(jù)的5V特點:Volume(大量)、Velocity(高速)、Variety(多樣)、Value(低價值密度)、Veracity(真實性)。①Volume:數(shù)據(jù)量大,即采集、存儲和計算的數(shù)據(jù)量都非常大。真正大數(shù)據(jù)的起始計量單位往往是TB(1024GB)、PB(1024TB)。②Velocity:數(shù)據(jù)增長速度快,處理速度也快,時效性要求高。比如,搜索引擎要求幾分鐘前的新聞能夠被用戶查詢到,個性化推薦算法盡可能要求實時完成推薦。這是大數(shù)據(jù)區(qū)別于傳統(tǒng)數(shù)據(jù)挖掘的顯著特征。③Variety:種類和來源多樣化。種類上包括結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),具體表現(xiàn)為網(wǎng)絡(luò)日志、音頻、視頻、圖片、地理位置信息等,數(shù)據(jù)的多類型對數(shù)據(jù)處理能力提出了更高的要求。數(shù)據(jù)可以由傳感器等自動收集,也可以由人類手工記錄。④Value:數(shù)據(jù)價值密度相對較低。隨著互聯(lián)網(wǎng)及物聯(lián)網(wǎng)的廣泛應(yīng)用,信息感知無處不在,信息量大,但價值密度較低。如何結(jié)合業(yè)務(wù)邏輯并通過強大的機器算法來挖掘數(shù)據(jù)的價值,是大數(shù)據(jù)時代最需要解決的問題。⑤Veracity:數(shù)據(jù)的準確性和可信賴度高,即數(shù)據(jù)的質(zhì)量高。數(shù)據(jù)本身如果是虛假的,那么它就失去了存在的意義,因為任何通過虛假數(shù)據(jù)得出的結(jié)論都可能是錯誤的,甚至是相反的。大數(shù)據(jù)的作用①對大數(shù)據(jù)的處理分析正成為新一代信息技術(shù)融合應(yīng)用的結(jié)點。通過對不同來源數(shù)據(jù)的管理、處理、分析與優(yōu)化,將創(chuàng)造出巨大的經(jīng)濟和社會價值。②大數(shù)據(jù)是信息產(chǎn)業(yè)持續(xù)高速增長的新引擎。面向大數(shù)據(jù)市場的新技術(shù)、新產(chǎn)品、新服務(wù)、新業(yè)態(tài)會不斷涌現(xiàn)。③大數(shù)據(jù)利用將成為提高核心競爭力的關(guān)鍵因素。各行各業(yè)的決策正在從“業(yè)務(wù)驅(qū)動”轉(zhuǎn)變?yōu)椤皵?shù)據(jù)驅(qū)動”。數(shù)據(jù)分析可以使零售商實時掌握市場動態(tài)并迅速做出應(yīng)對;可以為商家制定更加精準有效的營銷策略提供決策支持;可以幫助企業(yè)為消費者提供更加及時和個性化的服務(wù)。④大數(shù)據(jù)時代科學(xué)研究的方法手段將發(fā)生重大改變。在大數(shù)據(jù)時代可通過實時監(jiān)測、跟蹤研究對象在互聯(lián)網(wǎng)上產(chǎn)生的海量行為數(shù)據(jù)進行挖掘分析,揭示出規(guī)律性的東西,提出研究結(jié)論和對策?!局R拓展】對大數(shù)據(jù)常見的兩個誤解數(shù)據(jù)不等于信息。經(jīng)常有人把數(shù)據(jù)和信息當(dāng)作同義詞來用。其實不然,數(shù)據(jù)指的是一個原始的數(shù)據(jù)點(無論是通過數(shù)字,文字,圖片還是視頻等),信息則直接與內(nèi)容掛鉤,需要有資訊性(informative)。數(shù)據(jù)越多,不一定就能代表信息越多,更不能代表信息就會成比例增多。有兩個簡單的例子,一是備份,很多人如今已經(jīng)會定期的對自己的硬盤進行備份。每次備份都會創(chuàng)造出一組新的數(shù)據(jù),但信息并沒有增多。二是多個社交網(wǎng)站上的信息,當(dāng)人們接觸到的社交網(wǎng)站越多,獲得的數(shù)據(jù)就會成比例的增多,獲得的信息雖然也會增多,但卻不會成比例的增多。因為很多網(wǎng)站上的內(nèi)容十分類似。信息不等于智慧。通過技術(shù)手段可以去除數(shù)據(jù)中所有重復(fù)的部分,也整合了內(nèi)容類似的數(shù)據(jù),這樣的信息對我們就一定有用嗎?不一定,信息要能轉(zhuǎn)化成智慧,至少要滿足以下3個標準:①可破譯性。這可能是大數(shù)據(jù)時代特有的問題,越來越多的企業(yè)每天都會生產(chǎn)出大量的數(shù)據(jù),卻不知該如何利用,企業(yè)就將這些數(shù)據(jù)暫時非結(jié)構(gòu)化(unstructured)的存儲起來,但這些非結(jié)構(gòu)化的數(shù)據(jù)卻不一定可破譯,因此不可能成為智慧。②關(guān)聯(lián)性。無關(guān)的信息,至多只是噪音。③新穎性。例如,某電子商務(wù)公司通過一組數(shù)據(jù)/信息分析出了客戶愿意為當(dāng)天送貨的產(chǎn)品多支付10元,接著又通過另一組完全獨立的數(shù)據(jù)/信息得到了同樣的內(nèi)容。這樣的情況下,后者就不具備新穎性。因此,很多時候只有在處理了大量的數(shù)據(jù)和信息以后才能判斷它們的新穎性。云計算云計算(cloudcomputing)是一種分布式計算技術(shù),通過網(wǎng)絡(luò)將龐大的計算處理程序自動分拆成無數(shù)個較小的子程序,再交由多部服務(wù)器所組成的龐大系統(tǒng)經(jīng)搜尋、計算分析之后將處理結(jié)果回傳給用戶。云計算是一種資源交付和使用模式,通過網(wǎng)絡(luò)獲得應(yīng)用所需的資源(硬件、平臺、軟件),提供資源的網(wǎng)絡(luò)被稱為“云”。“云”中的資源在使用者看來是可以無限擴展的,并且可以隨時獲取。通過這項技術(shù),網(wǎng)絡(luò)服務(wù)提供者可以在數(shù)秒之內(nèi)達成處理數(shù)以千萬計甚至億計的信息,達到和“超級計算機”同樣強大效能的網(wǎng)絡(luò)服務(wù)。目前云計算包含三個層次的內(nèi)容:IaaS、PaaS和SaaS。①IaaS(InfrastructureasaService):基礎(chǔ)設(shè)施即服務(wù),指把IT基礎(chǔ)設(shè)施作為一種服務(wù)通過網(wǎng)絡(luò)對外提供,并根據(jù)用戶對資源的實際使用量或占用量進行計費的一種服務(wù)模式。②SaaS(SoftwareasaService):軟件即服務(wù),即通過網(wǎng)絡(luò)提供軟件服務(wù)。SaaS平臺供應(yīng)商將應(yīng)用軟件統(tǒng)一部署在自己的服務(wù)器上,客戶可以根據(jù)工作實際需求,通過互聯(lián)網(wǎng)向廠商定購所需的應(yīng)用軟件服務(wù),按定購的服務(wù)多少和時間長短向廠商支付費用,并通過互聯(lián)網(wǎng)獲得SaaS平臺供應(yīng)商提供的服務(wù)。③PaaS(PlatformasaService):平臺即服務(wù),即把服務(wù)器平臺或者開發(fā)環(huán)境作為一種服務(wù)提供的商業(yè)模式?!緮?shù)據(jù)視野】云計算的實際應(yīng)用在2020天貓雙11全球狂歡季紀錄之夜,據(jù)雙11實時交易數(shù)據(jù)顯示,11月1日至11日,2020天貓雙11訂單創(chuàng)建峰值達58.3萬筆/秒。成功扛住大規(guī)模流量、支撐各大電商平臺“雙11”購物盛況的正是背后的阿里云、騰訊云等各大云計算服務(wù)平臺。有了云計算,用戶可以不用關(guān)心機房建設(shè)、機器運行維護、數(shù)據(jù)庫等IT資源建設(shè),而可以結(jié)合自身需要,靈活地獲得對應(yīng)的云計算整體解決方案。阿里巴巴、騰訊、華為等行業(yè)領(lǐng)先企業(yè)在滿足自身需求后,又將這種軟硬件能力提供給有需要的其他企業(yè)。云平臺的成本、安全和管理集約優(yōu)勢可以降低IT架構(gòu)和系統(tǒng)構(gòu)建的成本并按需提供彈性的IT服務(wù)。云計算已被廣泛應(yīng)用在互聯(lián)網(wǎng)、金融、零售、政務(wù)、醫(yī)療、教育、文旅、出行、工業(yè)、能源等各個行業(yè),并發(fā)揮了巨大作用。如,鐵路12306系統(tǒng)就使用阿里云平臺支撐春運等購票峰值的IT需求,保障系統(tǒng)在高峰期的穩(wěn)定運行。另一方面,云計算也成為城市、政府和各行業(yè)數(shù)字化轉(zhuǎn)型的基礎(chǔ)支撐。當(dāng)前無論是電商平臺,還是網(wǎng)上外賣平臺、在線游戲中心、熱點網(wǎng)站,或是工業(yè)互聯(lián)網(wǎng)都離不開云計算。數(shù)據(jù)挖掘數(shù)據(jù)挖掘又稱數(shù)據(jù)庫中的知識發(fā)現(xiàn)(KnowledgeDiscoverinDatabase,KDD),是目前人工智能和數(shù)據(jù)庫領(lǐng)域研究的熱點問題,所謂數(shù)據(jù)挖掘是指從數(shù)據(jù)庫的大量數(shù)據(jù)中揭示出隱含的、先前未知的并有潛在價值的信息的非平凡過程。數(shù)據(jù)挖掘是一種決策支持過程,它主要基于人工智能、機器學(xué)習(xí)、模式識別、統(tǒng)計學(xué)、數(shù)據(jù)庫、可視化技術(shù)等,高度自動化地分析企業(yè)的數(shù)據(jù),做出歸納性的推理,從中挖掘出潛在的模式,幫助決策者調(diào)整市場策略,減少風(fēng)險,做出正確的決策。利用數(shù)據(jù)挖掘進行數(shù)據(jù)分析常用的方法主要有分類、回歸分析、聚類、關(guān)聯(lián)規(guī)則、特征提取、變化和偏差分析、Web文本挖掘等。分類。分類是找出數(shù)據(jù)庫中一組數(shù)據(jù)對象的共同特點并按照分類模式將其劃分為不同的類。其目的是通過分類模型,將數(shù)據(jù)庫中的數(shù)據(jù)項映射到某個給定的類別。它可以應(yīng)用到客戶的分類、客戶的屬性和特征分析、客戶滿意度分析、客戶的購買趨勢預(yù)測等,如一個汽車零售商將客戶按照對汽車的喜好劃分成不同的類,這樣營銷人員就可以將新型汽車的廣告手冊直接郵寄到有這種喜好的客戶手中,從而增加了商業(yè)機會?;貧w分析?;貧w分析方法反映的是事務(wù)數(shù)據(jù)庫中屬性值在時間上的特征,產(chǎn)生一個將數(shù)據(jù)項映射到一個實值預(yù)測變量的函數(shù),發(fā)現(xiàn)變量或?qū)傩蚤g的依賴關(guān)系,其主要研究問題包括數(shù)據(jù)序列的趨勢特征、數(shù)據(jù)序列的預(yù)測以及數(shù)據(jù)間的相關(guān)關(guān)系等。它可以應(yīng)用到市場營銷的各個方面,如客戶尋求、保持和預(yù)防客戶流失活動、產(chǎn)品生命周期分析、銷售趨勢預(yù)測及有針對性的促銷活動等。聚類分析。聚類分析是把一組數(shù)據(jù)按照相似性和差異性分為幾個類別,其目的是使得屬于同一類別的數(shù)據(jù)間的相似性盡可能大,不同類別中的數(shù)據(jù)間的相似性盡可能小。它可以應(yīng)用到客戶群體的分類、客戶背景分析、客戶購買趨勢預(yù)測、市場的細分等。關(guān)聯(lián)規(guī)則。關(guān)聯(lián)規(guī)則是描述數(shù)據(jù)庫中數(shù)據(jù)項之間所存在的關(guān)系的規(guī)則,即根據(jù)一個事務(wù)中某些項的出現(xiàn)可導(dǎo)出另一些項在同一事務(wù)中也出現(xiàn),即隱藏在數(shù)據(jù)間的關(guān)聯(lián)或相互關(guān)系。在客戶關(guān)系管理中,通過對企業(yè)的客戶數(shù)據(jù)庫里的大量數(shù)據(jù)進行挖掘,可以從大量的記錄中發(fā)現(xiàn)有趣的關(guān)聯(lián)關(guān)系,找出影響市場營銷效果的關(guān)鍵因素,為產(chǎn)品定位、定價與定制客戶群,客戶尋求、細分與保持,市場營銷與推銷,營銷風(fēng)險評估和詐騙預(yù)測等決策支持提供參考依據(jù)。特征提取。特征分析是從一組數(shù)據(jù)中提取出關(guān)于這些數(shù)據(jù)的特征式,這些特征式表達了該數(shù)據(jù)集的總體特征。如營銷人員通過對客戶流失因素的特征提取,可以得到導(dǎo)致客戶流失的一系列原因和主要特征,利用這些特征可以有效地預(yù)防客戶的流失。變化和偏差分析。偏差包括很大一類潛在有趣的知識,如分類中的反常實例,模式的例外,觀察結(jié)果對期望的偏差等,其目的是尋找觀察結(jié)果與參照量之間有意義的差別。在企業(yè)危機管理及其預(yù)警中,管理者更感興趣的是那些意外規(guī)則。意外規(guī)則的挖掘可以應(yīng)用到各種異常信息的發(fā)現(xiàn)、分析、識別、評價和預(yù)警等方面。Web文本挖掘。隨著Internet的迅速發(fā)展及Web的全球普及,使得Web上的信息量無比豐富,通過對Web的挖掘,可以利用Web的海量數(shù)據(jù)進行分析,收集政治、經(jīng)濟、政策、科技、金融、各種市場、競爭對手、供求信息、客戶等有關(guān)的信息,集中精力分析和處理那些對企業(yè)有重大或潛在重大影響的外部環(huán)境信息和內(nèi)部經(jīng)營信息,并根據(jù)分析結(jié)果找出企業(yè)管理過程中出現(xiàn)的各種問題和可能引起危機的先兆,對這些信息進行分析和處理,以便識別、分析、評價和管理危機。數(shù)據(jù)質(zhì)量更好的數(shù)據(jù)意味著更好的決策,數(shù)據(jù)分析的前提就是要保證數(shù)據(jù)質(zhì)量。因此,在數(shù)據(jù)分析和數(shù)據(jù)挖掘之前,必須完成數(shù)據(jù)質(zhì)量的處理工作,主要包括兩方面:數(shù)據(jù)的集成和數(shù)據(jù)的清洗,關(guān)注的對象主要有原始數(shù)據(jù)和元數(shù)據(jù)兩方面。數(shù)據(jù)的集成。數(shù)據(jù)的集成主要解決信息孤島的問題,包括兩方面:數(shù)據(jù)倉庫對元數(shù)據(jù)的集成和元數(shù)據(jù)系統(tǒng)對不同數(shù)據(jù)源中的元數(shù)據(jù)集成。相應(yīng)地,數(shù)據(jù)質(zhì)量管理也關(guān)注兩方面:對數(shù)據(jù)倉庫中真實數(shù)據(jù)的質(zhì)量探查和剖析,以及對元數(shù)據(jù)系統(tǒng)中元數(shù)據(jù)的數(shù)據(jù)質(zhì)量的檢查。元數(shù)據(jù)的管理目標是整合信息資產(chǎn)、支撐數(shù)據(jù)在使用過程中的透明可視,提升數(shù)據(jù)報告、數(shù)據(jù)分析、數(shù)據(jù)挖掘的可信度。數(shù)據(jù)的清洗。數(shù)據(jù)質(zhì)量處理主要是采用一些數(shù)據(jù)清洗規(guī)則處理缺失數(shù)據(jù)、去除重復(fù)數(shù)據(jù)、去除噪聲數(shù)據(jù)、處理異常(但真實)的數(shù)據(jù),從而保證數(shù)據(jù)的完整性、唯一性、一致性、精確性、合法性和及時性。【知識拓展】元數(shù)據(jù)元數(shù)據(jù)是指信息的信息,是描述信息的屬性信息。一個信息的元數(shù)據(jù)可以分為三類。①固有性元數(shù)據(jù):是指事物固有的與事物構(gòu)成有關(guān)的元數(shù)據(jù);②管理性元數(shù)據(jù):是指與事物處理方式有關(guān)的元數(shù)據(jù);③描述性元數(shù)據(jù):是指與事物本質(zhì)有關(guān)的元數(shù)據(jù)。以攝像鏡頭為例,鏡頭的固有性元數(shù)據(jù)包括品牌、參數(shù)、類型、重量、光圈、焦距等信息;鏡頭的管理性元數(shù)據(jù)包括商品類型、上架時間及庫存情況;鏡頭的描述性元數(shù)據(jù)包括用途和特色,如人文紀實和人像攝影。電子商務(wù)數(shù)據(jù)分析的意義優(yōu)化市場定位電子商務(wù)企業(yè)要想在互聯(lián)網(wǎng)市場站穩(wěn)腳跟,必須架構(gòu)大數(shù)據(jù)戰(zhàn)略,對外要拓寬電子商務(wù)行業(yè)調(diào)研數(shù)據(jù)的廣度和深度,從數(shù)據(jù)中了解電子商務(wù)行業(yè)市場的構(gòu)成、細分市場特征、消費者需求和競爭者狀況等眾多因素;對內(nèi)企業(yè)想進入或開拓某一區(qū)域電子商務(wù)行業(yè)市場,首先要進行項目評估和可行性分析,決定是否開拓某塊市場,最大化規(guī)避市場定位不精準給投資商和企業(yè)自身帶來的毀滅性損失。市場定位對電子商務(wù)行業(yè)市場開拓非常重要,但是,要想做到這一點,就必須有足夠的信息數(shù)據(jù)來供電子商務(wù)行業(yè)研究人員分析和判斷。數(shù)據(jù)的收集、整理就成了最關(guān)鍵的步驟之一。在傳統(tǒng)分析情況下,分析數(shù)據(jù)的收集主要來自統(tǒng)計年鑒、行業(yè)管理部門數(shù)據(jù)、相關(guān)行業(yè)報告、行業(yè)專家意見及屬地市場調(diào)查等,這些數(shù)據(jù)大多存在樣品量不足、時間滯后和準確度低等缺陷,研究人員能夠獲得的有效信息量非常有限,使準確的市場定位存在著數(shù)據(jù)瓶頸。但在互聯(lián)網(wǎng)時代,借助信息采集和數(shù)據(jù)分析技術(shù),不僅能夠給研究人員提供足夠的樣本量和數(shù)據(jù)信息,而且能夠建立基于大數(shù)據(jù)的數(shù)學(xué)模型對企業(yè)未來市場進行預(yù)測。優(yōu)化市場營銷從搜索引擎、社交網(wǎng)絡(luò)的普及到手機等智能移動設(shè)備,互聯(lián)網(wǎng)上的信息總量正以極快的速度不斷暴漲。每天的社交網(wǎng)絡(luò)、微博、微信、論壇、新聞評論、電子商務(wù)平臺上分享的各種文本、照片、視頻、音頻等信息高達幾百億甚至幾千億條,涵蓋商家信息、個人信息、行業(yè)資訊、產(chǎn)品使用體驗、商品瀏覽記錄、商品成交記錄、產(chǎn)品價格動態(tài)等海量信息。這些數(shù)據(jù)通過集成融合可以形成電子商務(wù)行業(yè)的大數(shù)據(jù),其背后隱藏的是電子商務(wù)行業(yè)的市場需求、競爭情報。在電子商務(wù)行業(yè)市場營銷中,無論是產(chǎn)品、渠道、價格還是客戶,可以說每一項工作都與數(shù)據(jù)的采集和分析息息相關(guān),以下兩個方面內(nèi)容是電子商務(wù)行業(yè)市場營銷工作的重中之重:①對外:通過獲取數(shù)據(jù)并加以統(tǒng)計分析來充分了解市場信息,掌握競爭者的商情和動態(tài),知曉產(chǎn)品在競爭群中所處的市場地位,達到“知己知彼,百戰(zhàn)不殆”的目的;②對內(nèi):企業(yè)通過積累和挖掘電子商務(wù)行業(yè)消費者數(shù)據(jù),有助于分析消費者的消費行為和價值趨向,便于更好地為消費者服務(wù)和發(fā)展忠誠客戶。助力電子商務(wù)企業(yè)的收益管理收益管理是起源于20世紀80年代,是謀求收入最大化的新經(jīng)營管理技術(shù),意在把合適的產(chǎn)品或服務(wù)在合適的時間以合適的價格,通過合適的銷售渠道出售給合適的顧客,最終實現(xiàn)企業(yè)收益最大化目標。要達到收益管理的目標,需求預(yù)測、細分市場和敏感度分析是此項工作的3個重要環(huán)節(jié),而這3個環(huán)節(jié)推進的基礎(chǔ)就是數(shù)據(jù)分析。①需求預(yù)測。通過數(shù)據(jù)統(tǒng)計與分析,采取科學(xué)的預(yù)測方法建立數(shù)學(xué)模型,使企業(yè)管理者掌握和了解電子商務(wù)行業(yè)的潛在市場需求、未來一段時間每個細分市場的產(chǎn)品銷售量和產(chǎn)品價格走勢等,從而使企業(yè)能夠通過價格的杠桿來調(diào)節(jié)市場的供需平衡,針對不同的細分市場來實行動態(tài)的前瞻性措施,并在不同的市場波動周期以合適的產(chǎn)品和價格投放市場,獲得潛在的收益。②細分市場。為企業(yè)預(yù)測銷售量和實行差別定價提供條件,其科學(xué)性體現(xiàn)在通過電子商務(wù)行業(yè)市場需求預(yù)測來制定和更新價格,使各個細分市場的收益最大化。③敏感度分析。通過需求價格彈性分析技術(shù),對不同細分市場的價格進行優(yōu)化,最大限度地挖掘市場潛在的收入。需求預(yù)測、細分市場和敏感度分析對數(shù)據(jù)需求量很大,而傳統(tǒng)的數(shù)據(jù)分析大多是采集企業(yè)自身的歷史數(shù)據(jù)來進行預(yù)測和分析的,容易忽視整個電子商務(wù)行業(yè)的信息數(shù)據(jù),因此預(yù)測結(jié)果難免存在偏差。企業(yè)在實施收益管理的過程中,在自有數(shù)據(jù)的基礎(chǔ)上,依靠自動化信息采集軟件來收集更多的電子商務(wù)行業(yè)數(shù)據(jù),了解更多的電子商務(wù)行業(yè)市場信息,將會對制定準確的收益策略、贏得更高的收益起到推進作用。協(xié)助創(chuàng)造客戶新的需求差異化競爭的本質(zhì)在于不停留在產(chǎn)品原有屬性的優(yōu)化上,而是創(chuàng)造產(chǎn)品的新屬性。滿足客戶需求是前提,但創(chuàng)造客戶新需求才是行業(yè)革命的必要條件。隨著網(wǎng)絡(luò)社交媒體的技術(shù)進步,公眾分享信息變得更加便捷自由,微博、微信、點評網(wǎng)、評論版上眾多的網(wǎng)絡(luò)評論形成了交互性的數(shù)據(jù),其中蘊藏了巨大的電子商務(wù)行業(yè)需求開發(fā)的價值,這些數(shù)據(jù)已經(jīng)受到了電子商務(wù)企業(yè)管理者的高度重視。很多企業(yè)已把“評論管理”作為核心任務(wù),既可以通過客戶評論及時發(fā)現(xiàn)負面信息進行危機公關(guān),更重要的是可以通過對這些數(shù)據(jù)進行分析,挖掘客戶需求,進而改良產(chǎn)品,提升客戶體驗。電子商務(wù)數(shù)據(jù)分析的流程及原則電子商務(wù)數(shù)據(jù)分析的流程電子商務(wù)數(shù)據(jù)分析是基于商業(yè)目的,有目的地收集、整理、加工和分析數(shù)據(jù),提煉有價信息的過程。最初的數(shù)據(jù)可能雜亂無章且無規(guī)律,要通過作圖、制表和各種形式的整合來計算某些特征量,探索規(guī)律性的可能形式。這時就需要研究用何種方式去尋找和揭示隱含在數(shù)據(jù)中的規(guī)律性。首先在探索性分析的基礎(chǔ)上提出幾種模型,再通過進一步的分析從中選擇所需的模型,最后使用數(shù)理統(tǒng)計方法對所選定模型或估計的可靠程度和精確程度做出推斷。數(shù)據(jù)分析流程如圖1.1所示,具體步驟如下。確定分析目的與框架針對數(shù)據(jù)分析項目,首先要明確數(shù)據(jù)對象是誰、目的是什么、要解決什么業(yè)務(wù)問題,然后基于商業(yè)的理解,整理分析框架和分析思路。常見的分析目的有減少客戶的流失、優(yōu)化活動效果、提高客戶響應(yīng)率等。不同項目對數(shù)據(jù)的要求不同,使
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 課題申報參考:教師教育神經(jīng)科學(xué)素養(yǎng)的模型構(gòu)建與提升路徑
- 2025年度個人協(xié)議合同范文匯編及法律適用指南4篇
- 醫(yī)院2025年度消防安全管理合同2篇
- 二零二五年度賣房資金墊付及管理協(xié)議4篇
- 騰訊2025年度企業(yè)郵箱遷移服務(wù)合同2篇
- 二零二五版高端奶粉品牌加盟管理合同范本頁2
- 二零二五年度城市公共自行車系統(tǒng)維護與升級合同4篇
- 2025年度勞動合同試用期加班費及休息休假規(guī)定3篇
- 個人商品運輸合同范本錦集
- 二零二五年度臨時工工資支付合同模板
- 加強教師隊伍建設(shè)教師領(lǐng)域?qū)W習(xí)二十屆三中全會精神專題課
- 2024-2025學(xué)年人教版數(shù)學(xué)七年級上冊期末復(fù)習(xí)卷(含答案)
- 2024年決戰(zhàn)行測5000題言語理解與表達(培優(yōu)b卷)
- 四年級數(shù)學(xué)上冊人教版24秋《小學(xué)學(xué)霸單元期末標準卷》考前專項沖刺訓(xùn)練
- 2025年慢性阻塞性肺疾病全球創(chuàng)議GOLD指南修訂解讀課件
- (完整版)減數(shù)分裂課件
- 銀行辦公大樓物業(yè)服務(wù)投標方案投標文件(技術(shù)方案)
- 第01講 直線的方程(九大題型)(練習(xí))
- 微粒貸逾期還款協(xié)議書范本
- 人教版七年級上冊數(shù)學(xué)全冊課時練習(xí)帶答案
- NBT 47013.4-2015 承壓設(shè)備無損檢測 第4部分:磁粉檢測
評論
0/150
提交評論