數(shù)據(jù)分析方法論課件_第1頁
數(shù)據(jù)分析方法論課件_第2頁
數(shù)據(jù)分析方法論課件_第3頁
數(shù)據(jù)分析方法論課件_第4頁
數(shù)據(jù)分析方法論課件_第5頁
已閱讀5頁,還剩129頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

數(shù)據(jù)分析方法論2.1基本方法&2.2高級(jí)方法數(shù)據(jù)分析方法論2.1基本方法&2.2高級(jí)方法11對(duì)比法23CONTENTS拆分法排序法4分組法6降維法7增維法8指標(biāo)法9圖形法5交叉法10SWOT分析法11描述性統(tǒng)計(jì)法12數(shù)據(jù)標(biāo)準(zhǔn)化(指數(shù)化)1對(duì)比法23CONTENTS拆分法排序法4分組法6降維法7增2基本方法數(shù)據(jù)分析有法可循,在分析數(shù)據(jù)時(shí)使用分析方法可以快速有效地分析數(shù)據(jù),從數(shù)據(jù)中獲取信息。常用的基本方法有對(duì)比法、拆分法、排序法、分組法、交叉法、降維法、增維法、指標(biāo)法和圖形法。根據(jù)業(yè)務(wù)場(chǎng)景選擇一種或一種以上的分析方法可以讓分析更加高效。各基本方法的使用場(chǎng)景如表所示。分析方法使用場(chǎng)景對(duì)比法發(fā)現(xiàn)問題拆分法尋找問題的原因排序法找到分析的重點(diǎn)分組法洞察事物特征交叉法將兩個(gè)及以上的維度進(jìn)行比較,并通過交叉的方式分析數(shù)據(jù)降維法解決復(fù)雜問題增維法解決信息量過少的問題指標(biāo)法基本方法,可支持多字段圖形法基本方法,對(duì)分析字段有數(shù)量限制基本方法數(shù)據(jù)分析有法可循,在分析數(shù)據(jù)時(shí)使用分析方法可以快速有3對(duì)比法PARTONE對(duì)比法PARTONE4對(duì)比法是最基本的分析方法也是數(shù)據(jù)分析的“先鋒軍”,分析師在開展分析時(shí)首先使用對(duì)比法,可以快速發(fā)現(xiàn)問題。進(jìn)行商業(yè)分析時(shí)有三個(gè)必備的維度,分別是過去的自己、同期的對(duì)手和同期的行業(yè),通過這三個(gè)維度的對(duì)比可以了解數(shù)據(jù)意義,否則數(shù)據(jù)就是一座孤島。對(duì)比法分為橫向和縱向兩個(gè)方向。橫向?qū)Ρ仁侵缚缇S度的對(duì)比,用于分析不同事物的差異,比如在分析企業(yè)銷售業(yè)績的時(shí)候,將不同行業(yè)的企業(yè)銷售業(yè)績一起進(jìn)行對(duì)比,這樣可以知道某家企業(yè)在整個(gè)市場(chǎng)的地位。如我國500強(qiáng)企業(yè)排行榜單,就是將不同行業(yè)的企業(yè)產(chǎn)值進(jìn)行對(duì)比。縱向?qū)Ρ仁侵冈谕粋€(gè)維度不同階段的對(duì)比,比如基于時(shí)間維度,將今天的銷售業(yè)績和昨天、上個(gè)星期同一天進(jìn)行對(duì)比,可以知道今天銷售業(yè)績的情況。對(duì)比法是最基本的分析方法也是數(shù)據(jù)分析的“先鋒軍”,分析師在開5云計(jì)算和數(shù)據(jù)庫數(shù)據(jù)庫有很多種類型,從最簡單的存儲(chǔ)有各種數(shù)據(jù)的表格到能夠進(jìn)行海量數(shù)據(jù)存儲(chǔ)的大型數(shù)據(jù)庫系統(tǒng)都在各個(gè)方面得到了廣泛的使用。在信息化社會(huì),充分有效地管理和利用各類信息資源,是進(jìn)行科學(xué)研究和決策管理的前提條件。數(shù)據(jù)庫技術(shù)是管理信息系統(tǒng)、辦公自動(dòng)化系統(tǒng)、決策支持系統(tǒng)等各類信息系統(tǒng)的核心部分,是進(jìn)行科學(xué)研究和決策管理的重要技術(shù)手段。云計(jì)算和數(shù)據(jù)庫數(shù)據(jù)庫有很多種類型,從最簡單的存儲(chǔ)有各種數(shù)據(jù)的6云計(jì)算和數(shù)據(jù)庫數(shù)據(jù)庫中的數(shù)據(jù)指的是以一定的數(shù)據(jù)模型組織、描述和儲(chǔ)存在一起、具有盡可能小的冗余度、較高的數(shù)據(jù)獨(dú)立性和易擴(kuò)展性的特點(diǎn)并可在一定范圍內(nèi)為多個(gè)用戶共享。這種數(shù)據(jù)集合具有如下特點(diǎn):云計(jì)算和數(shù)據(jù)庫數(shù)據(jù)庫中的數(shù)據(jù)指的是以一定的數(shù)據(jù)模型組織、描述7云計(jì)算和數(shù)據(jù)庫(1)盡可能不重復(fù);(2)以最優(yōu)方式為某個(gè)特定組織的多種應(yīng)用服務(wù);(3)數(shù)據(jù)結(jié)構(gòu)獨(dú)立于使用它的應(yīng)用程序;(4)對(duì)數(shù)據(jù)的增、刪、改、查由統(tǒng)一軟件進(jìn)行管理和控制。云計(jì)算和數(shù)據(jù)庫(1)盡可能不重復(fù);8云計(jì)算和數(shù)據(jù)庫數(shù)據(jù)庫的基本結(jié)構(gòu)分三個(gè)層次,反映了觀察數(shù)據(jù)庫的三種不同角度。以內(nèi)模式為框架所組成的數(shù)據(jù)庫叫作物理數(shù)據(jù)庫。以概念模式為框架所組成的數(shù)據(jù)叫概念數(shù)據(jù)庫。以外模式為框架所組成的數(shù)據(jù)庫叫用戶數(shù)據(jù)庫。數(shù)據(jù)庫不同層次之間的聯(lián)系是通過映射進(jìn)行轉(zhuǎn)換的。云計(jì)算和數(shù)據(jù)庫數(shù)據(jù)庫的基本結(jié)構(gòu)分三個(gè)層次,反映了觀察數(shù)據(jù)庫的9云計(jì)算和數(shù)據(jù)庫云計(jì)算和數(shù)據(jù)庫10云計(jì)算和數(shù)據(jù)庫(1)物理數(shù)據(jù)層:它是數(shù)據(jù)庫的最內(nèi)層,是物理存儲(chǔ)設(shè)備上實(shí)際存儲(chǔ)的數(shù)據(jù)的集合。這些數(shù)據(jù)是原始數(shù)據(jù),是用戶加工的對(duì)象,由內(nèi)部模式描述的指令操作處理的位串、字符和字組成。(2)概念數(shù)據(jù)層:它是數(shù)據(jù)庫的中間一層,是數(shù)據(jù)庫的整體邏輯表示。指出了每個(gè)數(shù)據(jù)的邏輯定義及數(shù)據(jù)間的邏輯聯(lián)系,是存貯記錄的集合。它所涉及的是數(shù)據(jù)庫所有對(duì)象的邏輯關(guān)系,而不是它們的物理情況,是數(shù)據(jù)庫管理員概念下的數(shù)據(jù)庫。(3)用戶數(shù)據(jù)層:它是用戶所看到和使用的數(shù)據(jù)庫,表示了一個(gè)或一些特定用戶使用的數(shù)據(jù)集合,即邏輯記錄的集合。云計(jì)算和數(shù)據(jù)庫(1)物理數(shù)據(jù)層:它是數(shù)據(jù)庫的最內(nèi)層,是物理存11關(guān)系型數(shù)據(jù)庫在現(xiàn)代的計(jì)算系統(tǒng)上每天網(wǎng)絡(luò)上都會(huì)產(chǎn)生龐大的數(shù)據(jù)量,這些數(shù)據(jù)有很大一部分是由關(guān)系數(shù)據(jù)庫管理系統(tǒng)來處理的。1970年E.F.Codd提出的關(guān)系模型數(shù)據(jù)庫的論文《Arelationalmodelofdataforlargeshareddatabanks》,使得數(shù)據(jù)建模和應(yīng)用程序編程更加簡單。關(guān)系型數(shù)據(jù)庫在現(xiàn)代的計(jì)算系統(tǒng)上每天網(wǎng)絡(luò)上都會(huì)產(chǎn)生龐大的數(shù)據(jù)量12數(shù)據(jù)庫準(zhǔn)則關(guān)系數(shù)據(jù)庫是建立在關(guān)系模型基礎(chǔ)上的數(shù)據(jù)庫,借助于集合代數(shù)等數(shù)學(xué)概念和方法來處理數(shù)據(jù)庫中的數(shù)據(jù)?,F(xiàn)實(shí)世界中的各種實(shí)體以及實(shí)體之間的各種聯(lián)系均用關(guān)系模型來表示。一個(gè)關(guān)系型數(shù)據(jù)庫就是由二維表及其之間的聯(lián)系組成的一個(gè)數(shù)據(jù)組織。通過應(yīng)用實(shí)踐證明,關(guān)系模型非常適合于用戶服務(wù)器編程,是結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)在網(wǎng)絡(luò)和商務(wù)應(yīng)用的主導(dǎo)技術(shù)。數(shù)據(jù)庫準(zhǔn)則關(guān)系數(shù)據(jù)庫是建立在關(guān)系模型基礎(chǔ)上的數(shù)據(jù)庫,借助于集13數(shù)據(jù)庫準(zhǔn)則當(dāng)前主流的關(guān)系型數(shù)據(jù)庫有Oracle、DB2、PostgreSQL、MicrosoftSQLServer、MicrosoftAccess、MySQL、K-DB等。關(guān)系模型是由埃德加·科德(EdgarF.Codd)于1970年首先提出,由關(guān)系數(shù)據(jù)結(jié)構(gòu)、關(guān)系操作集合、關(guān)系完整性約束三部分組成。埃德加·科德(EdgarF.Codd)提出的“科德十二定律”是數(shù)據(jù)存儲(chǔ)的傳統(tǒng)標(biāo)準(zhǔn)。數(shù)據(jù)庫準(zhǔn)則當(dāng)前主流的關(guān)系型數(shù)據(jù)庫有Oracle、DB2、Po14數(shù)據(jù)庫準(zhǔn)則準(zhǔn)則0:一個(gè)關(guān)系形的關(guān)系數(shù)據(jù)庫管理系統(tǒng)必須能完全通過它的關(guān)系能力來管理數(shù)據(jù)庫。準(zhǔn)則1:信息準(zhǔn)則,關(guān)系數(shù)據(jù)庫管理系統(tǒng)的所有信息都應(yīng)該在邏輯一級(jí)上用表中的值這一種方法顯式的表示。準(zhǔn)則2:保證訪問準(zhǔn)則,依靠表名、主碼和列名的組合,保證能以邏輯方式訪問關(guān)系數(shù)據(jù)庫中的每個(gè)數(shù)據(jù)項(xiàng)。準(zhǔn)則3:空值的系統(tǒng)化處理,全關(guān)系的關(guān)系數(shù)據(jù)庫管理系統(tǒng)支持空值的概念,并用系統(tǒng)化的方法處理空值。數(shù)據(jù)庫準(zhǔn)則準(zhǔn)則0:一個(gè)關(guān)系形的關(guān)系數(shù)據(jù)庫管理系統(tǒng)必須能完全通15數(shù)據(jù)庫準(zhǔn)則準(zhǔn)則4:基于關(guān)系模型的動(dòng)態(tài)的聯(lián)機(jī)數(shù)據(jù)字典,數(shù)據(jù)庫的描述在邏輯級(jí)上和普通數(shù)據(jù)采用同樣的表述方式。準(zhǔn)則5:統(tǒng)一的數(shù)據(jù)子語言,一個(gè)關(guān)系數(shù)據(jù)庫管理系統(tǒng)可以具有幾種語言和多種終端訪問方式,但必須有一種語言,它的語句可以表示為嚴(yán)格語法規(guī)定的字符串,并能全面的支持各種規(guī)則。準(zhǔn)則6:視圖更新準(zhǔn)則,所有理論上可更新的視圖也應(yīng)該允許由系統(tǒng)更新。準(zhǔn)則7:高級(jí)的插入、修改和刪除操作,系統(tǒng)應(yīng)該對(duì)各種操作進(jìn)行查詢優(yōu)化。數(shù)據(jù)庫準(zhǔn)則準(zhǔn)則4:基于關(guān)系模型的動(dòng)態(tài)的聯(lián)機(jī)數(shù)據(jù)字典,數(shù)據(jù)庫的16數(shù)據(jù)庫準(zhǔn)則準(zhǔn)則8:數(shù)據(jù)的物理獨(dú)立性,無論數(shù)據(jù)庫的數(shù)據(jù)在存儲(chǔ)表示或訪問方法上作任何變化,應(yīng)用程序和終端活動(dòng)都保持邏輯上的不變性。準(zhǔn)則9:數(shù)據(jù)邏輯獨(dú)立性,當(dāng)對(duì)基本關(guān)系進(jìn)行理論上信息不受損害的任何改變時(shí),應(yīng)用程序和終端活動(dòng)都保持邏輯上的不變性。準(zhǔn)則10:數(shù)據(jù)完整的獨(dú)立性,關(guān)系數(shù)據(jù)庫的完整性約束條件必須是用數(shù)據(jù)庫語言定義并存儲(chǔ)在數(shù)據(jù)字典中的。準(zhǔn)則11:分布獨(dú)立性,關(guān)系數(shù)據(jù)庫管理系統(tǒng)在引入分布數(shù)據(jù)或數(shù)據(jù)重新分布時(shí)保持邏輯不變。準(zhǔn)則12:無破壞準(zhǔn)則,如果一個(gè)關(guān)系數(shù)據(jù)庫管理系統(tǒng)具有一個(gè)低級(jí)語言,那么這個(gè)低級(jí)語言不能違背或繞過完整性準(zhǔn)則。數(shù)據(jù)庫準(zhǔn)則準(zhǔn)則8:數(shù)據(jù)的物理獨(dú)立性,無論數(shù)據(jù)庫的數(shù)據(jù)在存儲(chǔ)表17數(shù)據(jù)庫準(zhǔn)則實(shí)體關(guān)系模型是PeterP.SChen在關(guān)系模型的基礎(chǔ)上,于1976年提出的一套數(shù)據(jù)庫的設(shè)計(jì)工具,他運(yùn)用真實(shí)世界中事物與關(guān)系的觀念,來解釋數(shù)據(jù)庫中的抽象的數(shù)據(jù)架構(gòu)。實(shí)體關(guān)系模型利用圖形的方式來表示數(shù)據(jù)庫的概念設(shè)計(jì),有助于設(shè)計(jì)過程中的構(gòu)思及溝通討論。數(shù)據(jù)庫準(zhǔn)則實(shí)體關(guān)系模型是PeterP.SChen在關(guān)系模18ACID原則(1)原子性A(Atomicity):事務(wù)里的所有操作要么全部做完,要么都不做,事務(wù)成功的條件是事務(wù)里的所有操作都成功,只要有一個(gè)操作失敗,整個(gè)事務(wù)就失敗,需要回滾。如銀行轉(zhuǎn)賬,從A賬戶轉(zhuǎn)100元至B賬戶,分為兩個(gè)步驟:從A賬戶取100元;存入100元至B賬戶。這兩步要么一起完成,要么一起不完成,如果只完成第一步,第二步失敗,錢會(huì)莫名其妙少了100元。ACID原則(1)原子性A(Atomicity):19ACID原則(2)一致性C(Consistency):數(shù)據(jù)庫要一直處于一致的狀態(tài),事務(wù)的運(yùn)行不會(huì)改變數(shù)據(jù)庫原本的一致性約束。例如現(xiàn)有完整性約束a+b=10,如果一個(gè)事務(wù)改變了a,那么必須得改變b,使得事務(wù)結(jié)束后依然滿足a+b=10,否則事務(wù)失敗。ACID原則(2)一致性C(Consistency):20例:小李是某網(wǎng)店運(yùn)營,剛接手一家新網(wǎng)店,欲確定該店鋪的主營品類,已知該店鋪經(jīng)營A、B、C、D四個(gè)品類,各品類銷售數(shù)據(jù)如右表所示。解:將表轉(zhuǎn)變成柱形圖,如右表所示,通過對(duì)比A、B、C、D四個(gè)品類銷售額的最大值,要做市場(chǎng)規(guī)模則選擇銷售額高的品類,要便于生存則選擇銷售額低的品類。A品類B品類C品類D品類1580萬元780萬元605萬元1685萬元各品類的銷售額例:小李是某網(wǎng)店運(yùn)營,剛接手一家新網(wǎng)店,欲確定該店鋪的主營品21拆分法PARTTWO拆分法PARTTWO22拆分法拆分法是最常用的分析方法之一,在許多領(lǐng)域應(yīng)用非常廣泛,杜邦分析法就是拆分法的經(jīng)典應(yīng)用。拆分法是將某個(gè)問題拆解成若干個(gè)子問題,通過研究該若干子問題從而找到問題的癥結(jié)點(diǎn)并解決問題。比如在研究銷售業(yè)績下降問題時(shí),可以將銷售業(yè)績問題拆分成轉(zhuǎn)化率、客單價(jià)和訪客數(shù)這三個(gè)子問題,通過分析這三個(gè)子問題從而解決銷售業(yè)績問題。拆分法拆分法是最常用的分析方法之一,在許多領(lǐng)域應(yīng)用非常廣泛,23解:如圖所示,銷售額下降的問題可拆分成三個(gè)子問題,分別是訪客數(shù)、轉(zhuǎn)化率和客單價(jià)的變化,對(duì)上表的數(shù)據(jù)運(yùn)用對(duì)比法發(fā)現(xiàn)主要是訪客數(shù)的變化引起的銷售額大幅下降。可再進(jìn)一步拆分訪客數(shù),訪客數(shù)可分為付費(fèi)訪客數(shù)和免費(fèi)訪客數(shù),對(duì)問題的原因進(jìn)行進(jìn)一步剖析,直到找到問題的根源。拆分法可分為完全拆分法和重點(diǎn)拆分法。完全拆分法,也稱為等額拆分法,是將父問題100%進(jìn)行拆解,拆解出來的子問題的和或者集合(算法)可100%解釋父問題。如銷售額=訪客數(shù)×轉(zhuǎn)化率×客單價(jià),等式兩邊完全相等。重點(diǎn)拆分法,也稱為非等額拆分法。只拆分出問題的重點(diǎn),子問題只解釋了父問題的80%左右。如做好網(wǎng)店=點(diǎn)擊率+轉(zhuǎn)化率+退款率,確實(shí)要做好一家網(wǎng)店只要做好點(diǎn)擊率、轉(zhuǎn)化率和退款率這三個(gè)指標(biāo)就夠了,但做網(wǎng)店運(yùn)營不完全是這三個(gè)環(huán)節(jié)。抓住重要環(huán)節(jié),有時(shí)面對(duì)一些復(fù)雜的問題,就需要采用重點(diǎn)拆分法。日期訪客數(shù)轉(zhuǎn)化率客單價(jià)銷售額周一10003.5%1003500昨日20003.4%1006800上周一25003.5%1008750例:某網(wǎng)店的銷售額大幅下降,店鋪核心數(shù)據(jù)如表所示,運(yùn)營欲找出銷售額下降的原因解:如圖所示,銷售額下降的問題可拆分成三個(gè)子問題,分別是訪客24排序法PARTTHREE排序法PARTTHREE25排序法排序法是基于某一個(gè)指標(biāo)或度量值的大小,將觀測(cè)值進(jìn)行遞增或遞減排列,每一次排列只能基于某一個(gè)指標(biāo)。排序法是從對(duì)比法中衍生的一種常用方法,百度搜索風(fēng)云榜、阿里排行榜等業(yè)內(nèi)知名榜單就是重采用排序法的產(chǎn)品,通過查看排序后的榜單,用戶可以快速獲取目標(biāo)價(jià)值信息。排序法排序法是基于某一個(gè)指標(biāo)或度量值的大小,將觀測(cè)值進(jìn)行遞增26例:某運(yùn)營收集了數(shù)個(gè)品類的數(shù)據(jù),如表所示,欲通過排序法列出品類榜單品類交易指數(shù)在線產(chǎn)品數(shù)(個(gè))T恤2017855135570連衣裙4355121868084褲子2266441053642襯衫1959211556930表1未排序的品類行業(yè)數(shù)據(jù)解:排序法只能基于某一個(gè)度量進(jìn)行排序,表1中有兩個(gè)度量,因此可以做出兩個(gè)表單。例:某運(yùn)營收集了數(shù)個(gè)品類的數(shù)據(jù),如表所示,欲通過排序法列出品27表2為基于交易指數(shù)的榜單,排名越靠前代表該品類的市場(chǎng)規(guī)模越大。排名品類交易指數(shù)在線產(chǎn)品數(shù)(個(gè))1連衣裙43551218680842褲子22664410536423T恤20178551355704襯衫1959211556930表3為基于產(chǎn)品數(shù)的榜單,排名越靠前代表該品類的市場(chǎng)競(jìng)爭越大。排名品類交易指數(shù)在線產(chǎn)品數(shù)(個(gè))1T恤20178551355702褲子22664410536423連衣裙43551218680844襯衫1959211556930表2為基于交易指數(shù)的榜單,排名越靠前代表該品類的市場(chǎng)規(guī)模越大28分組法PARTFOUR分組法PARTFOUR29分組法來源于統(tǒng)計(jì)學(xué),用于發(fā)現(xiàn)事物的特征,是非常重要的分析方法。分析時(shí)可以按類型、結(jié)構(gòu)、時(shí)間階段等維度進(jìn)行分組,觀察分組后的數(shù)據(jù)特征,從特征中洞察信息。例:基于下表的信息,分析褲子和職業(yè)套裝的差異父類目子類目銷售額(元)褲子休閑褲747991311褲子打底褲89942330褲子西裝褲/正裝褲4952899褲子棉褲/羽絨褲1800685職業(yè)套裝休閑套裝216517887職業(yè)套裝職業(yè)女裙套裝24072258職業(yè)套裝醫(yī)護(hù)制服1649589職業(yè)套裝其他套裝5952780解:基于題目可以得知需要對(duì)父類目進(jìn)行統(tǒng)計(jì)分組。分組結(jié)果如下表所示父類目銷售額(元)褲子844687225職業(yè)套裝248192514通過觀察分組結(jié)果可知褲子的市場(chǎng)份額遠(yuǎn)大于職業(yè)套裝的市場(chǎng)份額分組法來源于統(tǒng)計(jì)學(xué),用于發(fā)現(xiàn)事物的特征,是非常重要的分析方法30交叉法PARTFIVE交叉法PARTFIVE31交叉法是對(duì)比法和拆分法的結(jié)合,將有一定關(guān)聯(lián)的兩個(gè)或兩個(gè)以上的維度和度量值排列在統(tǒng)計(jì)表內(nèi)進(jìn)行對(duì)比分析,在小于等于三維的情況下可以靈活使用圖表進(jìn)行展示。當(dāng)維度大于三維時(shí)選用統(tǒng)計(jì)表展示,此時(shí)也稱之多維分析法。比如在研究市場(chǎng)定價(jià)時(shí),經(jīng)常將產(chǎn)品特征和定價(jià)作為維度,銷售額作為指標(biāo)進(jìn)行分析。例:下表所示是不同性別的消費(fèi)者在不同品類上的消費(fèi)金額數(shù)據(jù),利用交叉法分析不同性別的差異。性別品類消費(fèi)金額(元)男零食68男耳機(jī)180女零食155女耳機(jī)42解:將左表轉(zhuǎn)變成二維交叉表,如表2-10所示,可以直觀地觀察到男性和女性用戶在消費(fèi)偏好上的差異,男性更愿意在耳機(jī)上消費(fèi),女性則更愿意在零食上消費(fèi)。性別

品類零食耳機(jī)男68180女15542交叉法是對(duì)比法和拆分法的結(jié)合,將有一定關(guān)聯(lián)的兩個(gè)或兩個(gè)以上的32降維法PARTSIX降維法PARTSIX33降維法是在數(shù)據(jù)集指標(biāo)過多及分析干擾因素太多時(shí),通過找到并分析核心指標(biāo)提高分析精度,或者通過主成分分析、因子分析等統(tǒng)計(jì)學(xué)方法將數(shù)據(jù)由高維轉(zhuǎn)換成低維的方法。比如在分析店鋪數(shù)據(jù)時(shí),根據(jù)業(yè)務(wù)問題的核心提取主要的2~4個(gè)核心指標(biāo)進(jìn)行分析。例:根據(jù)下表的數(shù)據(jù)指標(biāo)字段評(píng)估店鋪的綜合情況。轉(zhuǎn)化率銷售額客單價(jià)訪客數(shù)動(dòng)銷率連帶率好評(píng)率糾紛率上新率解:對(duì)數(shù)據(jù)指標(biāo)字段進(jìn)行分類,將店鋪的評(píng)估分成產(chǎn)品運(yùn)營能力、店鋪獲客能力和店鋪服務(wù)能力。降維法是在數(shù)據(jù)集指標(biāo)過多及分析干擾因素太多時(shí),通過找到并分析34動(dòng)銷率連帶率上新率反映店鋪產(chǎn)品運(yùn)營能力的指標(biāo)如下表所示反映店鋪獲客能力的指標(biāo)如下表所示轉(zhuǎn)化率銷售額客單價(jià)訪客數(shù)反映店鋪服務(wù)能力的指標(biāo)如下表所示好評(píng)率糾紛率基于各能力維度下的指標(biāo),綜合評(píng)估各能力的分?jǐn)?shù)??墒褂脭?shù)據(jù)歸一化的方法或者熵值法計(jì)算分?jǐn)?shù),達(dá)到綜合評(píng)估的目的。1.數(shù)據(jù)歸一化是將數(shù)據(jù)映射到[0,1]的區(qū)間,在2.2.3小節(jié)中詳細(xì)介紹。2.熵值法的核心思想是用信息的無序度來衡量信息的效用值。信息的無序度越低(越不穩(wěn)定)動(dòng)銷率連帶率上新率反映店鋪產(chǎn)品運(yùn)營能力的指標(biāo)如下表所示反映店35增維法Theusercandemonstrateonaprojectororcomputer,orprintthepresentationandmakeitintoafilmtobeusedinawiderfieldPARTSEVEN增維法Theusercandemonstrateon36增維法是在數(shù)據(jù)集的字段過少或信息量不足時(shí),為了便于分析師分析,通過計(jì)算衍生出更加直觀的指標(biāo)。比如在分析關(guān)鍵詞時(shí),將搜索人氣除以商品數(shù)量得到的新指標(biāo),定義為關(guān)鍵詞的競(jìng)爭指數(shù)。例:如表所示,計(jì)算關(guān)鍵詞的競(jìng)爭度,公式如下:競(jìng)爭度=搜索人氣×點(diǎn)擊率×支付轉(zhuǎn)化率÷在線商品數(shù)基于業(yè)務(wù)經(jīng)驗(yàn),得到的指標(biāo)為正指標(biāo),數(shù)值越大越好關(guān)鍵詞搜索人氣點(diǎn)擊率在線商品數(shù)支付轉(zhuǎn)化率競(jìng)爭度永生花32914152.95%1651186.92%0.021永生花花瓣耳環(huán)11736132.03%31993.99%0.193永生花禮盒10274162.75%557748.55%0.026永生花DIY材料包9245222.64%41983.71%0.182永生花玻璃罩7977138.58%237186.89%0.032增維法是在數(shù)據(jù)集的字段過少或信息量不足時(shí),為了便于分析師分析37指標(biāo)法Theusercandemonstrateonaprojectororcomputer,orprintthepresentationandmakeitintoafilmtobeusedinawiderfieldPARTEIGHT指標(biāo)法Theusercandemonstrateon38指標(biāo)法是分析的基本方法之一,通過匯總值、平均值、標(biāo)準(zhǔn)差等一系列統(tǒng)計(jì)指標(biāo)研究分析數(shù)據(jù)。指標(biāo)法更適用于多維的數(shù)據(jù)。例:下表所示為淘寶搜索某關(guān)鍵詞按人氣排名前5的商品數(shù)據(jù),

通過指標(biāo)法描述這個(gè)數(shù)據(jù)。排名售價(jià)銷售額評(píng)價(jià)人數(shù)DSR_物流分DSR_描述分DSR_服務(wù)分16801156001514.614.744.7623680629280164.984.984.98321803727809024.954.954.964218037496023634.924.934.94521993804279584.954.974.95指標(biāo)法是分析的基本方法之一,通過匯總值、平均值、標(biāo)準(zhǔn)差等一系39解:使用指標(biāo)法描述數(shù)據(jù)后的結(jié)果,如下表所示。

售價(jià)銷售額評(píng)價(jià)人數(shù)DSR_物流分DSR_描述分DSR_服務(wù)分計(jì)數(shù)555555缺失值000000平均值21843746098784.884.914.92匯總109191873047439024.4124.5724.59標(biāo)準(zhǔn)差9491624698350.140.090.08描述數(shù)據(jù)的相關(guān)度量解:使用指標(biāo)法描述數(shù)據(jù)后的結(jié)果,如下表所示。

售價(jià)銷售額評(píng)價(jià)40圖形法Theusercandemonstrateonaprojectororcomputer,orprintthepresentationandmakeitintoafilmtobeusedinawiderfieldPARTNINE圖形法Theusercandemonstrateon41圖形法是分析的基本方法之一,通過柱形圖、折線圖、散點(diǎn)圖等一系列統(tǒng)計(jì)圖形直觀地分析數(shù)據(jù)。圖形法適用于低維的數(shù)據(jù)。例:下表所示為淘寶搜索某關(guān)鍵詞按人氣排名前220的商品數(shù)據(jù),通過圖形法分析相關(guān)售價(jià)的分布排名售價(jià)銷售額評(píng)價(jià)人數(shù)DSR_物流分DSR_描述分DSR_服務(wù)分16801156001514.614.744.7623680629280164.984.984.98321803727809024.954.954.96……………………………………220150547800332064.754.634.74某關(guān)鍵詞按人氣排名前220的商品數(shù)據(jù)圖形法是分析的基本方法之一,通過柱形圖、折線圖、散點(diǎn)圖等一系42解:下圖所示是基于售價(jià)分組后繪制的直方圖,可以直觀地觀察各個(gè)價(jià)格區(qū)間包含商品的個(gè)數(shù),商品售價(jià)分布主要集中在[118,588],[1058,1528]兩個(gè)區(qū)間。

圖形法有畫圖空間、圖形和圖注三個(gè)要素。畫圖空間是圖形的容器,圖形呈現(xiàn)在畫圖空間之中,如二維空間、三維空間。圖形是要表達(dá)信息的可視化結(jié)果,如線形、柱形。圖注是對(duì)圖形的標(biāo)注。如上圖所示,圖注包含圖標(biāo)題、數(shù)據(jù)標(biāo)簽、坐標(biāo)軸、坐標(biāo)軸標(biāo)題、圖例。圖1價(jià)格區(qū)間分布圖圖2圖形的圖注示例解:下圖所示是基于售價(jià)分組后繪制的直方圖,可以直觀地觀察各個(gè)43SWOT分析法Theusercandemonstrateonaprojectororcomputer,orprintthepresentationandmakeitintoafilmtobeusedinawiderfieldPARTTENSWOT分析法Theusercandemonstrat44SWOT分析法,即態(tài)勢(shì)分析法,來源于市場(chǎng)營銷方法論,是首先將與研究對(duì)象密切相關(guān)的各種主要內(nèi)部優(yōu)勢(shì)、劣勢(shì)和外部的機(jī)會(huì)和威脅等,通過調(diào)查列舉出來,并依照矩陣形式排列,然后用系統(tǒng)分析的思想,把各種因素相互匹配起來加以分析,從中得出一系列相應(yīng)的結(jié)論,而結(jié)論通常帶有一定的決策性。SWOT分析法是常用的分析方法,有助于分析師了解企業(yè)當(dāng)前所處的內(nèi)外環(huán)境,可以讓分析師更準(zhǔn)確地通過數(shù)據(jù)做判斷。SWOT分析法,即態(tài)勢(shì)分析法,來源于市場(chǎng)營銷方法論,是首先將45數(shù)據(jù)分析方法論課件46數(shù)據(jù)分析方法論課件47數(shù)據(jù)分析方法論課件48數(shù)據(jù)分析方法論課件49數(shù)據(jù)分析方法論課件50數(shù)據(jù)分析方法論課件511.內(nèi)部因素分析

內(nèi)部因素由優(yōu)勢(shì)(Strengths)和劣勢(shì)(Weaknesses)組成,對(duì)企業(yè)內(nèi)部的管理、團(tuán)隊(duì)、產(chǎn)品和市場(chǎng)營銷情況進(jìn)行分析,通過了解企業(yè)的內(nèi)部情況,分析師可以更好地解讀數(shù)據(jù)中蘊(yùn)藏的信息。例:如下表所示,對(duì)某電商公司的內(nèi)部因素進(jìn)行分析。優(yōu)勢(shì)(Strengths)劣勢(shì)(Weaknesses)1.店鋪開發(fā)能力強(qiáng)2.服務(wù)消費(fèi)者的能力強(qiáng)3.能夠把控品質(zhì)4.公司的財(cái)務(wù)狀況非常好1.公司管理方面不是很完善2.庫存能力不強(qiáng),常斷貨3.公司內(nèi)部人員競(jìng)爭4.店鋪定位不明確5.開發(fā)消費(fèi)者能力弱1.內(nèi)部因素分析內(nèi)部因素由優(yōu)勢(shì)(Strengths)和522.外部因素分析

外部因素由機(jī)會(huì)(Opportunities)和威脅(Threats)組成,對(duì)企業(yè)外部的環(huán)境、政策和競(jìng)爭對(duì)手進(jìn)行分析,通過了解企業(yè)的外部情況,分析師可以充分地了解企業(yè)的情況。例:如下表所示,對(duì)某電商公司的外部因素進(jìn)行分析。機(jī)會(huì)(Opportunities)威脅(Threats)1.市場(chǎng)標(biāo)桿很少,明確定位的店鋪很少2.市場(chǎng)需求大幅增長3.普遍不重視用戶體驗(yàn)4.個(gè)性化1.競(jìng)爭2.同質(zhì)化嚴(yán)重3.盜圖4.大商家新入駐2.外部因素分析外部因素由機(jī)會(huì)(Opportunit533.基于內(nèi)外因素的應(yīng)對(duì)策略

在充分了解企業(yè)的內(nèi)外部情況后,將內(nèi)部的優(yōu)勢(shì)、劣勢(shì)和外部的機(jī)會(huì)、威脅進(jìn)行交叉。當(dāng)企業(yè)的優(yōu)勢(shì)遇到機(jī)會(huì),應(yīng)當(dāng)采取發(fā)展的策略;當(dāng)企業(yè)的優(yōu)勢(shì)遇到威脅,應(yīng)當(dāng)采取拓展的策略;當(dāng)企業(yè)的劣勢(shì)遇到機(jī)會(huì),應(yīng)當(dāng)采取爭取的策略;當(dāng)企業(yè)的劣勢(shì)遇到威脅,應(yīng)當(dāng)采取保守的策略。例:如下表所示,根據(jù)某電商企業(yè)的內(nèi)外部因素進(jìn)行策略分析。

優(yōu)勢(shì)(Strengths)劣勢(shì)(Weaknesses)機(jī)會(huì)(Opportunities)SO(發(fā)展)WO(爭取)1.結(jié)合市場(chǎng)情況,在自身開發(fā)能力的基礎(chǔ)上,找到明確的定位,增加消費(fèi)者黏性,提高復(fù)購率2.提升消費(fèi)者體驗(yàn)3.開發(fā)更多新品迎合市場(chǎng)需求1.提升管理能力,讓指令可以上行下達(dá)2.合理使用ERP軟件進(jìn)行管理,嚴(yán)格把控庫存?zhèn)}位3.設(shè)定良性競(jìng)爭機(jī)制4.精準(zhǔn)定位消費(fèi)者人群5.制訂推廣方案,吸引更多新消費(fèi)者威脅(Threats)ST(拓展)WT(保守)1.提升店鋪形象(口碑)2.開發(fā)團(tuán)隊(duì)把控市場(chǎng)需求走向,規(guī)避同質(zhì)化3.結(jié)合公司的自主開發(fā),提升公司版權(quán)保護(hù)意識(shí)4.精準(zhǔn)定位消費(fèi)者1.保持店鋪的獨(dú)特風(fēng)格,不被外界影響2.加強(qiáng)CRM管控3.基于內(nèi)外因素的應(yīng)對(duì)策略在充分了解企業(yè)的內(nèi)外部情況54描述性統(tǒng)計(jì)法Theusercandemonstrateonaprojectororcomputer,orprintthepresentationandmakeitintoafilmtobeusedinawiderfieldPARTELEVEN描述性統(tǒng)計(jì)法Theusercandemonstrate55描述性統(tǒng)計(jì)法是運(yùn)用描述性統(tǒng)計(jì)指標(biāo)對(duì)數(shù)據(jù)集進(jìn)行研究,來源于統(tǒng)計(jì)學(xué)。在獲得數(shù)據(jù)集后,一般要對(duì)數(shù)據(jù)集進(jìn)行觀察,了解數(shù)據(jù)集的字段、數(shù)據(jù)分布等。當(dāng)數(shù)據(jù)指標(biāo)較少時(shí)可選用圖形法進(jìn)行直觀的觀察,數(shù)據(jù)指標(biāo)較多時(shí)無法使用,此時(shí)需使用描述性統(tǒng)計(jì)法。本節(jié)以淘寶網(wǎng)某關(guān)鍵詞排名前5的商品數(shù)據(jù)為數(shù)據(jù)集,利用Excel工具實(shí)現(xiàn)指標(biāo)計(jì)算。如圖所示,數(shù)據(jù)區(qū)域?yàn)锳1:G6。排名售價(jià)銷售額評(píng)價(jià)人數(shù)DSR_物流分DSR_描述分DSR_服務(wù)分16801156001514.614.744.7623680629280164.984.984.98321803727809024.954.954.964218037496023634.924.934.94521993804279584.954.974.95淘寶某關(guān)鍵詞排名前5的商品數(shù)據(jù)描述性統(tǒng)計(jì)法是運(yùn)用描述性統(tǒng)計(jì)指標(biāo)對(duì)數(shù)據(jù)集進(jìn)行研究,來源于統(tǒng)計(jì)561.五數(shù)概括法

五數(shù)概括法是指用五個(gè)指標(biāo)反映數(shù)據(jù)集的分布情況,五個(gè)指標(biāo)分別是最小值、1/4位數(shù)(Q1)、中位數(shù)(Q2)、3/4位數(shù)(Q3)和最大值。(1)最小值指數(shù)據(jù)集中最小的一個(gè)值。計(jì)算方法:在Excel中鍵入“=MIN([array])”,其中[array]為要進(jìn)行計(jì)算的區(qū)域。例1:求上表中銷售額的最小值。解:在C7單元格中鍵入“=MIN(C2:C6)”,得到結(jié)果為:115600。(2)1/4位數(shù)指數(shù)據(jù)集中所有數(shù)值由小到大排列后第25%的數(shù)字。計(jì)算方法:在Excel中鍵入“=QUARTILE.INC([array],[quart])”,其中[array]為要進(jìn)行計(jì)

算的區(qū)域,[quart]為要計(jì)算的指標(biāo),[quart]為1表示計(jì)算1/4位數(shù)。例2:求上表中銷售額的1/4位數(shù)。解:在C8單元格中鍵入“=QUARTILE.INC(C2:C6,1)”,得到結(jié)果為:244190。1.五數(shù)概括法(1)最小值指數(shù)據(jù)集中最小的一個(gè)值。57(3)中位數(shù)指數(shù)據(jù)集中所有數(shù)值由小到大排列后第50%的數(shù)字。計(jì)算方法:在Excel中鍵入“=QUARTILE.INC([array],[quart])”,其中[array]為要進(jìn)行計(jì)算的區(qū)域,[quart]為要計(jì)算的指標(biāo),[quart]值為2表示計(jì)算中位數(shù)。例3:求前表中銷售額的中位數(shù)。解:在C9單元格中鍵入“=QUARTILE.INC(C2:C6,2)”,得到結(jié)果為:374960。(4)3/4位數(shù)指數(shù)據(jù)集中所有數(shù)值由小到大排列后第75%的數(shù)字。計(jì)算方法:在Excel中鍵入“=QUARTILE.INC([array],[quart])”,其中[array]為要進(jìn)行計(jì)算的區(qū)域,[quart]為要計(jì)算的指標(biāo),[quart]值為3表示計(jì)算3/4位數(shù)。例4:求前表中銷售額的3/4位數(shù)。解:在C10單元格中鍵入“=QUARTILE.INC(C2:C6,3)”,得到結(jié)果為:504853.5。(5)最大值指數(shù)據(jù)集中最大的一個(gè)值。計(jì)算方法:在Excel中鍵入“=MAX([array])”,其中[array]為要進(jìn)行計(jì)算的區(qū)域。例5:求前表中銷售額的最大值。解:在C11單元格中鍵入“=MAX(C2:C6)”,得到結(jié)果為:629280。五數(shù)概括法的計(jì)算結(jié)果如下表所示類型計(jì)算結(jié)果最小值1156001/4位數(shù)244190中位數(shù)3749603/4位數(shù)504853.5最大值629280(3)中位數(shù)指數(shù)據(jù)集中所有數(shù)值由小到大排列后第50%的數(shù)字。58如下圖所示,將這5個(gè)數(shù)值繪制成箱線圖,可以直觀地看到數(shù)據(jù)集的分布情況。

在某些場(chǎng)景下,為了分析的可靠性,會(huì)從數(shù)據(jù)集中抽取分布在1/4位數(shù)~3/4位數(shù)的數(shù)據(jù)作為觀測(cè)值,也就是分別將兩端的數(shù)據(jù)過濾掉,避免極端情況的影響。例如在計(jì)算行業(yè)平均銷售件數(shù)時(shí),排除爆款群和銷量極低的產(chǎn)品,這樣計(jì)算出來的平均數(shù)更具有代表性,更接近于大多數(shù)的產(chǎn)品。

基于五數(shù)概括法繪制的箱線圖如下圖所示,將這5個(gè)數(shù)值繪制成箱線圖,可以直觀地看到數(shù)據(jù)集的592.計(jì)數(shù)、匯總和平均值計(jì)數(shù)、匯總和平均值是最常用的描述性統(tǒng)計(jì)指標(biāo)。(1)計(jì)數(shù)計(jì)數(shù)(Count)亦稱數(shù)數(shù),算術(shù)的基本概念之一,指數(shù)事物個(gè)數(shù)的過程。在統(tǒng)計(jì)指標(biāo)中計(jì)數(shù)是指統(tǒng)計(jì)數(shù)值或者觀測(cè)值的數(shù)量。計(jì)算方法:在Excel中鍵入“=COUNT([array])”,其中[array]表示要進(jìn)行計(jì)算的區(qū)域。例1:求右表中銷售額的計(jì)數(shù)。解:在C11單元格中鍵入“=COUNT(C2:C6)”,得到結(jié)果為:5。(2)匯總匯總是數(shù)據(jù)的求和。計(jì)算方法:在Excel中鍵入“=SUM([array])”,其中[array]表示要進(jìn)行計(jì)算的區(qū)域。例2:求右表中銷售額的總數(shù)。解:在C11單元格中鍵入“=SUM(C2:C6)”,得到結(jié)果為:1873047。(3)平均值平均值是指算術(shù)平均值,又稱均值。計(jì)算方法:在Excel中鍵入“=AVERAGE([array])”,其中[array]表示要進(jìn)行計(jì)算的區(qū)域。例3:求右表中銷售額的平均值。解:在C11單元格中鍵入“=AVERAGE(C2:C6)”,得到結(jié)果為:374609.4。2.計(jì)數(shù)、匯總和平均值計(jì)數(shù)、匯總和平均值是最常用的描述性統(tǒng)計(jì)603.標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差是用于反映數(shù)據(jù)離散程度的指標(biāo)。標(biāo)準(zhǔn)差又分總體標(biāo)準(zhǔn)差和樣本標(biāo)準(zhǔn)差,當(dāng)數(shù)據(jù)是總體時(shí)采用總體標(biāo)準(zhǔn)差,如計(jì)算企業(yè)的所有產(chǎn)品的銷售額標(biāo)準(zhǔn)差,計(jì)算行業(yè)爆款的標(biāo)準(zhǔn)差則采用樣本標(biāo)準(zhǔn)差,如計(jì)算行業(yè)前10產(chǎn)品銷售額的標(biāo)準(zhǔn)差??傮w標(biāo)準(zhǔn)差計(jì)算方法:在Excel中鍵入“=STDEV.P([array])”,其中[array]代表要進(jìn)行計(jì)算的區(qū)域。樣本標(biāo)準(zhǔn)差計(jì)算方法:在Excel中鍵入“=STDEV.S([array])”,其中[array]代表要進(jìn)行計(jì)算的區(qū)域。例:求下表中銷售額的標(biāo)準(zhǔn)差。解:先明確何為總體,如果標(biāo)準(zhǔn)差是要反映表2-22中5個(gè)產(chǎn)品的標(biāo)準(zhǔn)差,那這5個(gè)產(chǎn)品就是總體;如果用此標(biāo)準(zhǔn)差反應(yīng)該品類的標(biāo)準(zhǔn)差,此時(shí)該品類的所有產(chǎn)品就是總體。本例求表中銷售額的標(biāo)準(zhǔn)差,不考慮整個(gè)品類,則用總體標(biāo)準(zhǔn)差,在C11單元格中鍵入“=STDEV.P(C2:C6)”,得到結(jié)果為:162468.6。3.標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差是用于反映數(shù)據(jù)離散程度的指標(biāo)。標(biāo)準(zhǔn)差又分總體614.變異系數(shù)變異系數(shù)和標(biāo)準(zhǔn)差一樣也是用于反映數(shù)據(jù)離散程度的指標(biāo),但不同的是變異系數(shù)不被數(shù)據(jù)量綱影響。公式為:變異系數(shù)=標(biāo)準(zhǔn)差/平均值例:求下表中銷售額的變異系數(shù)。解:在C11單元格中鍵入“=STDEV.P(C2:C6)/AVERAGE(C2:C6)”,得到結(jié)果為:0.433701。不同分組的變異系數(shù)可進(jìn)行對(duì)比,數(shù)值越大離散程度則越大。4.變異系數(shù)變異系數(shù)和標(biāo)準(zhǔn)差一樣也是用于反映數(shù)據(jù)離散程度的指62數(shù)據(jù)標(biāo)準(zhǔn)化(指數(shù)化)Theusercandemonstrateonaprojectororcomputer,orprintthepresentationandmakeitintoafilmtobeusedinawiderfieldPARTTWELVE數(shù)據(jù)標(biāo)準(zhǔn)化(指數(shù)化)Theusercandemonst63在數(shù)據(jù)分析之前,通常需要先將數(shù)據(jù)標(biāo)準(zhǔn)化(Normalization),利用標(biāo)準(zhǔn)化后的數(shù)據(jù)進(jìn)行數(shù)據(jù)分析,屬于數(shù)據(jù)清洗中的方法。數(shù)據(jù)標(biāo)準(zhǔn)化也就是統(tǒng)計(jì)數(shù)據(jù)的指數(shù)化。數(shù)據(jù)標(biāo)準(zhǔn)化處理主要包括數(shù)據(jù)同趨化處理和無量綱化處理兩個(gè)方面。數(shù)據(jù)同趨化處理主要解決不同性質(zhì)數(shù)據(jù)問題,對(duì)不同性質(zhì)指標(biāo)直接加總不能正確反映不同作用力的綜合結(jié)果,須先考慮改變逆指標(biāo)數(shù)據(jù)性質(zhì),使所有指標(biāo)對(duì)測(cè)評(píng)方案的作用力同趨化,再加總才能得出正確結(jié)果。數(shù)據(jù)無量綱化處理主要解決數(shù)據(jù)的可比性。數(shù)據(jù)標(biāo)準(zhǔn)化的方法有很多種,常用的有“最小—最大(Min-Max)標(biāo)準(zhǔn)化”、“Z-score標(biāo)準(zhǔn)化”和“按小數(shù)定標(biāo)標(biāo)準(zhǔn)化”等。經(jīng)過上述標(biāo)準(zhǔn)化處理,原始數(shù)據(jù)均轉(zhuǎn)換為無量綱化指標(biāo)測(cè)評(píng)值,即各指標(biāo)值都處于同一個(gè)數(shù)量級(jí)別上,可以進(jìn)行綜合測(cè)評(píng)分析。在數(shù)據(jù)分析之前,通常需要先將數(shù)據(jù)標(biāo)準(zhǔn)化(Normalizat641.Min-Max標(biāo)準(zhǔn)化Min-Max標(biāo)準(zhǔn)化方法是對(duì)原始數(shù)據(jù)進(jìn)行線性變換的方法。設(shè)MinA和MaxA分別為屬性A的最小值和最大值,將A的一個(gè)原始值x通過Min-Max標(biāo)準(zhǔn)化映射成在區(qū)間[0,1]中的值x',其公式為:新數(shù)據(jù)=(原數(shù)據(jù)-最小值)/(最大值-最小值)例:采用Min-Max標(biāo)準(zhǔn)化方法將下表的數(shù)據(jù)標(biāo)準(zhǔn)化。產(chǎn)品訪客數(shù)支付轉(zhuǎn)化率客單價(jià)A766312.92%40.92B615614.38%26.45C25623.44%238.65D24459.65%55.77E18814.94%106.69解:產(chǎn)品B的新訪客數(shù)映射到(6156-256)/(7663-256),其中,6156是產(chǎn)品B原訪客數(shù),256是訪客數(shù)中最小的值,7663是訪客數(shù)中最大的值。如下圖所示為Excel中的公式:=(B2-MIN(B$2:B$6))/(MAX(B$2:B$6)-MIN(B$2:B$6))其中,“$”表示絕對(duì)引用,在列名前加“$”表示對(duì)列絕對(duì)引用,在行號(hào)前加“$”表示對(duì)行絕對(duì)引用。

在Excel中運(yùn)用min-max的公式1.Min-Max標(biāo)準(zhǔn)化Min-Max標(biāo)準(zhǔn)化方法是對(duì)原始數(shù)據(jù)652.Z-score標(biāo)準(zhǔn)化Z-score是指基于原始數(shù)據(jù)的平均值(Mean)和標(biāo)準(zhǔn)差(StandardDeviation)進(jìn)行數(shù)據(jù)的標(biāo)準(zhǔn)化。將A的原始值x使用Z-score標(biāo)準(zhǔn)化到x'。Z-score是指標(biāo)準(zhǔn)化方法適用于屬性A的最大值和最小值未知的情況,或有超出取值范圍的離群數(shù)據(jù)的情況,其公式為:新數(shù)據(jù)=(原數(shù)據(jù)-平均值)/標(biāo)準(zhǔn)差例:采用Z-score標(biāo)準(zhǔn)化方法將表2-24的數(shù)據(jù)標(biāo)準(zhǔn)化。解:產(chǎn)品B的新訪客數(shù)為(6156-3680.2)/2774.18,其中,6156是產(chǎn)品B的訪客數(shù),3680.0是訪客數(shù)的平均值,2771.18是訪客數(shù)的總體標(biāo)準(zhǔn)差。右圖所示Excel中的公式為:“=(B2-AVERAGE(B$2:B$6))/STDEV.P(B$2:B$6)”。

在Excel中運(yùn)用z-score的公式2.Z-score標(biāo)準(zhǔn)化Z-score是指基于原始數(shù)據(jù)的平均66感謝觀看感謝觀看67數(shù)據(jù)分析方法論2.1基本方法&2.2高級(jí)方法數(shù)據(jù)分析方法論2.1基本方法&2.2高級(jí)方法681對(duì)比法23CONTENTS拆分法排序法4分組法6降維法7增維法8指標(biāo)法9圖形法5交叉法10SWOT分析法11描述性統(tǒng)計(jì)法12數(shù)據(jù)標(biāo)準(zhǔn)化(指數(shù)化)1對(duì)比法23CONTENTS拆分法排序法4分組法6降維法7增69基本方法數(shù)據(jù)分析有法可循,在分析數(shù)據(jù)時(shí)使用分析方法可以快速有效地分析數(shù)據(jù),從數(shù)據(jù)中獲取信息。常用的基本方法有對(duì)比法、拆分法、排序法、分組法、交叉法、降維法、增維法、指標(biāo)法和圖形法。根據(jù)業(yè)務(wù)場(chǎng)景選擇一種或一種以上的分析方法可以讓分析更加高效。各基本方法的使用場(chǎng)景如表所示。分析方法使用場(chǎng)景對(duì)比法發(fā)現(xiàn)問題拆分法尋找問題的原因排序法找到分析的重點(diǎn)分組法洞察事物特征交叉法將兩個(gè)及以上的維度進(jìn)行比較,并通過交叉的方式分析數(shù)據(jù)降維法解決復(fù)雜問題增維法解決信息量過少的問題指標(biāo)法基本方法,可支持多字段圖形法基本方法,對(duì)分析字段有數(shù)量限制基本方法數(shù)據(jù)分析有法可循,在分析數(shù)據(jù)時(shí)使用分析方法可以快速有70對(duì)比法PARTONE對(duì)比法PARTONE71對(duì)比法是最基本的分析方法也是數(shù)據(jù)分析的“先鋒軍”,分析師在開展分析時(shí)首先使用對(duì)比法,可以快速發(fā)現(xiàn)問題。進(jìn)行商業(yè)分析時(shí)有三個(gè)必備的維度,分別是過去的自己、同期的對(duì)手和同期的行業(yè),通過這三個(gè)維度的對(duì)比可以了解數(shù)據(jù)意義,否則數(shù)據(jù)就是一座孤島。對(duì)比法分為橫向和縱向兩個(gè)方向。橫向?qū)Ρ仁侵缚缇S度的對(duì)比,用于分析不同事物的差異,比如在分析企業(yè)銷售業(yè)績的時(shí)候,將不同行業(yè)的企業(yè)銷售業(yè)績一起進(jìn)行對(duì)比,這樣可以知道某家企業(yè)在整個(gè)市場(chǎng)的地位。如我國500強(qiáng)企業(yè)排行榜單,就是將不同行業(yè)的企業(yè)產(chǎn)值進(jìn)行對(duì)比。縱向?qū)Ρ仁侵冈谕粋€(gè)維度不同階段的對(duì)比,比如基于時(shí)間維度,將今天的銷售業(yè)績和昨天、上個(gè)星期同一天進(jìn)行對(duì)比,可以知道今天銷售業(yè)績的情況。對(duì)比法是最基本的分析方法也是數(shù)據(jù)分析的“先鋒軍”,分析師在開72云計(jì)算和數(shù)據(jù)庫數(shù)據(jù)庫有很多種類型,從最簡單的存儲(chǔ)有各種數(shù)據(jù)的表格到能夠進(jìn)行海量數(shù)據(jù)存儲(chǔ)的大型數(shù)據(jù)庫系統(tǒng)都在各個(gè)方面得到了廣泛的使用。在信息化社會(huì),充分有效地管理和利用各類信息資源,是進(jìn)行科學(xué)研究和決策管理的前提條件。數(shù)據(jù)庫技術(shù)是管理信息系統(tǒng)、辦公自動(dòng)化系統(tǒng)、決策支持系統(tǒng)等各類信息系統(tǒng)的核心部分,是進(jìn)行科學(xué)研究和決策管理的重要技術(shù)手段。云計(jì)算和數(shù)據(jù)庫數(shù)據(jù)庫有很多種類型,從最簡單的存儲(chǔ)有各種數(shù)據(jù)的73云計(jì)算和數(shù)據(jù)庫數(shù)據(jù)庫中的數(shù)據(jù)指的是以一定的數(shù)據(jù)模型組織、描述和儲(chǔ)存在一起、具有盡可能小的冗余度、較高的數(shù)據(jù)獨(dú)立性和易擴(kuò)展性的特點(diǎn)并可在一定范圍內(nèi)為多個(gè)用戶共享。這種數(shù)據(jù)集合具有如下特點(diǎn):云計(jì)算和數(shù)據(jù)庫數(shù)據(jù)庫中的數(shù)據(jù)指的是以一定的數(shù)據(jù)模型組織、描述74云計(jì)算和數(shù)據(jù)庫(1)盡可能不重復(fù);(2)以最優(yōu)方式為某個(gè)特定組織的多種應(yīng)用服務(wù);(3)數(shù)據(jù)結(jié)構(gòu)獨(dú)立于使用它的應(yīng)用程序;(4)對(duì)數(shù)據(jù)的增、刪、改、查由統(tǒng)一軟件進(jìn)行管理和控制。云計(jì)算和數(shù)據(jù)庫(1)盡可能不重復(fù);75云計(jì)算和數(shù)據(jù)庫數(shù)據(jù)庫的基本結(jié)構(gòu)分三個(gè)層次,反映了觀察數(shù)據(jù)庫的三種不同角度。以內(nèi)模式為框架所組成的數(shù)據(jù)庫叫作物理數(shù)據(jù)庫。以概念模式為框架所組成的數(shù)據(jù)叫概念數(shù)據(jù)庫。以外模式為框架所組成的數(shù)據(jù)庫叫用戶數(shù)據(jù)庫。數(shù)據(jù)庫不同層次之間的聯(lián)系是通過映射進(jìn)行轉(zhuǎn)換的。云計(jì)算和數(shù)據(jù)庫數(shù)據(jù)庫的基本結(jié)構(gòu)分三個(gè)層次,反映了觀察數(shù)據(jù)庫的76云計(jì)算和數(shù)據(jù)庫云計(jì)算和數(shù)據(jù)庫77云計(jì)算和數(shù)據(jù)庫(1)物理數(shù)據(jù)層:它是數(shù)據(jù)庫的最內(nèi)層,是物理存儲(chǔ)設(shè)備上實(shí)際存儲(chǔ)的數(shù)據(jù)的集合。這些數(shù)據(jù)是原始數(shù)據(jù),是用戶加工的對(duì)象,由內(nèi)部模式描述的指令操作處理的位串、字符和字組成。(2)概念數(shù)據(jù)層:它是數(shù)據(jù)庫的中間一層,是數(shù)據(jù)庫的整體邏輯表示。指出了每個(gè)數(shù)據(jù)的邏輯定義及數(shù)據(jù)間的邏輯聯(lián)系,是存貯記錄的集合。它所涉及的是數(shù)據(jù)庫所有對(duì)象的邏輯關(guān)系,而不是它們的物理情況,是數(shù)據(jù)庫管理員概念下的數(shù)據(jù)庫。(3)用戶數(shù)據(jù)層:它是用戶所看到和使用的數(shù)據(jù)庫,表示了一個(gè)或一些特定用戶使用的數(shù)據(jù)集合,即邏輯記錄的集合。云計(jì)算和數(shù)據(jù)庫(1)物理數(shù)據(jù)層:它是數(shù)據(jù)庫的最內(nèi)層,是物理存78關(guān)系型數(shù)據(jù)庫在現(xiàn)代的計(jì)算系統(tǒng)上每天網(wǎng)絡(luò)上都會(huì)產(chǎn)生龐大的數(shù)據(jù)量,這些數(shù)據(jù)有很大一部分是由關(guān)系數(shù)據(jù)庫管理系統(tǒng)來處理的。1970年E.F.Codd提出的關(guān)系模型數(shù)據(jù)庫的論文《Arelationalmodelofdataforlargeshareddatabanks》,使得數(shù)據(jù)建模和應(yīng)用程序編程更加簡單。關(guān)系型數(shù)據(jù)庫在現(xiàn)代的計(jì)算系統(tǒng)上每天網(wǎng)絡(luò)上都會(huì)產(chǎn)生龐大的數(shù)據(jù)量79數(shù)據(jù)庫準(zhǔn)則關(guān)系數(shù)據(jù)庫是建立在關(guān)系模型基礎(chǔ)上的數(shù)據(jù)庫,借助于集合代數(shù)等數(shù)學(xué)概念和方法來處理數(shù)據(jù)庫中的數(shù)據(jù)?,F(xiàn)實(shí)世界中的各種實(shí)體以及實(shí)體之間的各種聯(lián)系均用關(guān)系模型來表示。一個(gè)關(guān)系型數(shù)據(jù)庫就是由二維表及其之間的聯(lián)系組成的一個(gè)數(shù)據(jù)組織。通過應(yīng)用實(shí)踐證明,關(guān)系模型非常適合于用戶服務(wù)器編程,是結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)在網(wǎng)絡(luò)和商務(wù)應(yīng)用的主導(dǎo)技術(shù)。數(shù)據(jù)庫準(zhǔn)則關(guān)系數(shù)據(jù)庫是建立在關(guān)系模型基礎(chǔ)上的數(shù)據(jù)庫,借助于集80數(shù)據(jù)庫準(zhǔn)則當(dāng)前主流的關(guān)系型數(shù)據(jù)庫有Oracle、DB2、PostgreSQL、MicrosoftSQLServer、MicrosoftAccess、MySQL、K-DB等。關(guān)系模型是由埃德加·科德(EdgarF.Codd)于1970年首先提出,由關(guān)系數(shù)據(jù)結(jié)構(gòu)、關(guān)系操作集合、關(guān)系完整性約束三部分組成。埃德加·科德(EdgarF.Codd)提出的“科德十二定律”是數(shù)據(jù)存儲(chǔ)的傳統(tǒng)標(biāo)準(zhǔn)。數(shù)據(jù)庫準(zhǔn)則當(dāng)前主流的關(guān)系型數(shù)據(jù)庫有Oracle、DB2、Po81數(shù)據(jù)庫準(zhǔn)則準(zhǔn)則0:一個(gè)關(guān)系形的關(guān)系數(shù)據(jù)庫管理系統(tǒng)必須能完全通過它的關(guān)系能力來管理數(shù)據(jù)庫。準(zhǔn)則1:信息準(zhǔn)則,關(guān)系數(shù)據(jù)庫管理系統(tǒng)的所有信息都應(yīng)該在邏輯一級(jí)上用表中的值這一種方法顯式的表示。準(zhǔn)則2:保證訪問準(zhǔn)則,依靠表名、主碼和列名的組合,保證能以邏輯方式訪問關(guān)系數(shù)據(jù)庫中的每個(gè)數(shù)據(jù)項(xiàng)。準(zhǔn)則3:空值的系統(tǒng)化處理,全關(guān)系的關(guān)系數(shù)據(jù)庫管理系統(tǒng)支持空值的概念,并用系統(tǒng)化的方法處理空值。數(shù)據(jù)庫準(zhǔn)則準(zhǔn)則0:一個(gè)關(guān)系形的關(guān)系數(shù)據(jù)庫管理系統(tǒng)必須能完全通82數(shù)據(jù)庫準(zhǔn)則準(zhǔn)則4:基于關(guān)系模型的動(dòng)態(tài)的聯(lián)機(jī)數(shù)據(jù)字典,數(shù)據(jù)庫的描述在邏輯級(jí)上和普通數(shù)據(jù)采用同樣的表述方式。準(zhǔn)則5:統(tǒng)一的數(shù)據(jù)子語言,一個(gè)關(guān)系數(shù)據(jù)庫管理系統(tǒng)可以具有幾種語言和多種終端訪問方式,但必須有一種語言,它的語句可以表示為嚴(yán)格語法規(guī)定的字符串,并能全面的支持各種規(guī)則。準(zhǔn)則6:視圖更新準(zhǔn)則,所有理論上可更新的視圖也應(yīng)該允許由系統(tǒng)更新。準(zhǔn)則7:高級(jí)的插入、修改和刪除操作,系統(tǒng)應(yīng)該對(duì)各種操作進(jìn)行查詢優(yōu)化。數(shù)據(jù)庫準(zhǔn)則準(zhǔn)則4:基于關(guān)系模型的動(dòng)態(tài)的聯(lián)機(jī)數(shù)據(jù)字典,數(shù)據(jù)庫的83數(shù)據(jù)庫準(zhǔn)則準(zhǔn)則8:數(shù)據(jù)的物理獨(dú)立性,無論數(shù)據(jù)庫的數(shù)據(jù)在存儲(chǔ)表示或訪問方法上作任何變化,應(yīng)用程序和終端活動(dòng)都保持邏輯上的不變性。準(zhǔn)則9:數(shù)據(jù)邏輯獨(dú)立性,當(dāng)對(duì)基本關(guān)系進(jìn)行理論上信息不受損害的任何改變時(shí),應(yīng)用程序和終端活動(dòng)都保持邏輯上的不變性。準(zhǔn)則10:數(shù)據(jù)完整的獨(dú)立性,關(guān)系數(shù)據(jù)庫的完整性約束條件必須是用數(shù)據(jù)庫語言定義并存儲(chǔ)在數(shù)據(jù)字典中的。準(zhǔn)則11:分布獨(dú)立性,關(guān)系數(shù)據(jù)庫管理系統(tǒng)在引入分布數(shù)據(jù)或數(shù)據(jù)重新分布時(shí)保持邏輯不變。準(zhǔn)則12:無破壞準(zhǔn)則,如果一個(gè)關(guān)系數(shù)據(jù)庫管理系統(tǒng)具有一個(gè)低級(jí)語言,那么這個(gè)低級(jí)語言不能違背或繞過完整性準(zhǔn)則。數(shù)據(jù)庫準(zhǔn)則準(zhǔn)則8:數(shù)據(jù)的物理獨(dú)立性,無論數(shù)據(jù)庫的數(shù)據(jù)在存儲(chǔ)表84數(shù)據(jù)庫準(zhǔn)則實(shí)體關(guān)系模型是PeterP.SChen在關(guān)系模型的基礎(chǔ)上,于1976年提出的一套數(shù)據(jù)庫的設(shè)計(jì)工具,他運(yùn)用真實(shí)世界中事物與關(guān)系的觀念,來解釋數(shù)據(jù)庫中的抽象的數(shù)據(jù)架構(gòu)。實(shí)體關(guān)系模型利用圖形的方式來表示數(shù)據(jù)庫的概念設(shè)計(jì),有助于設(shè)計(jì)過程中的構(gòu)思及溝通討論。數(shù)據(jù)庫準(zhǔn)則實(shí)體關(guān)系模型是PeterP.SChen在關(guān)系模85ACID原則(1)原子性A(Atomicity):事務(wù)里的所有操作要么全部做完,要么都不做,事務(wù)成功的條件是事務(wù)里的所有操作都成功,只要有一個(gè)操作失敗,整個(gè)事務(wù)就失敗,需要回滾。如銀行轉(zhuǎn)賬,從A賬戶轉(zhuǎn)100元至B賬戶,分為兩個(gè)步驟:從A賬戶取100元;存入100元至B賬戶。這兩步要么一起完成,要么一起不完成,如果只完成第一步,第二步失敗,錢會(huì)莫名其妙少了100元。ACID原則(1)原子性A(Atomicity):86ACID原則(2)一致性C(Consistency):數(shù)據(jù)庫要一直處于一致的狀態(tài),事務(wù)的運(yùn)行不會(huì)改變數(shù)據(jù)庫原本的一致性約束。例如現(xiàn)有完整性約束a+b=10,如果一個(gè)事務(wù)改變了a,那么必須得改變b,使得事務(wù)結(jié)束后依然滿足a+b=10,否則事務(wù)失敗。ACID原則(2)一致性C(Consistency):87例:小李是某網(wǎng)店運(yùn)營,剛接手一家新網(wǎng)店,欲確定該店鋪的主營品類,已知該店鋪經(jīng)營A、B、C、D四個(gè)品類,各品類銷售數(shù)據(jù)如右表所示。解:將表轉(zhuǎn)變成柱形圖,如右表所示,通過對(duì)比A、B、C、D四個(gè)品類銷售額的最大值,要做市場(chǎng)規(guī)模則選擇銷售額高的品類,要便于生存則選擇銷售額低的品類。A品類B品類C品類D品類1580萬元780萬元605萬元1685萬元各品類的銷售額例:小李是某網(wǎng)店運(yùn)營,剛接手一家新網(wǎng)店,欲確定該店鋪的主營品88拆分法PARTTWO拆分法PARTTWO89拆分法拆分法是最常用的分析方法之一,在許多領(lǐng)域應(yīng)用非常廣泛,杜邦分析法就是拆分法的經(jīng)典應(yīng)用。拆分法是將某個(gè)問題拆解成若干個(gè)子問題,通過研究該若干子問題從而找到問題的癥結(jié)點(diǎn)并解決問題。比如在研究銷售業(yè)績下降問題時(shí),可以將銷售業(yè)績問題拆分成轉(zhuǎn)化率、客單價(jià)和訪客數(shù)這三個(gè)子問題,通過分析這三個(gè)子問題從而解決銷售業(yè)績問題。拆分法拆分法是最常用的分析方法之一,在許多領(lǐng)域應(yīng)用非常廣泛,90解:如圖所示,銷售額下降的問題可拆分成三個(gè)子問題,分別是訪客數(shù)、轉(zhuǎn)化率和客單價(jià)的變化,對(duì)上表的數(shù)據(jù)運(yùn)用對(duì)比法發(fā)現(xiàn)主要是訪客數(shù)的變化引起的銷售額大幅下降??稍龠M(jìn)一步拆分訪客數(shù),訪客數(shù)可分為付費(fèi)訪客數(shù)和免費(fèi)訪客數(shù),對(duì)問題的原因進(jìn)行進(jìn)一步剖析,直到找到問題的根源。拆分法可分為完全拆分法和重點(diǎn)拆分法。完全拆分法,也稱為等額拆分法,是將父問題100%進(jìn)行拆解,拆解出來的子問題的和或者集合(算法)可100%解釋父問題。如銷售額=訪客數(shù)×轉(zhuǎn)化率×客單價(jià),等式兩邊完全相等。重點(diǎn)拆分法,也稱為非等額拆分法。只拆分出問題的重點(diǎn),子問題只解釋了父問題的80%左右。如做好網(wǎng)店=點(diǎn)擊率+轉(zhuǎn)化率+退款率,確實(shí)要做好一家網(wǎng)店只要做好點(diǎn)擊率、轉(zhuǎn)化率和退款率這三個(gè)指標(biāo)就夠了,但做網(wǎng)店運(yùn)營不完全是這三個(gè)環(huán)節(jié)。抓住重要環(huán)節(jié),有時(shí)面對(duì)一些復(fù)雜的問題,就需要采用重點(diǎn)拆分法。日期訪客數(shù)轉(zhuǎn)化率客單價(jià)銷售額周一10003.5%1003500昨日20003.4%1006800上周一25003.5%1008750例:某網(wǎng)店的銷售額大幅下降,店鋪核心數(shù)據(jù)如表所示,運(yùn)營欲找出銷售額下降的原因解:如圖所示,銷售額下降的問題可拆分成三個(gè)子問題,分別是訪客91排序法PARTTHREE排序法PARTTHREE92排序法排序法是基于某一個(gè)指標(biāo)或度量值的大小,將觀測(cè)值進(jìn)行遞增或遞減排列,每一次排列只能基于某一個(gè)指標(biāo)。排序法是從對(duì)比法中衍生的一種常用方法,百度搜索風(fēng)云榜、阿里排行榜等業(yè)內(nèi)知名榜單就是重采用排序法的產(chǎn)品,通過查看排序后的榜單,用戶可以快速獲取目標(biāo)價(jià)值信息。排序法排序法是基于某一個(gè)指標(biāo)或度量值的大小,將觀測(cè)值進(jìn)行遞增93例:某運(yùn)營收集了數(shù)個(gè)品類的數(shù)據(jù),如表所示,欲通過排序法列出品類榜單品類交易指數(shù)在線產(chǎn)品數(shù)(個(gè))T恤2017855135570連衣裙4355121868084褲子2266441053642襯衫1959211556930表1未排序的品類行業(yè)數(shù)據(jù)解:排序法只能基于某一個(gè)度量進(jìn)行排序,表1中有兩個(gè)度量,因此可以做出兩個(gè)表單。例:某運(yùn)營收集了數(shù)個(gè)品類的數(shù)據(jù),如表所示,欲通過排序法列出品94表2為基于交易指數(shù)的榜單,排名越靠前代表該品類的市場(chǎng)規(guī)模越大。排名品類交易指數(shù)在線產(chǎn)品數(shù)(個(gè))1連衣裙43551218680842褲子22664410536423T恤20178551355704襯衫1959211556930表3為基于產(chǎn)品數(shù)的榜單,排名越靠前代表該品類的市場(chǎng)競(jìng)爭越大。排名品類交易指數(shù)在線產(chǎn)品數(shù)(個(gè))1T恤20178551355702褲子22664410536423連衣裙43551218680844襯衫1959211556930表2為基于交易指數(shù)的榜單,排名越靠前代表該品類的市場(chǎng)規(guī)模越大95分組法PARTFOUR分組法PARTFOUR96分組法來源于統(tǒng)計(jì)學(xué),用于發(fā)現(xiàn)事物的特征,是非常重要的分析方法。分析時(shí)可以按類型、結(jié)構(gòu)、時(shí)間階段等維度進(jìn)行分組,觀察分組后的數(shù)據(jù)特征,從特征中洞察信息。例:基于下表的信息,分析褲子和職業(yè)套裝的差異父類目子類目銷售額(元)褲子休閑褲747991311褲子打底褲89942330褲子西裝褲/正裝褲4952899褲子棉褲/羽絨褲1800685職業(yè)套裝休閑套裝216517887職業(yè)套裝職業(yè)女裙套裝24072258職業(yè)套裝醫(yī)護(hù)制服1649589職業(yè)套裝其他套裝5952780解:基于題目可以得知需要對(duì)父類目進(jìn)行統(tǒng)計(jì)分組。分組結(jié)果如下表所示父類目銷售額(元)褲子844687225職業(yè)套裝248192514通過觀察分組結(jié)果可知褲子的市場(chǎng)份額遠(yuǎn)大于職業(yè)套裝的市場(chǎng)份額分組法來源于統(tǒng)計(jì)學(xué),用于發(fā)現(xiàn)事物的特征,是非常重要的分析方法97交叉法PARTFIVE交叉法PARTFIVE98交叉法是對(duì)比法和拆分法的結(jié)合,將有一定關(guān)聯(lián)的兩個(gè)或兩個(gè)以上的維度和度量值排列在統(tǒng)計(jì)表內(nèi)進(jìn)行對(duì)比分析,在小于等于三維的情況下可以靈活使用圖表進(jìn)行展示。當(dāng)維度大于三維時(shí)選用統(tǒng)計(jì)表展示,此時(shí)也稱之多維分析法。比如在研究市場(chǎng)定價(jià)時(shí),經(jīng)常將產(chǎn)品特征和定價(jià)作為維度,銷售額作為指標(biāo)進(jìn)行分析。例:下表所示是不同性別的消費(fèi)者在不同品類上的消費(fèi)金額數(shù)據(jù),利用交叉法分析不同性別的差異。性別品類消費(fèi)金額(元)男零食68男耳機(jī)180女零食155女耳機(jī)42解:將左表轉(zhuǎn)變成二維交叉表,如表2-10所示,可以直觀地觀察到男性和女性用戶在消費(fèi)偏好上的差異,男性更愿意在耳機(jī)上消費(fèi),女性則更愿意在零食上消費(fèi)。性別

品類零食耳機(jī)男68180女15542交叉法是對(duì)比法和拆分法的結(jié)合,將有一定關(guān)聯(lián)的兩個(gè)或兩個(gè)以上的99降維法PARTSIX降維法PARTSIX100降維法是在數(shù)據(jù)集指標(biāo)過多及分析干擾因素太多時(shí),通過找到并分析核心指標(biāo)提高分析精度,或者通過主成分分析、因子分析等統(tǒng)計(jì)學(xué)方法將數(shù)據(jù)由高維轉(zhuǎn)換成低維的方法。比如在分析店鋪數(shù)據(jù)時(shí),根據(jù)業(yè)務(wù)問題的核心提取主要的2~4個(gè)核心指標(biāo)進(jìn)行分析。例:根據(jù)下表的數(shù)據(jù)指標(biāo)字段評(píng)估店鋪的綜合情況。轉(zhuǎn)化率銷售額客單價(jià)訪客數(shù)動(dòng)銷率連帶率好評(píng)率糾紛率上新率解:對(duì)數(shù)據(jù)指標(biāo)字段進(jìn)行分類,將店鋪的評(píng)估分成產(chǎn)品運(yùn)營能力、店鋪獲客能力和店鋪服務(wù)能力。降維法是在數(shù)據(jù)集指標(biāo)過多及分析干擾因素太多時(shí),通過找到并分析101動(dòng)銷率連帶率上新率反映店鋪產(chǎn)品運(yùn)營能力的指標(biāo)如下表所示反映店鋪獲客能力的指標(biāo)如下表所示轉(zhuǎn)化率銷售額客單價(jià)訪客數(shù)反映店鋪服務(wù)能力的指標(biāo)如下表所示好評(píng)率糾紛率基于各能力維度下的指標(biāo),綜合評(píng)估各能力的分?jǐn)?shù)??墒褂脭?shù)據(jù)歸一化的方法或者熵值法計(jì)算分?jǐn)?shù),達(dá)到綜合評(píng)估的目的。1.數(shù)據(jù)歸一化是將數(shù)據(jù)映射到[0,1]的區(qū)間,在2.2.3小節(jié)中詳細(xì)介紹。2.熵值法的核心思想是用信息的無序度來衡量信息的效用值。信息的無序度越低(越不穩(wěn)定)動(dòng)銷率連帶率上新率反映店鋪產(chǎn)品運(yùn)營能力的指標(biāo)如下表所示反映店102增維法Theusercandemonstrateonaprojectororcomputer,orprintthepresentationandmakeitintoafilmtobeusedinawiderfieldPARTSEVEN增維法Theusercandemonstrateon103增維法是在數(shù)據(jù)集的字段過少或信息量不足時(shí),為了便于分析師分析,通過計(jì)算衍生出更加直觀的指標(biāo)。比如在分析關(guān)鍵詞時(shí),將搜索人氣除以商品數(shù)量得到的新指標(biāo),定義為關(guān)鍵詞的競(jìng)爭指數(shù)。例:如表所示,計(jì)算關(guān)鍵詞的競(jìng)爭度,公式如下:競(jìng)爭度=搜索人氣×點(diǎn)擊率×支付轉(zhuǎn)化率÷在線商品數(shù)基于業(yè)務(wù)經(jīng)驗(yàn),得到的指標(biāo)為正指標(biāo),數(shù)值越大越好關(guān)鍵詞搜索人氣點(diǎn)擊率在線商品數(shù)支付轉(zhuǎn)化率競(jìng)爭度永生花32914152.95%1651186.92%0.021永生花花瓣耳環(huán)11736132.03%31993.99%0.193永生花禮盒10274162.75%557748.55%0.026永生花DIY材料包9245222.64%41983.71%0.182永生花玻璃罩7977138.58%237186.89%0.032增維法是在數(shù)據(jù)集的字段過少或信息量不足時(shí),為了便于分析師分析104指標(biāo)法Theusercandemonstrateonaprojectororcomputer,orprintthepresentationandmakeitintoafilmtobeusedinawiderfieldPARTEIGHT指標(biāo)法Theusercandemonstrateon105指標(biāo)法是分析的基本方法之一,通過匯總值、平均值、標(biāo)準(zhǔn)差等一系列統(tǒng)計(jì)指標(biāo)研究分析數(shù)據(jù)。指標(biāo)法更適用于多維的數(shù)據(jù)。例:下表所示為淘寶搜索某關(guān)鍵詞按人氣排名前5的商品數(shù)據(jù),

通過指標(biāo)法描述這個(gè)數(shù)據(jù)。排名售價(jià)銷售額評(píng)價(jià)人數(shù)DSR_物流分DSR_描述分DSR_服務(wù)分16801156001514.614.744.7623680629280164.984.984.98321803727809024.954.954.964218037496023634.924.934.94521993804279584.954.974.95指標(biāo)法是分析的基本方法之一,通過匯總值、平均值、標(biāo)準(zhǔn)差等一系106解:使用指標(biāo)法描述數(shù)據(jù)后的結(jié)果,如下表所示。

售價(jià)銷售額評(píng)價(jià)人數(shù)DSR_物流分DSR_描述分DSR_服務(wù)分計(jì)數(shù)555555缺失值000000平均值21843746098784.884.914.92匯總109191873047439024.4124.5724.59標(biāo)準(zhǔn)差9491624698350.140.090.08描述數(shù)據(jù)的相關(guān)度量解:使用指標(biāo)法描述數(shù)據(jù)后的結(jié)果,如下表所示。

售價(jià)銷售額評(píng)價(jià)107圖形法Theusercandemonstrateonaprojectororcomputer,orprintthepresentationandmakeitintoafilmtobeusedinawiderfieldPARTNINE圖形法Theusercandemonstrateon108圖形法是分析的基本方法之一,通過柱形圖、折線圖、散點(diǎn)圖等一系列統(tǒng)計(jì)圖形直觀地分析數(shù)據(jù)。圖形法適用于低維的數(shù)據(jù)。例:下表所示為淘寶搜索某關(guān)鍵詞按人氣排名前220的商品數(shù)據(jù),通過圖形法分析相關(guān)售價(jià)的分布排名售價(jià)銷售額評(píng)價(jià)人數(shù)DSR_物流分DSR_描述分DSR_服務(wù)分16801156001514.614.744.7623680629280164.984.984.98321803727809024.954.954.96……………………………………220150547800332064.754.634.74某關(guān)鍵詞按人氣排名前220的商品數(shù)據(jù)圖形法是分析的基本方法之一,通過柱形圖、折線圖、散點(diǎn)圖等一系109解:下圖所示是基于售價(jià)分組后繪制的直方圖,可以直觀地觀察各個(gè)價(jià)格區(qū)間包含商品的個(gè)數(shù),商品售價(jià)分布主要集中在[118,588],[1058,1528]兩個(gè)區(qū)間。

圖形法有畫圖空間、圖形和圖注三個(gè)要素。畫圖空間是圖形的容器,圖形呈現(xiàn)在畫圖空間之中,如二維空間、三維空間。圖形是要表達(dá)信息的可視化結(jié)果,如線形、柱形。圖注是對(duì)圖形的標(biāo)注。如上圖所示,圖注包含圖標(biāo)題、數(shù)據(jù)標(biāo)簽、坐標(biāo)軸、坐標(biāo)軸標(biāo)題、圖例。圖1價(jià)格區(qū)間分布圖圖2圖形的圖注示例解:下圖所示是基于售價(jià)分組后繪制的直方圖,可以直觀地觀察各個(gè)110SWOT分析法Theusercandemonstrateonaprojectororcomputer,orprintthepresentationandmakeitintoafilmtobeusedinawiderfieldPARTTENSWOT分析法Theusercandemonstrat111SWOT分析法,即態(tài)勢(shì)分析法,來源于市場(chǎng)營銷方法論,是首先將與研究對(duì)象密切相關(guān)的各種主要內(nèi)部優(yōu)勢(shì)、劣勢(shì)和外部的機(jī)會(huì)和威脅等,通過調(diào)查列舉出來,并依照矩陣形式排列,然后用系統(tǒng)分析的思想,把各種因素相互匹配起來加以分析,從中得出一系列相應(yīng)的結(jié)論,而結(jié)論通常帶有一定的決策性。SWOT分析法是常用的分析方法,有助于分析師了解企業(yè)當(dāng)前所處的內(nèi)外環(huán)境,可以讓分析師更準(zhǔn)確地通過數(shù)據(jù)做判斷。SWOT分析法,即態(tài)勢(shì)分析法,來源于市場(chǎng)營銷方法論,是首先將112數(shù)據(jù)分析方法論課件113數(shù)據(jù)分析方法論課件114數(shù)據(jù)分析方法論課件115數(shù)據(jù)分析方法論課件116數(shù)據(jù)分析方法論課件117數(shù)據(jù)分析方法論課件1181.內(nèi)部因素分析

內(nèi)部因素由優(yōu)勢(shì)(Strengths)和劣勢(shì)(Weaknesses)組成,對(duì)企業(yè)內(nèi)部的管理、團(tuán)隊(duì)、產(chǎn)品和市場(chǎng)營銷情況進(jìn)行分析,通過了解企業(yè)的內(nèi)部情況,分析師可以更好地解讀數(shù)據(jù)中蘊(yùn)藏的信息。例:如下表所示,對(duì)某電商公司的內(nèi)部因素進(jìn)行分析。優(yōu)勢(shì)(Strengths)劣勢(shì)(Weaknesses)1.店鋪開發(fā)能力強(qiáng)2.服務(wù)消費(fèi)者的能力強(qiáng)3.能夠把控品質(zhì)4.公司的財(cái)務(wù)狀況非常好1.公司管理方面不是很完善2.庫存能力不強(qiáng),常斷貨3.公司內(nèi)部人員競(jìng)爭4.店鋪定位不明確5.開發(fā)消費(fèi)者能力弱1.內(nèi)部因素分析內(nèi)部因素由優(yōu)勢(shì)(Strengths)和1192.外部因素分析

外部因素由機(jī)會(huì)(Opportunities)和威脅(Threats)組成,對(duì)企業(yè)外部的環(huán)境、政策和競(jìng)爭對(duì)手進(jìn)行分析,通過了解企業(yè)的外部情況,分析師可以充分地了解企業(yè)的情況。例:如下表所示,對(duì)某電商公司的外部因素進(jìn)行分析。機(jī)會(huì)(Opportunities)威脅(Threats)1.市場(chǎng)標(biāo)桿很少,明確定位的店鋪很少2.市場(chǎng)需求大幅增長3.普遍不重視用戶體驗(yàn)4.個(gè)性化1.競(jìng)爭2.同質(zhì)化嚴(yán)重3.盜圖4.大商家新入駐2.外部因素分析外部因素由機(jī)會(huì)(Opportunit1203.基于內(nèi)外因素的應(yīng)對(duì)策略

在充分了解企業(yè)的內(nèi)外部情況后,將內(nèi)部的優(yōu)勢(shì)、劣勢(shì)和外部的機(jī)會(huì)、威脅進(jìn)行交叉。當(dāng)企業(yè)的優(yōu)勢(shì)遇到機(jī)會(huì),應(yīng)當(dāng)采取發(fā)展的策略;當(dāng)企業(yè)的優(yōu)勢(shì)遇到威脅,應(yīng)當(dāng)采取拓展的策略;當(dāng)企業(yè)的劣勢(shì)遇到機(jī)會(huì),應(yīng)當(dāng)采取爭取的策略;當(dāng)企業(yè)的劣勢(shì)遇到威脅,應(yīng)當(dāng)采取保守的策略。例:如下表所示,根據(jù)某電商企業(yè)的內(nèi)外部因素進(jìn)行策略分析。

優(yōu)勢(shì)(Strengths)劣勢(shì)(Weaknesses)機(jī)會(huì)(Opportunities)SO(發(fā)展)WO(爭?。?.結(jié)合市場(chǎng)情況,在自身開發(fā)能力的基礎(chǔ)上,找到明確的定位,增加消費(fèi)者黏性,提高復(fù)購率2.提升消費(fèi)者體驗(yàn)3.開發(fā)更多新品迎合市場(chǎng)需求1.提升管理能力,讓指令可以上行下達(dá)2.合理使用ERP軟件進(jìn)行管理,嚴(yán)格把控庫存?zhèn)}位3.設(shè)定良性競(jìng)爭機(jī)制4.精準(zhǔn)定位消費(fèi)者人群5.制訂推廣方案,吸引更多新消費(fèi)者威脅(Threats)ST(拓展)WT(保守)1.提升店鋪形象(口碑)2.開發(fā)團(tuán)隊(duì)把控市場(chǎng)需求走向,規(guī)避同質(zhì)化3.結(jié)合公司的自主開發(fā),提升公司版權(quán)保護(hù)意識(shí)4.精準(zhǔn)定位消費(fèi)者1.保持店鋪的獨(dú)特風(fēng)格,不被外界影響2.加強(qiáng)CRM管控3.基于內(nèi)外因素的應(yīng)對(duì)策略在充分了解企業(yè)的內(nèi)外部情況121描述性統(tǒng)計(jì)法Theusercandemonstrateonaprojectororcomputer,orprintthepresentationandmakeitintoafilmtobeusedinawiderfieldPARTELEVEN描述性統(tǒng)計(jì)法Theusercandemonstrate122描述性統(tǒng)計(jì)法是運(yùn)用描述性統(tǒng)計(jì)指標(biāo)對(duì)數(shù)據(jù)集進(jìn)行研究,來源于統(tǒng)計(jì)學(xué)。在獲得數(shù)據(jù)集后,一般要對(duì)數(shù)據(jù)集進(jìn)行觀察,了解數(shù)據(jù)集的字段、數(shù)據(jù)分布等。當(dāng)數(shù)據(jù)指標(biāo)較少時(shí)可選用圖形法進(jìn)行直觀的觀察,數(shù)據(jù)指標(biāo)較多時(shí)無法使用,此時(shí)需

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論