《數(shù)據(jù)化運(yùn)營(yíng)》課件-錦囊二:數(shù)據(jù)清洗_第1頁(yè)
《數(shù)據(jù)化運(yùn)營(yíng)》課件-錦囊二:數(shù)據(jù)清洗_第2頁(yè)
《數(shù)據(jù)化運(yùn)營(yíng)》課件-錦囊二:數(shù)據(jù)清洗_第3頁(yè)
《數(shù)據(jù)化運(yùn)營(yíng)》課件-錦囊二:數(shù)據(jù)清洗_第4頁(yè)
《數(shù)據(jù)化運(yùn)營(yíng)》課件-錦囊二:數(shù)據(jù)清洗_第5頁(yè)
已閱讀5頁(yè),還剩14頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

網(wǎng)絡(luò)營(yíng)銷與直播電商專業(yè)教學(xué)資源庫(kù)BYYUSHEN《數(shù)據(jù)化運(yùn)營(yíng)》數(shù)據(jù)清洗BYYUSHEN01數(shù)據(jù)清洗定義02

缺失值清洗網(wǎng)絡(luò)營(yíng)銷與直播電商專業(yè)教學(xué)資源庫(kù)03空值清洗04

錯(cuò)誤標(biāo)示清洗05格式內(nèi)容清洗BYYUSHEN01EntrepreneurshipPlan數(shù)據(jù)清洗定義數(shù)據(jù)清洗是指將數(shù)據(jù)表中多余、重復(fù)的數(shù)據(jù)篩選出來(lái)并刪除,將缺失、不完整的數(shù)據(jù)補(bǔ)充完整,將內(nèi)容、格式錯(cuò)誤的數(shù)據(jù)糾正或剔除的操作行為。缺失值清洗格式內(nèi)容清洗邏輯錯(cuò)誤清洗重復(fù)數(shù)據(jù)清洗無(wú)價(jià)值數(shù)據(jù)清洗BYYUSHEN02EntrepreneurshipPlan缺失值清洗缺失值清洗數(shù)據(jù)集中某個(gè)或某些屬性的值是不完整的。缺失值產(chǎn)生的原因有些信息無(wú)法獲取,如在收集顧客婚姻狀況和工作信息時(shí),未婚人士的配偶、未成年兒童的工作單位等都是無(wú)法獲取的信息。數(shù)據(jù)收集或者保存失敗造成數(shù)據(jù)缺失,如數(shù)據(jù)存儲(chǔ)的失敗、存儲(chǔ)器損壞、機(jī)械故障等。人為原因?qū)е碌哪承┬畔⒈贿z漏或刪除。BYYUSHEN03EntrepreneurshipPlan空值清洗空值清洗打開(kāi)原始數(shù)據(jù)表格,選中數(shù)據(jù)區(qū)域,在“開(kāi)始”選項(xiàng)卡下的“編輯”功能組中單擊“查找和選擇”按鈕,點(diǎn)擊“定位條件”命令,在彈出的“定位條件”對(duì)話框中選中“空值”,點(diǎn)擊“確定”后,所有的空值即可被一次性選中。1BYYUSHEN03EntrepreneurshipPlan空值清洗2定位到空白值后,可以選擇“數(shù)據(jù)補(bǔ)齊”、“刪除記錄”或者“不處理”。如需數(shù)據(jù)補(bǔ)齊,則直接輸入需要補(bǔ)充的內(nèi)容,按“Ctrl+Enter”組合鍵,進(jìn)行批量填充。BYYUSHEN03EntrepreneurshipPlan空值清洗處理缺失值的三種方法:(1)數(shù)據(jù)補(bǔ)齊。即使用某個(gè)統(tǒng)計(jì)指標(biāo)填充缺失數(shù)據(jù),如該變量的樣本平均值等。(2)刪除記錄。將有缺失值的記錄刪掉,但這樣會(huì)導(dǎo)致樣本量減少,數(shù)據(jù)量較少時(shí)應(yīng)謹(jǐn)慎使用。(3)不處理。樣本較少時(shí),或者該數(shù)據(jù)缺失屬正常情況時(shí),不做處理。BYYUSHEN04EntrepreneurshipPlan錯(cuò)誤標(biāo)識(shí)符清洗#####

單元格中的數(shù)據(jù)超出了該單元格的寬度,或者單元格中的日期時(shí)間公式產(chǎn)生了一個(gè)負(fù)值#DIV/0!

進(jìn)行公式運(yùn)算時(shí)除數(shù)使用了數(shù)值零、指向了空單元格或包含零值單元格的引用如圖,由于2022年7月5日所采購(gòu)的商品還未采集到因不合格而產(chǎn)生退貨的數(shù)量,因此在計(jì)算退貨率時(shí),發(fā)生了“#VALUE!”的錯(cuò)誤。BYYUSHEN04EntrepreneurshipPlan錯(cuò)誤標(biāo)識(shí)符清洗將鼠標(biāo)定位在出現(xiàn)“I12”單元格中,在公式編輯欄中,修改原公式“=H12/E12”為“=IFERROR(H12/E12,"/")”1BYYUSHEN2確認(rèn)輸入后,“I12”單元格中的“#VALUE!”被修改為“/”,然后拖動(dòng)“I12”單元格的填充柄,將其他發(fā)生錯(cuò)誤的單元格進(jìn)行填充修改04錯(cuò)誤標(biāo)識(shí)符清洗BYYUSHEN05格式內(nèi)容清洗由于系統(tǒng)導(dǎo)出渠道或人為輸入習(xí)慣的原因,整合而來(lái)的原始數(shù)據(jù)往往不能做到格式統(tǒng)一,內(nèi)容上也容易出現(xiàn)空格?!坝唵蝿?chuàng)建時(shí)間”列出現(xiàn)了四種不同的表達(dá)方式,“物流公司”列的字符前面或中間存在空格,需要將其修正。BYYUSHEN選中“訂單創(chuàng)建時(shí)間”整列,右擊打開(kāi)彈出式菜單,單擊“設(shè)置單元格格式”選項(xiàng),在彈出的“設(shè)置單元格格式”對(duì)話框中,選擇“數(shù)字”選項(xiàng)卡,單擊“日期”,將其類型修改為如圖所示的樣式。單擊“確定”完成。105格式內(nèi)容清洗BYYUSHEN2“物流公司”列數(shù)據(jù)中的空格可以使用“替換”一次性批量去除。選中數(shù)據(jù)區(qū)域,在“開(kāi)始”選項(xiàng)卡下的“編輯”功能組中單擊“查找和替換”按鈕,單擊“替換”命令,在“查找內(nèi)容”中輸入一個(gè)空格,在“替換為”中不輸入任何內(nèi)容,單擊“全部替換”即可全部刪除表格中的空格。05格式內(nèi)容清洗BYYUSHEN06邏輯錯(cuò)誤清洗違反邏輯規(guī)律的要求和邏輯規(guī)則而產(chǎn)生的錯(cuò)誤,一般使用邏輯推理就可以發(fā)現(xiàn)問(wèn)題。123數(shù)據(jù)不合理數(shù)據(jù)自相矛盾數(shù)據(jù)不符合規(guī)則如客戶年齡500歲,或者消費(fèi)金額為-100元,明顯不符合客觀事實(shí)。如限購(gòu)1件的商品,客戶的購(gòu)買數(shù)量卻為3件。如客戶的出生年份是1980年,但年齡卻顯示18歲。BYYUSHEN06邏輯錯(cuò)誤清洗如客戶的出生年份是1980年,但年齡卻顯示18歲?!岸嗖氏鹌つ嗵缀小鄙唐返挠唵伪鞡YYUSHEN由于該商品限購(gòu)1件,因此需要將“購(gòu)買數(shù)量”大于1的記錄標(biāo)注出來(lái)。選中“購(gòu)買數(shù)量”列,選擇“開(kāi)始”選項(xiàng)卡—“樣式”功能組—“條件格式”—“突出顯示單元格規(guī)格”—“大于”,在彈出的“大于”對(duì)話框中,填入數(shù)值“1”,單擊“確定”,即可將錯(cuò)誤數(shù)據(jù)標(biāo)注出來(lái)。106邏輯錯(cuò)誤清洗BYYUSHEN2同理,條件格式選擇“小于”即可將“買家實(shí)際支付金額”列的錯(cuò)誤數(shù)據(jù)標(biāo)注出來(lái)。05格式內(nèi)容清洗BYYUSHEN02EntrepreneurshipPlan數(shù)據(jù)分類統(tǒng)計(jì)上述案例中,可以把“流量來(lái)源”“來(lái)源明細(xì)”放置在列

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論