Python數(shù)據(jù)分析與可視化典型項(xiàng)目實(shí)戰(zhàn)模塊六-訂單數(shù)據(jù)分析_第1頁(yè)
Python數(shù)據(jù)分析與可視化典型項(xiàng)目實(shí)戰(zhàn)模塊六-訂單數(shù)據(jù)分析_第2頁(yè)
Python數(shù)據(jù)分析與可視化典型項(xiàng)目實(shí)戰(zhàn)模塊六-訂單數(shù)據(jù)分析_第3頁(yè)
Python數(shù)據(jù)分析與可視化典型項(xiàng)目實(shí)戰(zhàn)模塊六-訂單數(shù)據(jù)分析_第4頁(yè)
Python數(shù)據(jù)分析與可視化典型項(xiàng)目實(shí)戰(zhàn)模塊六-訂單數(shù)據(jù)分析_第5頁(yè)
已閱讀5頁(yè),還剩12頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

模塊六訂單數(shù)據(jù)分析Python數(shù)據(jù)分析與可視化典型項(xiàng)目實(shí)戰(zhàn)(微課版)【任務(wù)描述】Excel文件“order_report.xlsx”共有28010行、7列數(shù)據(jù),列名分別為:訂單編號(hào)、總金額(即訂單總金額)、實(shí)際支付金額(即在已付款的情況下為總金額與退款金額之差;在未付款的情況下則為0)、收貨地址(即各個(gè)省市區(qū))、訂單創(chuàng)建時(shí)間(即下單時(shí)間)、訂單付款時(shí)間(即付款時(shí)間)、退款金額(即付款后申請(qǐng)退款的金額,如未付過(guò)款,退款金額為0)。針對(duì)該數(shù)據(jù)集完成以下數(shù)據(jù)分析與可視化操作。(1)計(jì)算總體轉(zhuǎn)化率與單一環(huán)節(jié)轉(zhuǎn)化率。(2)繪制總體轉(zhuǎn)化率漏斗圖與單一環(huán)節(jié)轉(zhuǎn)化率漏斗圖。(3)繪制按日統(tǒng)計(jì)的訂單數(shù)量趨勢(shì)折線(xiàn)圖。(4)繪制銷(xiāo)量區(qū)域分布的柱形圖。(5)繪制全國(guó)各地區(qū)訂單數(shù)分布地圖。【任務(wù)實(shí)現(xiàn)】在JupyterNotebook開(kāi)發(fā)環(huán)境中創(chuàng)建tc06-01.ipynb,然后在單元格中編寫(xiě)代碼并輸出對(duì)應(yīng)的結(jié)果?!救蝿?wù)6-1】訂單數(shù)據(jù)分析訂單數(shù)據(jù)分析1.導(dǎo)入模塊importdatetime2.提取數(shù)據(jù)df=pd.read_excel(r'.\data\order_report.xlsx')df.head()訂單數(shù)據(jù)分析3.?dāng)?shù)據(jù)清洗查看數(shù)據(jù)集的列名df.columns輸出結(jié)果:Index(['訂單編號(hào)','總金額','實(shí)際支付金額','收貨地址','訂單創(chuàng)建時(shí)間','訂單付款時(shí)間','退款金額'],dtype='object')通過(guò)info()函數(shù)查看數(shù)據(jù)各字段的詳細(xì)信息()輸出結(jié)果:訂單數(shù)據(jù)分析數(shù)據(jù)重復(fù)值、缺失值處理重復(fù)值統(tǒng)計(jì)輸出結(jié)果:0df.duplicated().sum()缺失值統(tǒng)計(jì)輸出結(jié)果:df.isnull().sum()對(duì)于缺失值,訂單付款時(shí)間缺失3923個(gè),因?yàn)閷?shí)際支付金額未缺失,所以訂單付款時(shí)間缺失值可以不做處理,也可以填充“0”。訂單數(shù)據(jù)分析4.繪制總體轉(zhuǎn)化率漏斗圖與單一環(huán)節(jié)轉(zhuǎn)化率漏斗圖統(tǒng)計(jì)各字段數(shù)量dict_convs=dict()key='總訂單數(shù)'dict_convs[key]=len(df)key='付款訂單數(shù)'#訂單付款時(shí)間不為空的,表示付過(guò)款df_payed=df[df['訂單付款時(shí)間'].notnull()]dict_convs[key]=len(df_payed)key='到款訂單數(shù)'#實(shí)際支付金額=總金額-退款金額(在已付款的情況下)#實(shí)際支付金額不為0的,說(shuō)明訂單商家收到貨款df_trans=df_payed[df_payed['實(shí)際支付金額']!=0]dict_convs[key]=len(df_trans)key='全額到款訂單數(shù)'訂單數(shù)據(jù)分析#在付款訂單中,退款金額為0的,說(shuō)明沒(méi)有退款,表示全額收款df_trans_full=df_payed[df_payed['退款金額']==0]dict_convs[key]=len(df_trans_full)len(df_trans_full)df_convs=pd.Series(dict_convs,name='訂單數(shù)').to_frame()df_convs計(jì)算總體轉(zhuǎn)化率name='總體轉(zhuǎn)化率'total_convs=df_convs['訂單數(shù)']/df_convs.loc['總訂單數(shù)','訂單數(shù)']*100df_convs[name]=total_convs.apply(lambdax:round(x,0))繪制總體轉(zhuǎn)化率漏斗圖name='總體轉(zhuǎn)化率'funnel=Funnel().add(series_name=name,data_pair=[list(z)forzinzip(df_convs.index,df_convs[name])],訂單數(shù)據(jù)分析is_selected=True,label_opts=opts.LabelOpts(position='inside'))funnel.set_series_opts(tooltip_opts=opts.TooltipOpts(formatter='{a}<br/>:{c}%'))funnel.set_global_opts(title_opts=opts.TitleOpts(title=name),)funnel.render_notebook()計(jì)算單一環(huán)節(jié)轉(zhuǎn)化率name='單一環(huán)節(jié)轉(zhuǎn)化率'single_convs=df_convs['訂單數(shù)'].shift()#默認(rèn)下移一位df_convs[name]=single_convs.fillna(df_convs.loc['總訂單數(shù)','訂單數(shù)'])#填充空值df_convs[name]=round((df_convs['訂單數(shù)']/df_convs[name]*100),0)df_convs訂單數(shù)據(jù)分析繪制單一環(huán)節(jié)轉(zhuǎn)化率漏斗圖name='單一環(huán)節(jié)轉(zhuǎn)化率'funnel=Funnel().add(series_name=name,data_pair=[list(z)forzinzip(df_convs.index,df_convs[name])],is_selected=True,label_opts=opts.LabelOpts(position='inside'))funnel.set_series_opts(tooltip_opts=opts.TooltipOpts(formatter='{a}<br/>:{c}%'))funnel.set_global_opts(title_opts=opts.TitleOpts(title=name))funnel.render_notebook()訂單數(shù)據(jù)分析5.分析整體訂單數(shù)趨勢(shì)將“訂單創(chuàng)建時(shí)間”設(shè)置為標(biāo)簽#設(shè)置標(biāo)簽為“訂單創(chuàng)建時(shí)間”df_trans=df_trans.set_index('訂單創(chuàng)建時(shí)間')df_trans.head()使用pandas的DataFrame.plot()方法繪制按日統(tǒng)計(jì)的訂單數(shù)量趨勢(shì)折線(xiàn)圖(5月)按日統(tǒng)計(jì)訂單數(shù)量se_trans_month=df_trans.resample('D')['訂單編號(hào)'].count()plt.figure(figsize=(10,5))se_trans_month.plot(fontsize=12)訂單數(shù)據(jù)分析計(jì)算訂單平均價(jià)格df_trans['實(shí)際支付金額'].mean()使用pyecharts.charts的Line類(lèi)繪制按日統(tǒng)計(jì)的訂單數(shù)量趨勢(shì)折線(xiàn)圖掃描二維碼在線(xiàn)瀏覽電子活頁(yè)6-1“繪制按日統(tǒng)計(jì)的訂單數(shù)量趨勢(shì)折線(xiàn)圖”中的代碼及繪制的圖形。輸出結(jié)果:100.36861777895066訂單數(shù)據(jù)分析6.分析銷(xiāo)量區(qū)域分布分析收貨地址,繪制銷(xiāo)量區(qū)域分布的柱形圖se_trans_map=df_trans.groupby('收貨地址')['收貨地址'].count().sort_values(ascending=False)plt.figure(figsize=(10,5),dpi=100)se_trans_map.plot(kind='bar',fontsize=12)分析收貨地址,繪制銷(xiāo)量區(qū)域分布的柱形圖【任務(wù)描述】Excel文件“天貓訂單.xlsx”共有28010行、6列數(shù)據(jù),列名分別為:訂單創(chuàng)建時(shí)間、訂單付款時(shí)間、訂單金額、實(shí)付金額、退款金額、收貨地址。通過(guò)分析28010條天貓實(shí)際訂單數(shù)據(jù),看看全國(guó)哪里的訂單量比較大,哪些時(shí)間段訂單量比較大。針對(duì)該數(shù)據(jù)集完成以下數(shù)據(jù)可視化分析操作。(1)繪制一周7天各個(gè)時(shí)段訂單數(shù)量散點(diǎn)圖。(2)繪制一周各天訂單數(shù)量極坐標(biāo)圖。(3)繪制天貓訂單全國(guó)分布地圖。【任務(wù)實(shí)現(xiàn)】在JupyterNotebook開(kāi)發(fā)環(huán)境中創(chuàng)建tc06-02.ipynb,然后在單元格中編寫(xiě)代碼并輸出對(duì)應(yīng)的結(jié)果。【任務(wù)6-2】天貓訂單數(shù)據(jù)可視化分析天貓訂單數(shù)據(jù)可視化分析1.導(dǎo)入模塊導(dǎo)入通用模塊的代碼詳見(jiàn)“本書(shū)導(dǎo)學(xué)”,導(dǎo)入其他模塊的代碼如下:frommons.utilsimportJsCodefrompyecharts.globalsimportThemeType2.?dāng)?shù)據(jù)讀取與預(yù)處理數(shù)據(jù)讀取df=pd.read_excel(r'data\天貓訂單.xlsx')df.head()查看數(shù)據(jù)集大小df.shape輸出結(jié)果:28010,6天貓訂單數(shù)據(jù)可視化分析查看索引、數(shù)據(jù)類(lèi)型、內(nèi)存信息等基本信息()篩選已付款的訂單df[~df['訂單付款時(shí)間'].isnull()]根據(jù)“訂單創(chuàng)建時(shí)間”獲取星期數(shù)據(jù)并增加“星期”列df['星期']=df['訂單創(chuàng)建時(shí)間'].dt

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論