Python程序設計教程(工作手冊式) 課件 情景6、7 Python與會計、Python與電子商務_第1頁
Python程序設計教程(工作手冊式) 課件 情景6、7 Python與會計、Python與電子商務_第2頁
Python程序設計教程(工作手冊式) 課件 情景6、7 Python與會計、Python與電子商務_第3頁
Python程序設計教程(工作手冊式) 課件 情景6、7 Python與會計、Python與電子商務_第4頁
Python程序設計教程(工作手冊式) 課件 情景6、7 Python與會計、Python與電子商務_第5頁
已閱讀5頁,還剩73頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

Python程序設計教程

(工作手冊式)情景六Python與會計任務mission12Python之財務報表Python之財務分析任務一Python之財務報表前言:表間數(shù)據(jù)關系根據(jù)企業(yè)會計準則要求,有些項目需根據(jù)科目余額表中多個項目計算填列、分析填列等,就需通過科目映射表的橋接作用,即把科目余額表與科目映射表進行拼接,再轉(zhuǎn)換到資產(chǎn)負債表及利潤表中一.獲取任務數(shù)據(jù)1.獲取余額表、科目映射表數(shù)據(jù)引入pandas模塊,讀取科目余額表、映射表、資產(chǎn)負債表及利潤表等相關表格,效果如下圖所示:科目余額表(部分截圖)科目映射表(部分截圖)一.獲取任務數(shù)據(jù)1.獲取余額表、科目映射表數(shù)據(jù)引入pandas模塊,讀取科目余額表、映射表、資產(chǎn)負債表及利潤表等相關表格,效果如下圖所示:資產(chǎn)負債表(部分截圖)利潤表(部分截圖)一.獲取任務數(shù)據(jù)2.將科目余額表與映射表拼接準備好數(shù)據(jù)后,通過merge函數(shù),將科目余額表與映射表進行拼接,執(zhí)行代碼:merge_kmys_kmye=pd.merge(left=kmys,right=kmye,on=[‘科目編碼’,‘科目名稱’],how=‘left‘),效果如下圖所示:二.編制利潤表本年形成的利潤即利潤表中的凈利潤與資產(chǎn)負債表中“本年利潤”項目有關,故先編制出利潤表,再編制資產(chǎn)負債表。期末轉(zhuǎn)入二.編制利潤表1.科目余額按報表項目匯總,計算出利潤表項目篩選出合并報表中的利潤表科目,通過merge函數(shù)找到項目編號中“I”開頭的項目,即利潤表項目,計算出利潤表項目金額。再對篩選出項目進行空值填充、數(shù)據(jù)合并、索引重置及修改為報表項目名稱等,計算出利潤表項目金額。如右圖所示:二.編制利潤表2.生成利潤表結構通過merge()函數(shù),把剛生成的數(shù)據(jù)表與原準備的利潤表標準格式表相拼接,并通過del()函數(shù)等,刪除兩表中重復內(nèi)容的列,根據(jù)標準格式重新定義列名稱。如右圖所示:3.計算利潤項目

利潤表項目數(shù)據(jù)取得后,各利潤項目數(shù)據(jù)需計算獲得,計算公式如下:營業(yè)利潤=主營業(yè)務收入+其他業(yè)務收入-主營業(yè)務成本-其他業(yè)務成本-稅金及附加-銷售費用-管理費用-財務費用-資產(chǎn)減值損失+投資收益+公允價值變動損益利潤總額=營業(yè)利潤+營業(yè)外收入-營業(yè)外支出凈利潤=利潤總額-所得稅費用。二.編制利潤表

根據(jù)各利潤項目的計算原理,定位應計算的行項目,分別計算營業(yè)利潤、利潤總額及凈利潤金額,結果如右圖所示。本期營業(yè)利潤計算:ps_2.loc[10,'本期金額']=ps_2.loc[:9,'本期金額'].sum()本期利潤總額計算:ps_2.loc[13,'本期金額']=ps_2.loc[10:12,'本期金額'].sum()本期凈利潤計算:ps_2.loc[15,'本期金額']=ps_2.loc[13:14,'本期金額'].sum()3.計算利潤項目二.編制利潤表

利潤表各項目數(shù)據(jù)計算出來后,可利用前面所學知識,對其項目順序、小數(shù)位數(shù)等格式進行美化調(diào)整,并輸出利潤表,結果如右圖所示。4.編輯利潤表格式及輸出利潤表二.編制利潤表三.編制資產(chǎn)負債表1.計算出資產(chǎn)負債表項目把科目余額表與科目映射表拼接表中的資產(chǎn)負債表項目及相關數(shù)據(jù)通過pivot()函數(shù)進行透視讀取出來,為后續(xù)編制資產(chǎn)負債表做準備。因篇幅關系,前10行截圖如右圖所示:三.編制資產(chǎn)負債表2.生成資產(chǎn)負債表結構按照資產(chǎn)負債表格式項目,設置報表列名稱,并把資產(chǎn)負債表項目表與標準資產(chǎn)負債表格式表進行拼接,并刪除多余列及各項目順序,生成資產(chǎn)負債表標準結構表,但此時的本年利潤項目期末余額沒有金額,如右圖所示:三.編制資產(chǎn)負債表3.結轉(zhuǎn)凈利潤到資產(chǎn)負債表中本例中,前面所計算出凈利潤,并未結轉(zhuǎn)到資產(chǎn)負債表中,因此,現(xiàn)在需采用表結法將利潤表算出的凈利潤數(shù)據(jù)結轉(zhuǎn)到資產(chǎn)負債表中“本年利潤”項目中,如右圖所示:三.編制資產(chǎn)負債表4.計算資產(chǎn)負債表項目根據(jù)資產(chǎn)負債表項目的性質(zhì)及邏輯結構,計算相關項目的合計金額,計算公式如下:流動資產(chǎn)合計=所有流動資產(chǎn)余額之和非流動資產(chǎn)合計=所有非流動資產(chǎn)余額之和非流負債產(chǎn)合計=所有非流動負債余額之和所有者權益合計=所有所有者權益之和資產(chǎn)合計=流動資產(chǎn)+非流動資產(chǎn)負債合計=流動負債+非流動負債負債及所有者權益合計=負債合計+所有者權益合計,計算結果如右圖所示:三.編制資產(chǎn)負債表5.校驗資產(chǎn)負債表平衡根據(jù)資產(chǎn)負債表編制基礎(資產(chǎn)=負債+所有者權益)的平衡原理,檢驗所生成報表是否平衡,試算不平衡,則報表計算或編制有誤,需進一步檢查。用if…else…條件判斷語句完成相關檢驗工作,用abs()函數(shù)將負債和權益類的報表項轉(zhuǎn)為正數(shù)顯示,自行計算報表匯總項,結果如下圖所示:三.編制資產(chǎn)負債表6.資產(chǎn)負債表格式優(yōu)化及輸出資產(chǎn)表各項目數(shù)據(jù)計算出來并對其平衡校驗后,就是對其項目順序、小數(shù)位數(shù)等格式進行美化調(diào)整,并輸出報表,結果如右圖所示:四.任務一小結在財務報表的編制過程,讓我們熟悉了excel表的讀取和輸出,能夠熟練地掌握merge函數(shù)、pivot函數(shù)、列表數(shù)據(jù)的讀取、引用、索引等方法的綜合實踐操作,也讓我們對財務報表結構和數(shù)據(jù)邏輯關系有了進一步的認識。同學們,我們每個人的生活都是一張資產(chǎn)負債表,資產(chǎn)負債表英文叫BalanceSheet。Balance即平衡,人生也是一樣,一項資產(chǎn)的獲得總是通過另一項資產(chǎn)的減少或者權益(負債和所有者權益)的增加來實現(xiàn)。你現(xiàn)在過著輕松、簡單的生活,是因有父母等其他人在為你負重前行,你需要努力學習、專研技能,掌握好自己生活、工作的本領,努力使自己的利潤表變得更漂亮,增強自己承擔負債的能力,積累更多的人生凈資產(chǎn),才能讓幸福延續(xù)。任務二Python之財務數(shù)據(jù)分析一.財務報表分析數(shù)據(jù)準備1.讀取分析數(shù)據(jù)本任務利用上一節(jié)生成的資產(chǎn)負債表和利潤表進行財務報表分析,分別讀取利潤表和資產(chǎn)負債表數(shù)據(jù)。一.財務報表分析數(shù)據(jù)準備2.分析數(shù)據(jù)預處理因后續(xù)指標計算中,對資產(chǎn)負債表項目多處需用到平均值,因此,先將資產(chǎn)負債表增加一列平均值,以備后用。二.財務分析指標計算1.償債能力分析償債能力是指企業(yè)償還到期債務(包含本金及利息)的能力。能否及時償還到期債務,是反映企業(yè)財務狀況好壞的重要標志。通過對償債能力的分析,可以考察企業(yè)持續(xù)經(jīng)營的能力和風險,有助于對企業(yè)未來收益進行預測。主要分析指標計算公式如下:指標計算公式指標說明流動比率=流動資產(chǎn)÷流動負債

速動比率=速動資產(chǎn)÷流動負債速動資產(chǎn)=貨幣資金+交易性金融資產(chǎn)+應收賬款+應收票據(jù)+其他應收款現(xiàn)金比率=(貨幣資金+交易性金融資產(chǎn))÷流動負債×100%

資產(chǎn)負債率=負債總額/資產(chǎn)總額×100%

產(chǎn)權比率=負債總額/所有者權益總額×100%

二.財務分析指標計算1.償債能力分析根據(jù)償債能力指標計算數(shù)據(jù)要求,從資產(chǎn)負債表中對應列讀取相關數(shù)據(jù),進行計算,并對計算結果進行輸出。過程及結果如右圖所示。二.財務分析指標計算2.營運能力分析營運能力分析是衡量公司資產(chǎn)管理效率的財務比率,營運能力指標也可以用周轉(zhuǎn)天數(shù)來衡量。存貨周轉(zhuǎn)天數(shù)加應收賬款的周轉(zhuǎn)天數(shù)等于營運周期。營運周期越短,意味著企業(yè)的資金周轉(zhuǎn)速度越快,運營能力越強。主要分析指標計算公式如下:指標計算公式指標說明應收賬款周轉(zhuǎn)率(周轉(zhuǎn)次數(shù))(RTR)=營業(yè)收入/平均應收賬款余額平均應收賬款余額=應收賬款平均余額+應收票據(jù)平均余額總資產(chǎn)周轉(zhuǎn)率(周轉(zhuǎn)次數(shù))(TA)=營業(yè)收入/平均總資產(chǎn)平均總資產(chǎn)=(年初總資產(chǎn)+年末總資產(chǎn))/2流動資產(chǎn)周轉(zhuǎn)率(周轉(zhuǎn)次數(shù))(CAT)=營業(yè)收入/平均流動資產(chǎn)平均流動資產(chǎn)=(年初流動資產(chǎn)+年末流動資產(chǎn))/2營運資本周轉(zhuǎn)率(周轉(zhuǎn)次數(shù))(WCT)=營業(yè)收入/平均營運資本營運資本=流動資產(chǎn)-流動負債二.財務分析指標計算2.營運能力分析根據(jù)營運能力指標計算數(shù)據(jù)要求,分別從資產(chǎn)負債表和利潤表中對應列讀取相關數(shù)據(jù),進行計算,并對計算結果進行輸出。過程及結果如右圖所示。二.財務分析指標計算3.盈利能力分析盈利能力是指企業(yè)獲取利潤、實現(xiàn)資金增值的能力,是企業(yè)持續(xù)經(jīng)營和發(fā)展的保證。企業(yè)經(jīng)營業(yè)績的好壞最終可通過企業(yè)的盈利能力來反映。對于信用相同或相近的幾個企業(yè),人們總是將資金投向盈利能力強的企業(yè)。主要分析指標計算公式如下:指標計算公式指標說明銷售毛利率(GPM)=銷售毛利÷營業(yè)收入×100%銷售毛利(GM)=營業(yè)收入-營業(yè)成本銷售利潤率(ROS)=營業(yè)利潤÷營業(yè)收入×100%

銷售凈利潤率(TTM)=凈利潤÷營業(yè)收入×100%

總資產(chǎn)凈利率(ROA)=凈利潤÷平均總資產(chǎn)×100%平均總資產(chǎn)=(總資產(chǎn)期初數(shù)+總資產(chǎn)期本數(shù))÷2二.財務分析指標計算3.盈利能力分析根據(jù)盈利能力指標計算數(shù)據(jù)要求,分別從資產(chǎn)負債表和利潤表中對應列讀取相關數(shù)據(jù),進行計算,并對計算結果進行輸出。過程及結果如右圖所示。二.財務分析指標計算4.發(fā)展能力分析發(fā)展能力是指企業(yè)未來生產(chǎn)經(jīng)營活動的發(fā)展趨勢和發(fā)展?jié)摿?,也即增長能力,它是企業(yè)通過自身的生產(chǎn)經(jīng)營活動,不斷擴大積累而形成的發(fā)展?jié)撃?。主要分析指標計算公式如下:指標計算公式營業(yè)收入增長率(OIGR)=((本年營業(yè)收入-上年營業(yè)收入)/上年營業(yè)收入)×100%凈利潤增長率(NGR)=((本年凈利潤-上年凈利潤)/上年凈利潤)×100%資產(chǎn)增長率(TAGR)=((年末資產(chǎn)總額-年初資產(chǎn)總額)/年初資產(chǎn)總額)×100%資本積累率(CAR)=((年末股東權益總額-年初股東權益總額)/年初股東權益總額)二.財務分析指標計算4.發(fā)展能力分析根據(jù)發(fā)展能力指標計算數(shù)據(jù)要求,分別從資產(chǎn)負債表和利潤表中對應列讀取相關數(shù)據(jù),進行計算,并對計算結果進行輸出。過程及結果如下圖所示。三.任務二小結通過本次任務的學習和實踐,使我們熟悉了Python在財務數(shù)據(jù)分析中的程序,了解了常用的償債能力、營運能力、盈利能力及發(fā)展能力分析指標的計算及呈現(xiàn)形式,并且能夠熟練地對分析結果輸出的常用操作方法的實踐操作。財務數(shù)據(jù)分析,猶如醫(yī)生把脈問診,分析人員主要是以會計核算和財務報表資料及其他相關資料為依據(jù),是對企業(yè)過去和現(xiàn)在狀況進行行分析與評價的經(jīng)濟管理活動。隨著技術的發(fā)展,更加需要大數(shù)據(jù)技術與財務會計融合的能力,才能為企業(yè)的管理策略調(diào)整提供更科學及時的依據(jù)。Python程序設計教程

(工作手冊式)情景七Python與電子商務任務mission12電子商務爬蟲電子商務數(shù)據(jù)分析任務一Python之電子商務爬蟲一.爬蟲基礎什么是爬蟲?爬蟲可以幫助我們把網(wǎng)站上的信息快速提取并保存下來。能爬取哪些數(shù)據(jù)?在網(wǎng)頁中我們能看到各種各樣的信息,最常見的便是常規(guī)網(wǎng)頁,它們對應著HTML代碼,而最常抓取的便是HTML源代碼。一.爬蟲基礎1.爬蟲流程1)獲取網(wǎng)頁爬蟲首先要做的工作就是獲取網(wǎng)頁,這里就是獲取網(wǎng)頁的源代碼2)提取信息獲取網(wǎng)頁的源代碼后,接下來就是分析網(wǎng)頁的源代碼,從中提取我們想要的數(shù)據(jù)。3)保存數(shù)據(jù)提取信息后,我們一般會將提取到的數(shù)據(jù)保存到某處以便后續(xù)使用。4)自動化程序爬蟲可以代替人來完成這些操作。一.爬蟲基礎2.urllib模塊

打開和讀取URL

解析URL

解析robots.txt文件

包含urllib.request拋出異常一.爬蟲基礎讀取重慶城市職業(yè)學院主頁html源碼fromurllib.requestimporturlopenmyURL=urlopen("/")print(myURL.read().decode('utf-8'))一.爬蟲基礎使用request讀取重慶城市職業(yè)學院主頁html代碼importurllib.requestrequest=urllib.request.Request('/')response=urllib.request.urlopen(request)print(response.read().decode('utf-8'))一.爬蟲基礎3.異常處理urllib的error模塊定義了由request模塊產(chǎn)生的異常。如果出現(xiàn)了問題,request模塊便會拋出error模塊中定義的異常?!緦嵗坑脺y試網(wǎng)站捕獲異常importsocketimporturllib.requestimporturllib.error

try:response=urllib.request.urlopen('/get',timeout=0.1)excepturllib.error.URLErrorase:ifisinstance(e.reason,socket.timeout):print('TIMEOUT')一.爬蟲基礎4.分析robots協(xié)議利用urllib的robotparser模塊,可以實現(xiàn)網(wǎng)站Robots協(xié)議的分析。Robots協(xié)議也稱作爬蟲協(xié)議、機器人協(xié)議,它的全名叫作網(wǎng)絡爬蟲排除標準(RobotsExclusionProtocol),用來告訴爬蟲和搜索引擎哪些頁面可以抓取,哪些不可以抓取。一個robots.txt的樣例:User-agent:*Disallow:/Allow:/public/二.爬取電子商務數(shù)據(jù)項目要求:爬取京東商城中“筆記本電腦”的數(shù)據(jù),并把內(nèi)容存儲到excel表格之中。1.安裝第三方庫1)安裝爬蟲庫PipinstallrequestsPipinstallselectorsPipinstalllxml2)安裝excel文件庫Pipinstallopenpyxl二.爬取電子商務數(shù)據(jù)二.爬取電子商務數(shù)據(jù)2.分析網(wǎng)頁結構1)查看網(wǎng)頁在googlechrome瀏覽器中輸入:。注意:1.建議使用google瀏覽器。2.復制網(wǎng)頁時建議分2次取再拼接。如下2個連接都是相同的:/search?keyword=%E7%AC%94%E8%AE%B0%E6%9C%AC&suggest=1.his.0.0&wq=%E7%AC%94%E8%AE%B0%E6%9C%AC&ev=exbrand_%E8%81%94%E6%83%B3%EF%BC%88lenovo%EF%BC%89%5E/search?keyword=筆記本&suggest=1.his.0.0&wq=筆記本&ev=exbrand_聯(lián)想(lenovo)%5E二.爬取電子商務數(shù)據(jù)2.分析網(wǎng)頁標簽在瀏覽器中,按F12功能鍵點擊商品標簽,看右邊代碼的變化??梢钥吹皆赾lass標簽id=J_goodsList里ul標簽下的li標簽,對應著所有商品列表二.爬取電子商務數(shù)據(jù)3.爬取數(shù)據(jù)url=/search?keyword=筆記本&wq=筆記本&ev=exbrand_聯(lián)想%5E&page=9&s=241&click=1headers={'User-Agent':'Mozilla/5.0(WindowsNT6.1;WOW64)AppleWebKit/537.36(KHTML,likeGecko)Chrome/86.0.4240.198Safari/537.36'}res=requests.get(url,headers=headers)res.encoding='utf-8'text=res.textselector=etree.HTML(text)list=selector.xpath('//*[@id="J_goodsList"]/ul/li')foriinlist:title=i.xpath('.//div[@class="p-namep-name-type-2"]/a/em/text()')[0]……print("product_id="+str(product_id))print("")二.爬取電子商務數(shù)據(jù)4.獲取評論數(shù)據(jù)在F12對應的界面中,轉(zhuǎn)到network頁,找到以“productCommentSummaries.action”開頭的項目,把對應的URL地址取出并放到瀏覽器中執(zhí)行,得到的頁面就是所有商品ID以及對應的評論數(shù)據(jù)。二.爬取電子商務數(shù)據(jù)4.獲取評論數(shù)據(jù)在F12對應的界面中,轉(zhuǎn)到network頁,找到以“productCommentSummaries.action”開頭的項目,把對應的URL地址取出并放到瀏覽器中執(zhí)行,得到的頁面就是所有商品ID以及對應的評論數(shù)據(jù)。二.爬取電子商務數(shù)據(jù)4.獲取評論數(shù)據(jù)創(chuàng)建函數(shù)讀取數(shù)據(jù)defcommentcount(product_id):url1=“/comment/productCommentSummaries.action?referenceIds=”+str(rpoduct_id)+”&callback=jQuery5358031&_=1667631915528”res1=requests.get(url1,headers=headers)……returncomment_countforiinlist:title=i.xpath('.//div[@class="p-namep-name-type-2"]/a/em/text()')[0]……print("price="+str(price))print("comment_count="+str(comment_count))二.爬取電子商務數(shù)據(jù)5.保存數(shù)據(jù)到excl文件中importopenpyxloutwb=openpyxl.Workbook()outws=outwb.create_sheet(index=0)outws.cell(row=1,column=1,value="index")outws.cell(row=count,column=1,value=str(count-1))outws.cell(row=count,column=2,value=str(title))outws.cell(row=count,column=3,value=str(price))outws.cell(row=count,column=4,value=str(comment_count))count+=1outwb.save("jdgood.xls")三.任務一小結通過本次任務的學習和實踐,使我們熟悉了Python網(wǎng)絡爬蟲的基本模塊,能夠使用urllib與request配合抓取網(wǎng)頁內(nèi)容。在任務實施中,增加了xpath與openpyxl的內(nèi)容,以便于更好的分析與爬取數(shù)據(jù),并把數(shù)據(jù)保存到本地文件之中。要爬取網(wǎng)頁的數(shù)據(jù),就要對網(wǎng)頁的基本結構有所了解,同時要會使用googlechrome的F12功能,把我們需要的內(nèi)容映射到不同的div之中。同學們要強化個人信息自我保護意識,在生活、學習中養(yǎng)成保護個人信息的習慣。要遵守網(wǎng)站的robots協(xié)議,不爬取敏感信息,在網(wǎng)站中獲取的數(shù)據(jù),只用于學習不做他途。當要做數(shù)據(jù)交換時,要及時的對數(shù)據(jù)進行脫敏操作,嚴禁不脫敏就向網(wǎng)絡發(fā)送傳播原始信息任務二電子商務數(shù)據(jù)分析一.電子商務數(shù)據(jù)分析基礎

商務數(shù)據(jù)分析的目的是要洞察數(shù)據(jù)后面的規(guī)律。通過這些規(guī)律,企業(yè)可以制定相應的措施與決策,從而過到預想的結果,這也是商務數(shù)據(jù)分析的最大價值。

在商務數(shù)據(jù)分析過程中,要先對數(shù)據(jù)進行相應的處理加工,才可以使用描述性統(tǒng)計分析方法、探索性數(shù)據(jù)分析方法等技術手段對數(shù)據(jù)進行深加工,得到我們的預期一.電子商務數(shù)據(jù)分析基礎1.數(shù)據(jù)預處理1)數(shù)據(jù)清洗缺失值處理異常值處理重復值處理一.電子商務數(shù)據(jù)分析基礎實例:缺失值處理--用固定值填充一.電子商務數(shù)據(jù)分析基礎實例異常值處理箱線圖一.電子商務數(shù)據(jù)分析基礎實例重復值處理一般使用drop_duplicates()方法一.電子商務數(shù)據(jù)分析基礎2)數(shù)據(jù)標準化離差標準化離差標準化也叫Min-Max規(guī)范化標準差標準化標準差標準化也叫Z-score規(guī)范化一.電子商務數(shù)據(jù)分析基礎2.統(tǒng)計術語數(shù)據(jù)類型截面數(shù)據(jù):對多個個體在相同或近似相同的同一時間節(jié)點上搜集的數(shù)據(jù)時間序列數(shù)據(jù):某個個體在一段時間內(nèi)搜集到的數(shù)據(jù)集面板數(shù)據(jù):既有截面維度又有時間維度的混合數(shù)據(jù)集,可分為平衡面板數(shù)據(jù)、非平衡面板數(shù)據(jù)數(shù)據(jù)的位置度量平均數(shù),中位數(shù),眾數(shù)。一.電子商務數(shù)據(jù)分析基礎3.探索性數(shù)據(jù)分析統(tǒng)計檢驗卡方檢驗一.電子商務數(shù)據(jù)分析基礎3.探索性數(shù)據(jù)分析獨立分布t檢驗方差檢驗一.電子商務數(shù)據(jù)分析基礎3.探索性數(shù)據(jù)分析Q-Q圖一.電子商務數(shù)據(jù)分析基礎3.探索性數(shù)據(jù)分析相關系數(shù)二.數(shù)據(jù)分析案例:根據(jù)已有數(shù)據(jù)對店鋪整體運營情況進行分析,了解運營狀況,對未來進行預測,已經(jīng)成為電商運營必不可少的技能。任務對一家全球超市4年(2011~2014年)的零售數(shù)據(jù)進行數(shù)據(jù)分析,實現(xiàn)①分析每年銷售額增長率;②各個地區(qū)分店的銷售額;③銷售淡旺季;④新老客戶數(shù);⑤RFM模型標記用戶價值。二.數(shù)據(jù)分析1.數(shù)據(jù)準備數(shù)據(jù)來源于數(shù)據(jù)科學競賽平臺Kaggle,網(wǎng)址為/jr2ngb/superstore-data,總共51290條數(shù)據(jù),24個字段。二.數(shù)據(jù)分析2.數(shù)據(jù)清洗與整理1)查看是否含有缺失值通過info函數(shù)了解到在數(shù)據(jù)集中的只有PostalCode字段含有缺失值(只有9994個)。判斷每個字段(any()方法)中的數(shù)據(jù)是否含有缺失值(isna()方法),如圖7-37所示。data.isna().any()2)查看是否有異常值在查看數(shù)據(jù)的缺失值之后還需要檢查一下數(shù)據(jù)中是否含有異常值,Pandas的describe()可以用來統(tǒng)計數(shù)據(jù)集的集中趨勢,如圖7-38所示,分析各行列的分布情況,因此在查看異常值時會經(jīng)常用到。data.describe()3)數(shù)據(jù)整理由于很多分析的維度都是建立在時間基礎上的,通過數(shù)據(jù)類型的結果發(fā)現(xiàn)數(shù)據(jù)中的時間是字符串類型的,所以需要處理時間的類型,將其修改成datetime類型。二.數(shù)據(jù)分析3.商務數(shù)據(jù)分析目標1)每年銷售額的增長率銷售增長率是企業(yè)本年銷售收入增長額同上年銷售收入總額之比。2)分店銷售額及對比對比不同分店的銷售額,用于對不同地區(qū)分配下一年度的銷售額指標,或者采取不同的營銷策略。3)用戶價值度RFM模型RFM模型,R(Recency):客戶最近一次交易時間的間隔。R值越大,表示客戶交易發(fā)生的日期越久,反之則表示客戶交易發(fā)生的日期越近。F(Frequency):值越大,表示客戶交易越頻繁,反之則表示客戶交易不夠活躍。M(Monetary):客戶在最近一段時間內(nèi)交易的金額。M值越大,表示客戶價值越高,反之則表示客戶價值越低。RFM模型是衡量客戶價值和用戶創(chuàng)利能力的經(jīng)典工具,依托于客戶最近一次購買時間、消費頻次及消費金額。應用RFM模型時,要有客戶基礎的交易數(shù)據(jù),至少包含客戶號、交易金額和交易時間3個字段。二.數(shù)據(jù)分析4.RFM模型分析過程步驟1:統(tǒng)計全年的數(shù)據(jù)。data_2014=data[data[‘Order-year’]==2014]data_2014=data[[‘CustomerID’,’OrderDate’,’Sales’]]二.數(shù)據(jù)分析4.RFM模型分析過程步驟2:對數(shù)據(jù)分組deforder_sort(group):returngroup.sort_values(by=’OrderDate’)[-1:]data_2014_group=data_2014.groupby(by=’CustomerID’,as_index=False)data_max_time=data_2014_group.apply(order_sort)二.數(shù)據(jù)分析4.RFM模型分析過程步驟3:計算F,M值data_max_time[‘F’]=data_2014_group.size().valuesdata_max_time[‘M’]=data_2014_group.sum()[‘Sales’].values二.數(shù)據(jù)分析4.RFM模型分析過程計算R值

根據(jù)需要假定時間計算2014年12月31日,最近一次交易時間的間隔。注意,由于是歷史數(shù)據(jù),計算的時候時間跨度不要太大。stat_date=pd.to_datetime(‘2014-12-31)r_data=stat_date–data_max_time[‘OrderDate’]data_max_time[‘R’]=r_data.values二.數(shù)據(jù)分析4.RFM模型分析過程步驟5:設定評分區(qū)間給定F的區(qū)間為[0,5,10,15,20,50]

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論