版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
電子商務專業(yè)綜合實訓實驗報告2022年9月13日專業(yè)電子商務班級2班學號姓名成績實驗名稱DEEP大數(shù)據(jù)分析實驗項目大數(shù)據(jù)理論基礎與應用實踐電子商務大數(shù)據(jù)指導教師一、實驗目的培養(yǎng)學生對市場部門工作職能的認識加強對關系數(shù)據(jù)庫讀寫的能力和實操熟練程度掌握數(shù)據(jù)連接、加工、可視化的方法培養(yǎng)學生通過大數(shù)據(jù)分析手段解決業(yè)務問題的意識建立通過數(shù)據(jù)觀察市場表現(xiàn)的意識二、實驗內(nèi)容1.大數(shù)據(jù)理論基礎與應用實戰(zhàn)項目六:市場部選擇廣告投放方案7.1購買自行車的顧客有哪些特征?7.1.1用線性回歸選擇廣告投放方案項目七:如何進行自行車精準營銷?8.1性別、年收入、年齡是否影響購買?8.1.1性別、年收入對購買結(jié)果影響購買自行車8.1.2客戶年齡離散化8.1.3年齡對購買結(jié)果影響購買自行車8.2用神經(jīng)網(wǎng)絡發(fā)現(xiàn)潛在購買自行車客戶8.2.1用神經(jīng)網(wǎng)絡發(fā)現(xiàn)潛在購買自行車客戶項目十一:法務部門事故自行車理賠預測12.1用決策樹審核交通事故是否理賠12.1.1計算交通事故理賠數(shù)據(jù)的相關12.1.2用決策樹審核交通事故是否理賠2.電商平臺數(shù)據(jù)分析1.1電商平臺數(shù)據(jù)分析1.1.1母嬰電商數(shù)據(jù)分析1.1.2電商用戶行為分析三、實驗步驟1.大數(shù)據(jù)理論基礎與應用實戰(zhàn)項目六:市場部選擇廣告投放方案7.1購買自行車的顧客有哪些特征?7.1.1用線性回歸選擇廣告投放方案創(chuàng)建工作流→課程數(shù)據(jù)庫節(jié)點→e_advertising節(jié)點→組織訓練數(shù)據(jù)→進行線性回歸分析→e_advertising_predict節(jié)點→組織預測數(shù)據(jù)節(jié)點→進行預測數(shù)據(jù)其中列“predict”表示在不同的媒體上投放廣告所得的預測銷售收入。從計算結(jié)果可以看出,分別在報紙,廣播,電視上投放40萬元、60萬元、100萬元預計所得銷售收入最大,為1800多萬元,因此可以參選這種方案的廣告投放預算方案進行實施線性回歸的運行結(jié)果:項目七:如何進行自行車精準營銷?8.1性別、年收入、年齡是否影響購買?8.1.1性別、年收入對購買結(jié)果影響購買自行車在個人免費數(shù)獵場上增加項目重命名為“自行車精準營銷”,在該項目上創(chuàng)建一個數(shù)據(jù)工作流命名為“性別,年收入對購買結(jié)果影響”并打開新建一個【課程數(shù)據(jù)庫】節(jié)點,連接大數(shù)據(jù)理論基礎與應用實戰(zhàn)后,抽取【數(shù)據(jù)源】面板中選中targetmail表創(chuàng)建一個【轉(zhuǎn)換】節(jié)點
重命名為“統(tǒng)計性別”,連接上游選擇“統(tǒng)計性別”節(jié)點,在【數(shù)據(jù)轉(zhuǎn)換】面板上將Gender一列從源列拖動到目標列,并勾選Group屬性新建一列命名為”BuyerCount”,其【類型】屬性設為INT,【聚合】屬性設置為【求和】,然后創(chuàng)建從源列“BikeBuyer”到“BuyerCount”列的連線新建一列命名為“Count”,其【聚合】屬性設為【計數(shù)】,然后創(chuàng)建從BikeBuyer到Count的連線運行及結(jié)果創(chuàng)建一個年收入節(jié)點,與性別統(tǒng)計分析同樣的方式創(chuàng)建【年收入分組購買率】節(jié)點運行結(jié)果可視化年收入和自行車購買情況柱狀圖年收入和自行車購買情況玫瑰圖在本實驗中,我們按照不同性別
和年收入的人進行分組,分別統(tǒng)計了購買自行車的人數(shù),還對年收入分組計算不同年齡的購買率8.1.2客戶年齡離散化在本實驗中,我們首先計算年齡的最大值和最小值,然后根據(jù)最大值和最小值,把年齡離散化成7個年齡段,通過比較不同年齡段用戶的購買情況來評估年齡對購買行為的影響8.1.3年齡對購買結(jié)果影響購買自行車在本實驗中,我們把年齡數(shù)據(jù)進行離散化,用來查看各個年齡段的總?cè)藬?shù)和購買者是否有明顯的差異,得到33歲到63歲之間人群是購買自行車的主要人群8.2用神經(jīng)網(wǎng)絡發(fā)現(xiàn)潛在購買自行車客戶8.2.1用神經(jīng)網(wǎng)絡發(fā)現(xiàn)潛在購買自行車客戶在本實驗中,我們對上下班距離進行量化,將其從字符串類型轉(zhuǎn)換成數(shù)值類型,并進行了首次購買自行車年齡的計算,最后訓練了一個多層感知機分類模型,并用該模型預測新的人員是否購買自行車,用于進行精準營銷項目十一:法務部門事故自行車理賠預測12.1用決策樹審核交通事故是否理賠12.1.1計算交通事故理賠數(shù)據(jù)的相關在本實驗中,我們學習了在抽取數(shù)據(jù)時把數(shù)據(jù)從字符串類型轉(zhuǎn)換成DECIMAL類型的法,進行兩列數(shù)據(jù)的皮爾遜相關系數(shù)的計算過程12.1.2用決策樹審核交通事故是否理賠其中“col_1”是預測結(jié)果,0表示理賠,1表示不理賠,“CaseId”是其Id。例如第一行,表示CaseId是4的事故,預測結(jié)果是1,表示對該事故需要理賠。(注意:因為訓練集和測試機抽樣每次調(diào)試結(jié)果都會發(fā)生變動,算法的訓練集比例咱們設置的70%,以及算法中使用了大量的概率時間所以,每次調(diào)試結(jié)果都會發(fā)生變化,且查看器面板最多只能顯示100調(diào)記錄)在本實驗中,我們學習了用抽樣節(jié)點把數(shù)據(jù)分隔成訓練數(shù)據(jù)集和測試數(shù)據(jù)集的方法,利用訓練數(shù)據(jù)集訓練了一個決策樹分類模型,然后引用該模型在測試數(shù)據(jù)集上進行測試2.電商平臺數(shù)據(jù)分析1.1電商平臺數(shù)據(jù)分析1.1.1母嬰電商數(shù)據(jù)分析可視化:各區(qū)網(wǎng)點數(shù)量填充地圖銷量矩形塊類型銷量折線圖按性別統(tǒng)計銷量按年齡統(tǒng)計銷量1.1.2電商用戶行為分析可視化:PVUV趨勢圖PVUV變化圖隱藏PV_change指標可以看到2014年12月12號前后PV和UV變化值較大,這里是受到雙12活動的影響PVUV雷達圖不同日期用戶行為折線圖轉(zhuǎn)化漏斗圖不同時間用戶行為散點圖四、問題討論及實驗心得實驗心得:在進行大數(shù)據(jù)理論基礎與應用實戰(zhàn)的學習過程中,主要出現(xiàn)以下幾種問題:首先,由于不熟悉工作面板,導致跟著老師一步步操作時會有點手忙腳亂,不過好在老師講課仔細,雖然有些慌亂但還是勉強跟上了步伐。但是一旦遇到運行不了的情況,進度就會停滯不前,也不清楚錯在了哪一步。第二,在進行數(shù)據(jù)轉(zhuǎn)換器Choice等的條件設置中,總是會因為中英文標點符號切換錯誤導致最后編譯失敗。第三,在最后創(chuàng)建量化、轉(zhuǎn)換節(jié)點的時候,總是會忘記創(chuàng)建落地對象導致編譯失敗。第四,在數(shù)據(jù)轉(zhuǎn)換面板進行predict模型選擇時,常常因為模型選擇錯誤只能刪除重新添加算法,出現(xiàn)忽視后續(xù)工作流節(jié)點的目標列與源列連接,導致后續(xù)操作出現(xiàn)沒有列連接的情況而報錯。在學習電子商務大數(shù)據(jù)時,主要出現(xiàn)兩種問題。首先,由于電子商務大數(shù)據(jù)涉及的可視化內(nèi)容較多,操作比理論基礎稍微復雜一點。其次,電子商務大數(shù)據(jù)運行的數(shù)據(jù)量較大,導致運行調(diào)試耗時長,跟不上老師進度,更容易出錯。在這為期4天的大數(shù)據(jù)學習中,我們了解到了一些初級的關于大數(shù)據(jù)操作應用的知識,認識到了大數(shù)據(jù)對于企業(yè)經(jīng)營的便捷性與重要性。雖然在這過程中,我們遭遇到了許多錯誤與挫折,但是通過與老師同學之間的不斷溝通交流,問題也得到一一解決。當我在運行中遇到錯誤時,通過老師的指點,我學會了在錯誤節(jié)點設置目的地和創(chuàng)建異常工作流節(jié)點,再通過運行往前逐步推測出問題所在,并重新設置該項工作流節(jié)點。通過自己不斷
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024-2025學年初中九年級數(shù)學上冊期中測試卷及答案(人教版)
- 高中語文第3單元探索與發(fā)現(xiàn)8中國建筑的特征課件新人教版必修下冊
- 建筑結(jié)構鋼筋砼排架結(jié)構單層廠房
- 地下車庫后澆帶施工方案
- 黃帝陵講解指南
- 健康教育麻風病防治知識教案
- 高中物理第二章勻變速直線運動的研究6伽利略對自由落體運動的研究課件新人教版必修
- 2024至2030年中國免燙防皺襯衣行業(yè)投資前景及策略咨詢研究報告
- 2024年中國鈷高速鋼直柄加長麻花鉆市場調(diào)查研究報告
- 2024年中國電動工具零件市場調(diào)查研究報告
- HJ24-2020環(huán)境影響評價技術導則輸變電
- 2024-2030年熊膽粉產(chǎn)業(yè)市場深度調(diào)研及發(fā)展趨勢與投資前景預測研究分析報告
- 可靠性教材工程師模擬考試(4)附有答案
- 人教版2024年新版七年級上冊英語Starter Units 1-3綜合測試卷(含答案)
- 社交禮儀-儀態(tài)禮儀
- 北師大版小學數(shù)學三年級上冊第二單元《觀察物體》大單元教學設計
- 2020新青島版(六三制)四年級上冊科學課件(全冊).p
- 上海市2023-2024學年高一歷史上學期期中試題含解析
- JT-T-1116-2017公路鐵路并行路段設計技術規(guī)范
- 新聞記者采編報導人員崗位從業(yè)資格考試題含答案
- 腦血管供血不足患者的護理查房
評論
0/150
提交評論