版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、R語言商務數(shù)據(jù)分析實戰(zhàn)教學大綱課程名稱:R語言商務數(shù)據(jù)分析實戰(zhàn)課程類別:必修適用專業(yè):大數(shù)據(jù)技術(shù)類相關(guān)專業(yè)總學時:80學時(苴中理論45學時,實驗35學時)總學分:5.0學分一、課程的性質(zhì)大數(shù)拯時代已經(jīng)到來,在商業(yè)、經(jīng)濟及苴他領(lǐng)域中基于數(shù)據(jù)和分析去發(fā)現(xiàn)問題并做岀科 學、客觀的決策越來越重要。數(shù)據(jù)分析技術(shù)將幫助企業(yè)用戶在合理時間內(nèi)獲取、管理、處理 以及整理海量數(shù)據(jù),為企業(yè)經(jīng)營決策提供積極的幫助。有實踐經(jīng)驗的數(shù)據(jù)分析人才已經(jīng)成為 了各企業(yè)爭奪的熱門。為了推動我國大數(shù)據(jù),云計算,人工智能行業(yè)的發(fā)展,滿足日益增長 的數(shù)據(jù)分析人才需求,特開設R語言商務數(shù)據(jù)分析實戰(zhàn)課程。二、課程的任務通過本課程的學習,使
2、學生學會分析案例的流程,使用R語言實現(xiàn)流程的每一個步驟, 包括數(shù)據(jù)合并、數(shù)據(jù)淸洗、數(shù)據(jù)變換、模型構(gòu)建、模型評價等,掌握APrlon算法、K-MeaaS 算法、灰色預測算法、SVR算法、GBM算法、協(xié)同過濾算法的應用,以及ARIMA模型和 LDA模型的應用。將理論與實踐相結(jié)合,為將來從事數(shù)據(jù)分析挖掘研究、工作奠左基礎。三、課程學時分配序號教學內(nèi)容理論學時實驗學時其它1第1章R語言數(shù)據(jù)分析概述22第2章商品零售購物籃分析323第3章航空公司客戶價值分析434第4章財政收入預測分析435第5章金融服務機構(gòu)資金流量預測536第6章P2P信用貸款風險控制547第7章電子商務網(wǎng)站智能推薦服務658第8章電
3、商產(chǎn)品評論數(shù)拯情感分析659第9章餐飲企業(yè)綜合分析1010總汁4535四、教學內(nèi)容及學時安排1.理論教學序 號章節(jié)名稱主要內(nèi)容教學目標學時1R語言數(shù)據(jù)分 析槪述1掌握數(shù)據(jù)分析的槪念2. 掌握數(shù)據(jù)分析的流程3. 了解數(shù)據(jù)分析的應用場景4. 了解數(shù)據(jù)分析的常用工具5. 了解R語言在數(shù)據(jù)分析中的優(yōu)勢6. 了解R語言數(shù)據(jù)分析中常用的PaCkageS1. 掌握數(shù)據(jù)分析的 概念、流程與應用場 景2. 了解R語言數(shù)據(jù) 分析中常用的 PaCkageS22商品零售購物 籃分析1. 分析零售企業(yè)商品銷售現(xiàn)狀2. 了解某商品零售企業(yè)的基本數(shù)據(jù)情 況3. 熟悉購物籃分析的基本流程與步驟4. 使用統(tǒng)計學知識分析熱銷商品
4、5. 使用商品結(jié)構(gòu)圖分析售出商品的結(jié) 構(gòu)6. 了解APnOn算法的基本原理與使用 方法7. 構(gòu)建零售商品的APnOrI模型8. 根據(jù)模型結(jié)果提出商品銷售策略1. 熟悉購物籃分析 的實現(xiàn)流程與步驟2. 掌握APriOri算法 的基本原理與使用 方法3. 分析商品銷售狀 況與商品結(jié)構(gòu)合理 性4分析零售商品間 的關(guān)聯(lián)關(guān)系33航空公司客戶 價值分析1. 了解航空公司現(xiàn)狀與客戶價值分析2. 熟悉航空公司客戶價值分析的步驟 與流程3. 處理數(shù)據(jù)的缺失值與異常值4. 結(jié)合RFM模型構(gòu)建關(guān)鍵特征5. 標準化構(gòu)建關(guān)鍵特征后的數(shù)據(jù)6. 了解K-MeanS算法基本原理7. 使用K-MeallS算法對航空客戶進行 分
5、群8. 根據(jù)分群結(jié)果制迫營銷策略1熟悉航空公司客 H價值分析的步驟 與流程2. 了解RFM模型的 基本原理,以及 K-MeaaS算法的基 本原理3. 構(gòu)建航空客戶價 值分析的關(guān)鍵特征4. 比較不同類別客 戶的客戶價值,制泄 相應的營銷策略44財政收入預測 分析1. 分析財政收入預測背景2. 了解財政收入預測的方法3. 熟悉財政收入預測的步驟與流程4. 了解相關(guān)性分析5. 分析計算結(jié)果6. 了解LaSSO回歸方法7. 分析LaSSo回歸結(jié)果& 了解灰色預測算法9. 了解SVR算法10. 分析預測結(jié)果1熟悉財政收入預 測的步驟和流程2. 掌握相關(guān)性分析 方法與應用3. 掌握使用LaSSO模
6、 型選取特征的方法4. 掌握灰色預測的 原理與應用5. 掌握SVR算法的 基本原理與應用45金融服務機構(gòu) 資金流量預測1. 分析金融服務機構(gòu)現(xiàn)狀與數(shù)據(jù)的基 本情況2. 認識資金流量預測3. 熟悉金融服務機構(gòu)資金流量預測的 步驟與流程4. 對數(shù)據(jù)進行平穩(wěn)性檢驗和處理5. 了解純隨機性檢驗的原理6. 對通過平穩(wěn)性檢驗的數(shù)據(jù)進行純隨 機性檢驗7. 了解ARIMA模型的原理8. 了解泄階的方式,并識別模型的階 數(shù)9. 建立ARIMA模型,并計算誤差與得分1. 熟悉金融服務機 構(gòu)資金流量預測的 步驟與流程2. 掌握數(shù)據(jù)平穩(wěn)性 檢驗和處理方法,以 及純隨機性檢驗3使用ARIMA模型 對資金流量進行預 測5
7、6P2P信用貸款 風險控制1. 分析P2P信貸行業(yè)所面臨的現(xiàn)狀與 困擾2. 了解某P2P信貸平臺現(xiàn)階段數(shù)據(jù)情 況3. 熟悉P2P信貸用戸逾期預測的基本 流程與步驟4. 分析用戶信息完善程度、用戶信息 修改情況、區(qū)域經(jīng)濟發(fā)展情況、借款月 份情況分別與逾期率之間的關(guān)系5. 使用第三方平臺信息構(gòu)建特征6. 對登錄信息表和更新信息表進行長 寬表轉(zhuǎn)換7. 處理類別型特征,插補數(shù)值型特征 缺失值與篩選冗余特征& 了解GBM算法的基本原理,優(yōu)缺 點,使用場景與R語言函數(shù)9. 使用ROC曲線評價構(gòu)建完成的 GBM模型10. 分析構(gòu)建的GBM模型的汁算結(jié)果1熟悉用戶逾期預 測的步驟與流程2. 掌握結(jié)構(gòu)化
8、數(shù)據(jù) 探索,并提取苴中有 效信息的方法與步 驟3. 掌握常見數(shù)據(jù)預 處理方法4. 熟悉GBM模型構(gòu) 建與參數(shù)調(diào)節(jié)方法5找岀影響用戶逾 期還款的關(guān)鍵因素6使用GBM算法預 測用戶逾期還款的 概率57電子商務網(wǎng)站 智能推薦服務1. 了解智能推薦服務的應用場景2. 了解某法律網(wǎng)站現(xiàn)狀與數(shù)據(jù)的基本 情況3. 掌握分析目標以及智能推薦的步驟 與流程4. 對原始數(shù)據(jù)按條件查詢,并提取數(shù) 據(jù)5. 分析原始數(shù)據(jù)用戶點擊的網(wǎng)頁類 型,得到統(tǒng)計分析結(jié)果6. 根據(jù)原始數(shù)據(jù)用戶瀏覽網(wǎng)頁次數(shù)的 情況進行統(tǒng)計分析7. 通過原始數(shù)據(jù)用戶在瀏覽頁面時的 情況得到網(wǎng)頁排劃的統(tǒng)訃分析&清除數(shù)據(jù)探索分析過程中發(fā)現(xiàn)與目 標無
9、關(guān)的數(shù)據(jù)9. 識別翻頁的網(wǎng)址,并對其進行還原, 然后對用戶訪問的頁而進行去重操作10. 將數(shù)拯探索過程中類型歸錯的數(shù) 據(jù)進行手動網(wǎng)址分類,對處理后的數(shù)據(jù) 進行特征選取11. 基于物品的協(xié)同過濾算法,計算出 物品之間的相似度12. 根據(jù)物品的相似度和用戶的歷史 行為給用戶生成推薦列表13. 對模型進行評價,判斷推薦系統(tǒng)的 好壞1. 熟悉網(wǎng)站智能推 薦的步驟與流程2. 掌握簡單的統(tǒng)汁 分析方法,運用于網(wǎng) 頁流量的統(tǒng)計3對某網(wǎng)站數(shù)據(jù)進 行預處理,包括數(shù)據(jù) 去重、數(shù)據(jù)變換和特 征選取4.使用協(xié)同過濾算 法對某網(wǎng)站進行智 能推薦68電商產(chǎn)品評論 數(shù)據(jù)情感分析1. 了解電商企業(yè)現(xiàn)狀2. 熟悉電商評論數(shù)據(jù)情
10、感分析的步驟 與基本流程3. 了解網(wǎng)絡上發(fā)布內(nèi)容的技術(shù)和Web 文檔中提取信息的技術(shù),以獲取網(wǎng)絡數(shù) 據(jù)4. 掌握獲取評論數(shù)據(jù)的方法5. 去除評論數(shù)據(jù)的數(shù)字、字母6. 對評論數(shù)據(jù)進行去重7. 對評論數(shù)據(jù)進行分詞處理8. 根據(jù)停用詞庫去除評論文本中的停 用詞9. 繪制詞云圖,查看分詞效果10. 基于情感詞表進行情感詞匹配11. 對情感詞的傾向進行修正12. 對情感分析結(jié)果進行檢驗13. 了解主題模型,以及LDA模型原 理與參數(shù)估計方法14. 掌握尋找最優(yōu)主題數(shù)的方法15. 建立相應的LDA模型16. 輸入正而情感與負面情感評論求 解LDA模型,并分析結(jié)果1. 熟悉電商產(chǎn)品評 論數(shù)據(jù)實現(xiàn)情感分 析的
11、步驟與流程2. 了解如何使用R 語言對互聯(lián)網(wǎng)信息 進行爬取3. 掌握文本分析的 預處理方法4對預處理后的評 論數(shù)據(jù)進行情感分 析5使用LDA模型對 正、負而評論數(shù)據(jù)進 行主題分析69餐飲企業(yè)綜合 分析1. 了解餐飲企業(yè)的數(shù)據(jù)情況2. 明確餐飲企業(yè)數(shù)據(jù)分析的流程3. 使用分組聚合和透視表這兩種方法 統(tǒng)計每日用餐人數(shù)與銷售額4. 計算一個月內(nèi)的菜品熱銷度,并對 熱銷度進行Mm-MaX標準化處理5. 計算每個菜品的毛利率6. 繪制原序列的時序圖,査看序列周 期性7. 檢驗原序列的平穩(wěn)性和純隨機性8. 使用BIC圖進行定階9. 構(gòu)建ARlMA模型,并分析預測結(jié)果10. 根據(jù)訂單詳情表,構(gòu)建客戶ID和
12、菜品名稱的二元矩陣H.基于物品的協(xié)同過濾算法,計算菜 品與菜品之間的相似度,并結(jié)合客戶的 歷史行為給目標客戶生成推薦列表12. 基于用戶的協(xié)同過濾算法,計算客 戶與客戶之間的相似度,并結(jié)合客戶對 菜品的興趣給目標客戶生成推薦列表13. 對推薦結(jié)果進行評價14. 根據(jù)特征選取后的數(shù)據(jù),構(gòu)建購物 籃數(shù)據(jù),然后構(gòu)建二元矩陣,及關(guān)聯(lián)規(guī) 則模型15. 根據(jù)關(guān)聯(lián)規(guī)則模型的置信度,統(tǒng)訃 得到的熱銷度和毛利率,及菜品詳情表 的主推度,計算推薦的綜合評分16. 對原始數(shù)據(jù)進行處理,提取餐飲客 戶的3個特征數(shù)據(jù)17. 使用K-MeailS聚類算法對客戶進行 分群結(jié)合業(yè)務對每個客戶群進行客戶 價值分析19. 合并客
13、戶信息表和訂單表,構(gòu)建相 關(guān)客戶流失特征20. 劃分訓練集和測試集,構(gòu)建決策樹 模型21. 分析決策樹模型的結(jié)果1. 熟悉餐飲企業(yè)數(shù) 據(jù)分析的步驟與流 程2. 了解簡單的統(tǒng)計 分析的應用3. 使用ARIMA預測 銷售額4使用協(xié)同過濾算 法對菜品進行智能 推薦5. 使用APnOn算法 對菜品進行關(guān)聯(lián)分 析6. 使用 K-MealIS 算 法進行客戶分群7. 使用決策樹算法 進行客戶流失預測10學時合計452 實驗教學序號實驗項目名稱實驗要求學時1商品零售購物 籃分析統(tǒng)計每種商品的頻數(shù)、占比:對商品歸類,統(tǒng)計每種類 別的頻數(shù),并類別內(nèi)部商品的分布;使用apo函數(shù)進 行關(guān)聯(lián)分析22航空公司客戶 價值
14、分析使用刪除法對缺失值與異常值進行處理:構(gòu)建LRFMC五 個特征,并進行標準化處理;用K-MeanS聚類算法對客 戶數(shù)據(jù)進行客戶分群,聚成五類33財政收入預測 分析分析財政收入數(shù)據(jù)特征的相關(guān)性;使用LaSSO回歸選取財政收入預測的關(guān)鍵特征:分別使用灰色預測和SVR構(gòu)建財政收入預測模型:評價SVR模型34金融服務機構(gòu) 資金流量預測對數(shù)據(jù)進行平穩(wěn)性檢驗和處理:對處理后的平穩(wěn)序列進 行純隨機性檢驗;對處理后的平穩(wěn)序列進行模型泄階; 對模型進行殘差檢驗,并評估模型;擬合相對最優(yōu)模型35P2P信用貸款風 險控制畫圖分別展示用戶信息完善程度、用戶信息修改情況、 區(qū)域經(jīng)濟發(fā)展情況、借款月份情況分別與逾期率的
15、分布: 分別求取每位用戶對應編號的最大值、最小值、中位數(shù)、 標準差:對登錄信息表與更新信息表進行長寬表轉(zhuǎn)換: 針對類別型特征進行字符串處理和啞變量處理:處理數(shù) 值型數(shù)據(jù)的缺失值:篩選冗余特征;構(gòu)建GBM模型,并 繪制特征重要性圖:評價GBM模型46電子商務網(wǎng)站 智能推薦服務使用RMySQL包中的dbConnect連接數(shù)據(jù)庫:統(tǒng)計101、 107和199等網(wǎng)頁類型;統(tǒng)計用戶在網(wǎng)頁的點擊次數(shù);分 析網(wǎng)頁排名;刪除不符合規(guī)則的網(wǎng)頁:還原翻頁網(wǎng)址: 劃分正確的網(wǎng)頁類型:將處理后的數(shù)據(jù)轉(zhuǎn)換成0-1二元型 數(shù)據(jù);構(gòu)建智能推薦模型;評價智能推薦模型57電商產(chǎn)品評論 數(shù)據(jù)情感分析獲取評論頁而頁而網(wǎng)頁源碼:解析
16、JSON數(shù)據(jù):循環(huán)爬取 評論數(shù)據(jù):去重完全重復的評論:淸洗數(shù)據(jù):對評論數(shù) 據(jù)進行分詞,并進行詞性標注、去除停用詞;提取含劃 詞的評論數(shù)據(jù);繪制詞云,查看分詞效果:將情感詞表5與分詞結(jié)果進行匹配;對情感值的方向進行修正,并計 算情感分析的準確率;分別對正而評論和負面評論繪制 詞云,査看情感分析效果;對正面情感詞與負而情感詞 構(gòu)建語料庫,并建立文檔-詞條矩陣;使用LDA主題模型, 找岀不同主題數(shù)下的主題詞,尋找最優(yōu)主題數(shù):進行LDA 主題分析8餐飲企業(yè)綜合 分析統(tǒng)計每日用餐人數(shù)和銷售額,計算菜品熱銷度和毛利率: 對原序列進行平穩(wěn)性檢驗和純隨機性檢驗,對ARIMA模 型進行宦階,并進行殘差檢驗,計算平均誤差:對訂單 表和訂單詳情表進行特征選取,分別使用ItemCF算法和 USerCF算法構(gòu)建模型,進行離線測試評價:基于特征選 取后的數(shù)據(jù)構(gòu)建購物籃數(shù)拯,構(gòu)建APriOri模型,計算綜 合評分:再構(gòu)建客戶價值分析的關(guān)鍵
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 不能玩火教案反思
- 海島冰輪初轉(zhuǎn)騰說課稿
- 農(nóng)忙季節(jié)臨時幫工合同
- 通信設備公司人才引進合同樣板
- 車輛報廢回收企業(yè)管理辦法
- 通信工程配電房建設協(xié)議
- 人力資源服務審批指南
- 網(wǎng)絡應急演練
- 設備買賣合同簽訂預付款政策
- 肌腱斷裂術(shù)后護理及功能鍛煉
- 2024-2030年中國肉牛養(yǎng)殖產(chǎn)業(yè)前景預測及投資效益分析報告權(quán)威版
- 河北省石家莊市長安區(qū)2023-2024學年五年級上學期期中英語試卷
- 品牌經(jīng)理招聘筆試題及解答(某大型國企)2025年
- 多能互補規(guī)劃
- 珍愛生命主題班會
- 《網(wǎng)絡數(shù)據(jù)安全管理條例》課件
- 消除“艾梅乙”醫(yī)療歧視-從我做起
- 天一大聯(lián)考●皖豫名校聯(lián)盟2024-2025學年高三上學期10月月考試卷語文答案
- GB/T 44291-2024農(nóng)村產(chǎn)權(quán)流轉(zhuǎn)交易 網(wǎng)絡交易平臺服務規(guī)范
- 八年級歷史上冊(部編版)第六單元中華民族的抗日戰(zhàn)爭(大單元教學設計)
- 全國農(nóng)業(yè)技術(shù)推廣服務中心公開招聘應屆畢業(yè)生補充(北京)高頻難、易錯點500題模擬試題附帶答案詳解
評論
0/150
提交評論