![基于機(jī)器學(xué)習(xí)對銷量預(yù)測研究_第1頁](http://file3.renrendoc.com/fileroot_temp3/2022-1/15/62bb567a-7ec2-4d7f-a469-871f5e806a6c/62bb567a-7ec2-4d7f-a469-871f5e806a6c1.gif)
![基于機(jī)器學(xué)習(xí)對銷量預(yù)測研究_第2頁](http://file3.renrendoc.com/fileroot_temp3/2022-1/15/62bb567a-7ec2-4d7f-a469-871f5e806a6c/62bb567a-7ec2-4d7f-a469-871f5e806a6c2.gif)
![基于機(jī)器學(xué)習(xí)對銷量預(yù)測研究_第3頁](http://file3.renrendoc.com/fileroot_temp3/2022-1/15/62bb567a-7ec2-4d7f-a469-871f5e806a6c/62bb567a-7ec2-4d7f-a469-871f5e806a6c3.gif)
![基于機(jī)器學(xué)習(xí)對銷量預(yù)測研究_第4頁](http://file3.renrendoc.com/fileroot_temp3/2022-1/15/62bb567a-7ec2-4d7f-a469-871f5e806a6c/62bb567a-7ec2-4d7f-a469-871f5e806a6c4.gif)
![基于機(jī)器學(xué)習(xí)對銷量預(yù)測研究_第5頁](http://file3.renrendoc.com/fileroot_temp3/2022-1/15/62bb567a-7ec2-4d7f-a469-871f5e806a6c/62bb567a-7ec2-4d7f-a469-871f5e806a6c5.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、基于機(jī)器學(xué)習(xí)方法對銷售預(yù)測的研究銷售預(yù)測現(xiàn)狀與痛點(diǎn)銷售預(yù)測現(xiàn)狀與痛點(diǎn)CONTENTS0102 銷售預(yù)測四大步驟銷售預(yù)測四大步驟03 銷售預(yù)測基本方法銷售預(yù)測基本方法04 銷售預(yù)測效果評估方法與指標(biāo)銷售預(yù)測效果評估方法與指標(biāo)05 某電商網(wǎng)站銷售預(yù)測案例分享某電商網(wǎng)站銷售預(yù)測案例分享銷售預(yù)測全景圖銷售預(yù)測全景圖供貨鏈條供貨鏈條送貨時間、送貨地點(diǎn)、是否包郵等物流物流市場營銷市場營銷促銷方案促銷方案商品減價(jià)、商品促銷、組合銷售等生成和采購生成和采購合理安排生成和采購的時間節(jié)點(diǎn),優(yōu)化庫存庫存庫存財(cái)務(wù)財(cái)務(wù)管理管理財(cái)務(wù)和會計(jì)財(cái)務(wù)和會計(jì)實(shí)時反饋公司財(cái)務(wù)報(bào)表,監(jiān)控公司資金流動管理銷售預(yù)測的現(xiàn)狀與痛點(diǎn)銷售預(yù)測的現(xiàn)
2、狀與痛點(diǎn)銷售預(yù)測是完善客戶需求管理、指導(dǎo)運(yùn)營、以提高企業(yè)利潤為最終目的商業(yè)問題。而預(yù)測的精確性預(yù)測的精確性是銷售預(yù)測的核心痛點(diǎn)。銷售預(yù)測的痛點(diǎn)銷售預(yù)測的痛點(diǎn)商業(yè)環(huán)境因素眾多,變化極快,難以及時把握和分析供應(yīng)鏈整體水平低,導(dǎo)致貨物積壓嚴(yán)重產(chǎn)品定價(jià)、商品服務(wù)的單一性,導(dǎo)致企業(yè)競爭力小變化模式變化模式預(yù)測的基本思想預(yù)測的基本思想預(yù)測是通過歷史數(shù)據(jù)或其他外部因素構(gòu)建模型、學(xué)習(xí)其變化“模式”,利用該“模式”對未來事物進(jìn)行預(yù)測的一個過程。特點(diǎn)特點(diǎn):短期預(yù)測的精度要遠(yuǎn)遠(yuǎn)高于長期預(yù)測。業(yè)務(wù)理論業(yè)務(wù)理論數(shù)據(jù)量數(shù)據(jù)量假設(shè)銷售預(yù)測體系框架銷售預(yù)測現(xiàn)狀與痛點(diǎn)銷售預(yù)測現(xiàn)狀與痛點(diǎn)CONTENTS0102 銷售預(yù)測四大步驟
3、銷售預(yù)測四大步驟03 銷售預(yù)測基本方法銷售預(yù)測基本方法04 銷售預(yù)測效果評估方法與指標(biāo)銷售預(yù)測效果評估方法與指標(biāo)05 某電商網(wǎng)站銷售預(yù)測案例分享某電商網(wǎng)站銷售預(yù)測案例分享收集數(shù)據(jù)收集數(shù)據(jù)確定預(yù)測對象、預(yù)測目標(biāo)和需求;預(yù)測周期:短、中和長期需求與預(yù)測精度的權(quán)衡準(zhǔn)確性與可解釋性的權(quán)衡預(yù)測目標(biāo)預(yù)測目標(biāo)收集數(shù)據(jù)、整理指標(biāo)體系數(shù)據(jù)描述與數(shù)據(jù)探索數(shù)據(jù)預(yù)處理評價(jià)指標(biāo)評價(jià)指標(biāo)算法的選擇模型的訓(xùn)練與預(yù)測過擬合問題的處理建立建模建立建模RMSE、MAPE等定量評價(jià)指標(biāo)AIC、BIC等模型評價(jià)指標(biāo)需求探索開發(fā)完善預(yù)測的基本步驟預(yù)測的基本步驟預(yù)測目標(biāo)預(yù)測目標(biāo)預(yù)測對象:預(yù)測對象:性質(zhì)、結(jié)構(gòu)、業(yè)務(wù)場景等預(yù)測時間:預(yù)測時間
4、:短期預(yù)測、中期預(yù)測和長期預(yù)測等精確性可解釋性時間數(shù)據(jù)量少于5天大于4周或1個月短期預(yù)測短期預(yù)測長期預(yù)測中期預(yù)測介于兩者之間業(yè)務(wù)目標(biāo):業(yè)務(wù)目標(biāo):準(zhǔn)確性和模型可解釋性的匹配度數(shù)據(jù)探索對數(shù)據(jù)檢查和理解:比如庫存量為負(fù)值、星期數(shù)大于8等對結(jié)果變量的分析:包括分布、趨勢性、周期性等對預(yù)測變量的分析:包括變量篩選、多重共線性、相關(guān)性數(shù)據(jù)預(yù)處理中心化和標(biāo)準(zhǔn)化缺失值處理:鄰近插補(bǔ)、多重插補(bǔ)、線性插補(bǔ)等數(shù)據(jù)轉(zhuǎn)換:取對數(shù)、Box-Cox變換離群點(diǎn)處理數(shù)據(jù)降維和特征選擇:PCA、AIC/BIC等收集數(shù)據(jù)或理解數(shù)據(jù)收集數(shù)據(jù)或理解數(shù)據(jù)數(shù)據(jù)搜集目標(biāo)數(shù)據(jù)(內(nèi)部數(shù)據(jù)、外部數(shù)據(jù))額外數(shù)據(jù):天氣、經(jīng)緯度、節(jié)假日、CPI指數(shù)等時
5、期變量2015-05-2310.02015-05-2410.02016-05-099.82016-05-109.8時期變量2015-05-23NA2015-05-2410.02016-05-099.82016-05-10NA處理之前處理之后收集數(shù)據(jù)或理解數(shù)據(jù)收集數(shù)據(jù)或理解數(shù)據(jù)數(shù)據(jù)預(yù)處理的缺失值部分?jǐn)?shù)據(jù)預(yù)處理的缺失值部分處理缺失值的兩大類方法:(1) 直接刪除缺失的預(yù)測變量(2) 利用不同的方法對預(yù)測變量的缺失值進(jìn)行插補(bǔ),插補(bǔ)方法有:均值插補(bǔ)、多重插補(bǔ)、隨機(jī)插補(bǔ)、K近鄰插補(bǔ)、線性插補(bǔ)等。注意:一般對于帶有時間戳的時序變量,考慮到變量的時效性和經(jīng)濟(jì)因素,通常采用鄰近插補(bǔ)法或者線性插補(bǔ)。一個需要進(jìn)行
6、數(shù)據(jù)變換的原因是去除分布的偏度。一個無偏分布是大致對稱的分布,這意味著隨機(jī)變量落入分布均值兩側(cè)的概率大體一致。數(shù)據(jù)變換一般有兩種方法:(1) 對數(shù)據(jù)做變換,如取對數(shù)、平方根或倒數(shù)(2) Box-Cox變換收集數(shù)據(jù)或理解數(shù)據(jù)收集數(shù)據(jù)或理解數(shù)據(jù)數(shù)據(jù)預(yù)處理的數(shù)據(jù)變換部分?jǐn)?shù)據(jù)預(yù)處理的數(shù)據(jù)變換部分銷售預(yù)測現(xiàn)狀與痛點(diǎn)銷售預(yù)測現(xiàn)狀與痛點(diǎn)CONTENTS0102 銷售預(yù)測四大步驟銷售預(yù)測四大步驟03 銷售預(yù)測基本方法銷售預(yù)測基本方法04 銷售預(yù)測效果評估方法與指標(biāo)銷售預(yù)測效果評估方法與指標(biāo)05 某電商網(wǎng)站銷售預(yù)測案例分享某電商網(wǎng)站銷售預(yù)測案例分享主觀預(yù)測專家法時間序列指數(shù)平滑法自回歸移動模型銷售預(yù)測的基本方法
7、銷售預(yù)測的基本方法機(jī)器學(xué)習(xí)線性回歸決策樹隨機(jī)森林xgboost神經(jīng)網(wǎng)絡(luò)支持向量回歸時間銷量銷量時間根據(jù)過去經(jīng)驗(yàn)經(jīng)驗(yàn)專家法專家法專家預(yù)測法: 由專家根據(jù)他們的經(jīng)驗(yàn)和判斷能力對待定產(chǎn)品的未來銷售進(jìn)行判斷和預(yù)測,通常有三種不同的形式:(1)個別專家意見匯集法(2)專家小組法(3)德爾菲法優(yōu)點(diǎn): 簡單、快速缺點(diǎn): 準(zhǔn)確率低、受人的主觀影響大指數(shù)平滑遵循“重近輕遠(yuǎn)”原則,對全部歷史數(shù)據(jù)采用逐步衰減的不等加權(quán)辦法進(jìn)行數(shù)據(jù)處理的一種預(yù)測方法?;竟剑?1 = + (1 )1其中,是時間的時間值;是平滑常數(shù),其取值范圍為0, 1。優(yōu)點(diǎn):簡單、適合趨勢預(yù)測、模糊預(yù)測缺點(diǎn): 準(zhǔn)確率不高、需要趨勢性較好的數(shù)據(jù)指數(shù)
8、平滑法指數(shù)平滑法ARIMA模型是指將非平穩(wěn)時間序列轉(zhuǎn)化為平穩(wěn)時間序列,然后將結(jié)果變量做自回歸(AR)和自平移(MA)。自回歸移動模型(自回歸移動模型(ARIMA)訓(xùn)練集測試集機(jī)器學(xué)習(xí)算法模型參數(shù)模型評估特征篩選預(yù)測Y值真實(shí)Y值YX樣本數(shù)據(jù)銷售量影響銷售量的因素機(jī)器學(xué)習(xí)的實(shí)現(xiàn)流程機(jī)器學(xué)習(xí)的實(shí)現(xiàn)流程使用機(jī)器學(xué)習(xí)的有監(jiān)督學(xué)習(xí)對進(jìn)行銷量變化進(jìn)行建模,依據(jù)建模結(jié)果來預(yù)測未來銷量值。其實(shí)現(xiàn)流程如下:(X,Y)(4) 模型選擇,如隨機(jī)森林、LASSO等模型輸出x3x4x2x4x1x6x5x3x1x6x5特征篩選特征篩選特征篩選是一類預(yù)測變量變換的方法,通過這種方式,能夠用更具有信息量的變量來構(gòu)建模型,排除無
9、信息量的變量的噪聲干擾,提高模型穩(wěn)健性。常用的特征篩選方法:(1) 相關(guān)性等統(tǒng)計(jì) 閾值過濾(2) 信息增益、信息增益率、基尼系數(shù)等 閾值過濾(3) 向前、向后和逐步選擇法,如AIC/BIC準(zhǔn)則 最小值原理簡介:原理簡介:通過結(jié)果變量與預(yù)測變量直接建立線性關(guān)系數(shù)值型回歸優(yōu)點(diǎn):優(yōu)點(diǎn):模型可解釋性強(qiáng)線性回歸模型:廣義線性模型線性回歸模型:廣義線性模型線性模型隨機(jī)分布指數(shù)分布、泊松分布等線性回歸 = 0 + 1 1 + 2 2 + + Y為銷量值,X為預(yù)測變量,N為預(yù)測變量個數(shù),為參數(shù)激活函數(shù)激活函數(shù):sigmod, log函數(shù)等缺點(diǎn):缺點(diǎn): 只適用于線性規(guī)律邏輯回歸邏輯回歸原理簡介:原理簡介:通過訓(xùn)
10、練數(shù)據(jù),形成if-then規(guī)則集合由根節(jié)點(diǎn)到葉節(jié)點(diǎn)的每一條路徑構(gòu)成規(guī)則對結(jié)果變量有主要解釋作用的特征會先分裂形成規(guī)則回歸樹用平方誤差最小化準(zhǔn)則,節(jié)結(jié)點(diǎn)為單元內(nèi)數(shù)值的平均值優(yōu)點(diǎn):優(yōu)點(diǎn): 可擬合非線性規(guī)律,計(jì)算復(fù)雜度較低缺點(diǎn):缺點(diǎn):容易出現(xiàn)過擬合決策樹(回歸樹)決策樹(回歸樹)妹紙?jiān)u分:0,10五官端正五官端正是否身材身材好是否有錢是否有錢是9否53不好7隨機(jī)森林隨機(jī)森林原理簡介:原理簡介: 是包含多個回歸樹的組合器 輸出的數(shù)值是由個別樹輸出的數(shù)值的平均而定優(yōu)點(diǎn):優(yōu)點(diǎn): 準(zhǔn)確度高 訓(xùn)練速度快 容易做出并行算法 可處理大量變量并評估變量重要性缺點(diǎn):缺點(diǎn): 在噪聲較大的數(shù)據(jù)上會有過擬合問題xgboos
11、txgboost + 2 xgboost目標(biāo)函數(shù)去掉常數(shù)項(xiàng):() =112+ ( )找到那顆樹 ,使得目標(biāo)函數(shù)達(dá)到最優(yōu)即可。原理簡介:原理簡介: 是基于傳統(tǒng)的GBDT上做了一些優(yōu)化的開源工具包,目前有python,R,Java版。優(yōu)點(diǎn):優(yōu)點(diǎn): 高速準(zhǔn)確 可移植,可以自己定義假設(shè)函數(shù) 可容錯神經(jīng)網(wǎng)絡(luò)神經(jīng)網(wǎng)絡(luò) = f(X)(非線性映射)原理簡介:原理簡介: 是利用一系列非線性回歸,將預(yù)測變量映射到結(jié)果變量的一種方法。優(yōu)點(diǎn):優(yōu)點(diǎn): 準(zhǔn)確度高 訓(xùn)練速度快 并行處理能力強(qiáng)缺點(diǎn):缺點(diǎn): 需要大量的參數(shù) 不能觀察學(xué)習(xí)的過程,對結(jié)果難以解釋支持向量回歸(支持向量回歸(SVR)原理簡介:原理簡介: 是通過尋求結(jié)
12、構(gòu)化風(fēng)險(xiǎn)最小來提高學(xué)習(xí)泛化能力,實(shí)現(xiàn)經(jīng)驗(yàn)風(fēng)險(xiǎn)和置信范圍最小化,從而達(dá)到獲得良好統(tǒng)計(jì)規(guī)律的目的優(yōu)點(diǎn):優(yōu)點(diǎn): 可以解決小樣本情況下的機(jī)器學(xué)習(xí)問題 可以解決高維、非線性問題缺點(diǎn):缺點(diǎn): 對非線性問題沒有通用解決方案,對核函數(shù)的選擇非常敏感SVR最本質(zhì)與SVM類似,都有一個margin,只不過SVM的margin是把兩種類型分開,而SVR的margin是指里面的數(shù)據(jù)不會對回歸有任何幫助。銷售預(yù)測現(xiàn)狀與痛點(diǎn)銷售預(yù)測現(xiàn)狀與痛點(diǎn)CONTENTS0102 銷售預(yù)測四大步驟銷售預(yù)測四大步驟03 銷售預(yù)測基本方法銷售預(yù)測基本方法04 銷售預(yù)測效果評估方法與指標(biāo)銷售預(yù)測效果評估方法與指標(biāo)05 某電商網(wǎng)站銷售預(yù)測案例
13、分享某電商網(wǎng)站銷售預(yù)測案例分享模型評估方法:模型評估方法: k 折交叉驗(yàn)證法折交叉驗(yàn)證法K折交叉驗(yàn)證法折交叉驗(yàn)證法 在k-折交叉驗(yàn)證中,初試數(shù)據(jù)被劃分成k個互不相交的子集或“折”,每個折的大小大致相等。訓(xùn)練和測試k次。在第i次迭代中,第i折用作測試集,其余的子集都用于訓(xùn)練分類法。 準(zhǔn)確率估計(jì)是k次迭代正確分類數(shù)除以初始數(shù)據(jù)中的樣本總數(shù)。數(shù)據(jù)S1S2Sk測試集訓(xùn)練集導(dǎo)出回歸法評估精度模型評估方法:模型評估方法: k 折交叉驗(yàn)證法折交叉驗(yàn)證法K折交叉驗(yàn)證法折交叉驗(yàn)證法 在k-折交叉驗(yàn)證中,初試數(shù)據(jù)被劃分成k個互不相交的子集或“折”,每個折的大小大致相等。訓(xùn)練和測試k次。在第i次迭代中,第i折用作測
14、試集,其余的子集都用于訓(xùn)練分類法。 準(zhǔn)確率估計(jì)是k次迭代正確分類數(shù)除以初始數(shù)據(jù)中的樣本總數(shù)。數(shù)據(jù)S1S2Sk測試集訓(xùn)練集導(dǎo)出回歸法評估精度模型評估方法:模型評估方法: k 折交叉驗(yàn)證法折交叉驗(yàn)證法K折交叉驗(yàn)證法折交叉驗(yàn)證法 在k-折交叉驗(yàn)證中,初試數(shù)據(jù)被劃分成k個互不相交的子集或“折”,每個折的大小大致相等。訓(xùn)練和測試k次。在第i次迭代中,第i折用作測試集,其余的子集都用于訓(xùn)練分類法。 準(zhǔn)確率估計(jì)是k次迭代正確分類數(shù)除以初始數(shù)據(jù)中的樣本總數(shù)。數(shù)據(jù)S1S2Sk測試集訓(xùn)練集導(dǎo)出回歸法評估精度=1()=1() = 2 其中,為第i個樣本的真實(shí)值,為第i個樣本的預(yù)測值,n為樣本量。 有時也用 =2來評
15、估回歸模型的準(zhǔn)確率,與RMSE效果相同。模型評估指標(biāo):模型評估指標(biāo): RMSE(均方根誤差)(均方根誤差)RMSE 與分類模型不同,回歸模型是對連續(xù)的因變量進(jìn)行預(yù)測,因此判斷回歸模型的準(zhǔn)確率需要考慮的是預(yù)測值與真實(shí)值之間差異的大小。模型評估指標(biāo):模型評估指標(biāo): AIC & BICAIC準(zhǔn)則是評估統(tǒng)計(jì)模型的復(fù)雜度和衡量統(tǒng)計(jì)模型擬合優(yōu)度的一種標(biāo)準(zhǔn): = 2ln + 2 其中L是在相應(yīng)模型下的最大似然估計(jì)值,p是模型的變量個數(shù)。 增加變量的數(shù)目提高了擬合的優(yōu)良性,但可能造成過度擬合的情況。AIC鼓勵數(shù)據(jù)擬合的優(yōu)良性但是盡量避免出現(xiàn)過度擬合(overfitting)的情況。 AIC值越小,模型
16、越好。AIC準(zhǔn)則是尋找可以最好地解釋數(shù)據(jù)但包含最少自由參數(shù)的模型。 BIC準(zhǔn)則是依貝葉斯理論提出的一種模型選擇準(zhǔn)則。 = 2ln + ln() 其中L是在相應(yīng)模型下的最大似然估計(jì)值,n是樣本量,p是模型的變量個數(shù)。 BIC值越小,模型越好。 AIC準(zhǔn)則傾向于過擬合,BIC準(zhǔn)則傾向于欠擬合,BIC選出的模型相對于AIC的更為精簡。銷售預(yù)測現(xiàn)狀與痛點(diǎn)銷售預(yù)測現(xiàn)狀與痛點(diǎn)CONTENTS0102 銷售預(yù)測四大步驟銷售預(yù)測四大步驟03 銷售預(yù)測基本方法銷售預(yù)測基本方法04 銷售預(yù)測效果評估方法與指標(biāo)銷售預(yù)測效果評估方法與指標(biāo)05 某電商網(wǎng)站銷售預(yù)測案例分享某電商網(wǎng)站銷售預(yù)測案例分享銷售預(yù)測的企業(yè)案例分析
17、銷售預(yù)測的企業(yè)案例分析項(xiàng)目背景某電商平臺主營海外代購業(yè)務(wù),由于海外代購物流時間長、發(fā)貨時間慢等因素導(dǎo)致 該電商平臺存在大量庫存積壓情況,想通過銷售預(yù)測模型改善安排進(jìn)貨、提高發(fā)貨速度以及優(yōu)化庫存。預(yù)測某類銷量排行Top20某單品未來7天的銷量情況預(yù)測目標(biāo)1.收集數(shù)據(jù):18個月數(shù)據(jù),樣本513,指標(biāo)722.數(shù)據(jù)探索:與銷量的變量分析3.數(shù)據(jù)預(yù)處理:缺失值、Box-Cox變換、stepBIC等收集數(shù)據(jù)時間序列方法機(jī)器學(xué)習(xí)算法應(yīng)用模型評估指標(biāo)可視化展示評價(jià)指標(biāo)收集數(shù)據(jù):采集影響商品銷量指標(biāo)維度6維度72指標(biāo)商品銷量指標(biāo)體系季節(jié)特征(季節(jié)特征(1個)個)營銷推廣(營銷推廣(14個)個)商品優(yōu)惠 商品搶購
18、商品促銷 首頁廣告商品分銷商品換貨商品退款商品退貨商品復(fù)購用戶評價(jià)商品稅率商品庫存商品銷量商品物流商品產(chǎn)地商品供貨節(jié)假日消費(fèi)等級零售價(jià)格交易價(jià)格交易稅率用戶行為(用戶行為(21個)個)瀏覽行為 購物車行為咨詢行為 下單行為收藏行為 支付行為321 商品信息(商品信息(10個)個)4價(jià)格變化(價(jià)格變化(13個)個) 56商品品牌商品質(zhì)量(商品質(zhì)量(13個)個)數(shù)據(jù)探索:節(jié)假日與銷量關(guān)系節(jié)假日變量對銷量的影響明顯節(jié)假日變量對銷量的影響明顯數(shù)據(jù)探索:預(yù)測變量之間的多重共線性結(jié)論:訂單數(shù)、訂單金額和訂單用戶數(shù)之間相關(guān)性較高!需要過濾多重共線性!結(jié)論:訂單數(shù)、訂單金額和訂單用戶數(shù)之間相關(guān)性較高!需要過濾
19、多重共線性!模型效果:真實(shí)值與預(yù)測值對比圖xgboost和隨機(jī)森林的預(yù)測效果較佳,線性回歸和和隨機(jī)森林的預(yù)測效果較佳,線性回歸和ARIMA效果較差效果較差應(yīng)用模型:應(yīng)用模型:xgboost紅色點(diǎn)線紅色點(diǎn)線:某商品的真實(shí)銷量綠色點(diǎn)線綠色點(diǎn)線: 某商品的預(yù)測銷量RMSE(均方根誤差):3.68837算法名稱RMSE性能ARIMA5.32速度較慢,2.5min線性回歸4.28速度快,1min決策樹5.02速度快,1min隨機(jī)森林2.85速度快,1minxgboost3.68速度適中,1.5min神經(jīng)網(wǎng)絡(luò)4.99速度快,1min支持向量回歸3.27速度快,1min模型評估:模型評估:RMSE隨機(jī)森林:隨機(jī)森林:采取的是重抽樣,具有自動選擇重要特征的功能,無需做特征篩選,在一定程度上避免了過擬合 xgboost: kaggle比賽上表現(xiàn)卓越的算法之一,從本質(zhì)上分析是一個集成的決策樹,但是可以讓弱回歸樹集成成強(qiáng)回歸樹因此,它們可以在本案例中能夠取得的好預(yù)測效果而其他算法:而其他算法: 處于數(shù)據(jù)的局限性或模型的參數(shù)未達(dá)到最優(yōu),會存在一定的過擬合,導(dǎo)致預(yù)測效果相對較差算法名稱預(yù)處理
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 模雕行業(yè)市場發(fā)展及發(fā)展趨勢與投資戰(zhàn)略研究報(bào)告
- 2025年度汽車經(jīng)銷商融資貸款抵押合同樣本
- 2025年度區(qū)塊鏈技術(shù)服務(wù)居間三方合同協(xié)議書
- 2025年度股權(quán)質(zhì)押擔(dān)保合同模板:助力綠色環(huán)保產(chǎn)業(yè)發(fā)展
- 2025年度環(huán)保技術(shù)居間服務(wù)合同協(xié)議書
- 2025年度企業(yè)知識產(chǎn)權(quán)保護(hù)與運(yùn)營服務(wù)合同
- 2025年度智能建筑系統(tǒng)集成工程項(xiàng)目管理服務(wù)合同
- 2025年度勞動合同履行監(jiān)督與績效評估合同
- 2025年度國際私法學(xué)法律咨詢及培訓(xùn)服務(wù)合同
- 2025年度體育場館運(yùn)營固定總價(jià)合同約定
- 教育教學(xué)質(zhì)量經(jīng)驗(yàn)交流會上校長講話:聚焦課堂關(guān)注個體全面提升教育教學(xué)質(zhì)量
- 2024人教新目標(biāo)(Go for it)八年級英語上冊【第1-10單元】全冊 知識點(diǎn)總結(jié)
- 企業(yè)新員工培訓(xùn)師帶徒方案
- 美容美發(fā)行業(yè)衛(wèi)生管理規(guī)范
- 年終總結(jié)總經(jīng)理講話
- 2024-2025學(xué)年北師大版數(shù)學(xué)八年級上冊期末綜合測試卷
- 培訓(xùn)機(jī)構(gòu)校區(qū)管理規(guī)劃
- DB13(J)-T 8541-2023 全過程工程咨詢服務(wù)標(biāo)準(zhǔn)
- 河南省安陽市2024年中考一模語文試卷(含答案)
- TD/T 1044-2014 生產(chǎn)項(xiàng)目土地復(fù)墾驗(yàn)收規(guī)程(正式版)
- 2024年湖南現(xiàn)代物流職業(yè)技術(shù)學(xué)院單招職業(yè)適應(yīng)性測試題庫及答案1套
評論
0/150
提交評論