版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、 基于支持向量機的稅收預測算法研究 賈曉光摘要:稅收預測對財務預算和稅收計劃制定具有重要的意義。隨著經(jīng)濟的快速發(fā)展,稅務管理人員對稅收預測精度和模型有效性提出了更高的要求。現(xiàn)有的稅收預測模型主要用來驗證模型的可行性,即主要目標是提高預測精度,沒有充分考慮模型的實用性問題。該文從模型的預測精度和實用性角度研究稅收預測問題,建立了基于網(wǎng)格搜索法優(yōu)化的支持向量機稅收預測模型。文中應用gm(1,1)算法建立稅收指標因子序列的預測模型,為稅收預測模型提供更為全面的數(shù)據(jù)基礎。對稅收數(shù)據(jù)進行驗證性實驗結果表明,該方法預測精度提高了,絕對誤差從6.9%降低到
2、1.8%,并且實現(xiàn)了稅收預測功能,證明了模型的可行性和實用性。關鍵詞:支持向量機;網(wǎng)格搜索法;gm(1,1);指標因子;稅收預測模型;驗證性實驗:tp312 :a :1009-3044(2018)02-0242-04tax forecasting algorithm based on support vector machinejia xiao-guang(yanshan university, qinhuangdao 066004, china)abstract: tax forecasting has important significance to the financial budg
3、et and tax planning. with the rapid development of economy, the tax management personnel put forward higher requirements on the accuracy of tax forecasting and the validity of the model. the existing tax forecasting model is mainly used to verify the feasibility of the model, that is, the main goal
4、is to improve the prediction accuracy, and not to fully consider the practicality of the model. in this paper, we studied the problems of tax forecasting based on the forecast accuracy and practicability of the model and established the model of support vector machine based on the optimization of th
5、e grid search method. the gm (1,1) algorithm is used to establish the forecast model of the tax index factor, which provides a more comprehensive data base for the tax revenue forecasting model. the validation experiment results show that the prediction accuracy of this method is improved, and the a
6、bsolute error is reduced from 6.9% to 1.8%, and the function of tax forecast is realized.key words: support vector machine; grid search method; gm; index factor; tax forecast model; verification experiment1 背景稅收預測是稅收收入的出發(fā)點和稅收宏觀分析的基礎,是在對稅收歷史數(shù)據(jù)收集、影響因素分析以及國家宏觀經(jīng)濟調(diào)控的共同作用下工作的。預測結果能夠幫助稅務管理人員更有效、更好的安排稅收計劃和預
7、見未來的稅收情況,也是領導進行科學決策的重要依據(jù)。因此,稅收預測具有很重要的研究價值。自從學術界提出稅收預測這一概念以來,學者們提出了很多稅收預測模型,包括:回歸分析模型、時間序列預測模型、神經(jīng)網(wǎng)絡預測模型、gm(1,1)預測模型和支持向量機預測模型等。2006年,李繼嵬等人基于稅收影響因素和數(shù)據(jù)特征將稅收預測方法分為解釋性的預測方法和時間序列分析方法1,文中應用一次指數(shù)平滑法和二次指數(shù)平滑法預測稅收,實驗結果驗證,二次指數(shù)平滑法的預測精度更高,但是沒有指出選擇這個算法的依據(jù)和優(yōu)勢。與傳統(tǒng)的統(tǒng)計模型相比,c shen等人將bp神經(jīng)網(wǎng)絡的應用于稅收應用領域2,實驗數(shù)據(jù)包括1994-2006共13
8、組,實驗指標包括8項,實驗模型的驗證結果體現(xiàn)模型具有較高的精度和實用性,但是沒有克服傳統(tǒng)bp神經(jīng)網(wǎng)絡存在的缺陷,算法收斂速度慢。李守麗應用時間序列模型預測鄭州市gdp 3,是稅收應用領域的又一個預測方法擴展,但是模型具有應用領域的局限性?;跀?shù)據(jù)樣本小、信息量少等特點,俞群等人結合定性分析與定量預測,應用gm(1,1)模型對稅收數(shù)據(jù)進行預測4,實驗數(shù)據(jù)包括1992-2001共10組,實驗指標是稅收收入,驗證實驗結果表明gm(1,1)比bp 網(wǎng)絡預測更有優(yōu)勢,但是對稅收數(shù)據(jù)的要求比較高。針對傳統(tǒng)bp人工神經(jīng)網(wǎng)絡所存在的缺陷,林國璽等人在遞歸預測方法的基礎上,將遺傳算法與bp神經(jīng)網(wǎng)絡相結合,提出了
9、基于實數(shù)編碼的 ga-bp神經(jīng)網(wǎng)絡稅收預測模型,預測效果優(yōu)于傳統(tǒng)的神經(jīng)網(wǎng)絡預測模型5,但是預測精度還有待提高。基于結構風險最小的支持向量機能夠提高泛化能力,常青等人利用基于rbf徑向基核函數(shù)的支持向量機建立稅收預測模型6,改善了人工神經(jīng)網(wǎng)絡容易出現(xiàn)的局部最優(yōu)問題,其中實驗數(shù)據(jù)包括1994-2004共11組,實驗指標共8項,。2011年,基于稅收數(shù)據(jù)的動態(tài)和高度非線性等特點,張玉等人提出了基于主成分分析的支持向量機稅收預測模型7,實驗數(shù)據(jù)包括1988-2004共17組,實驗指標包括9項,驗證結果表明模型具有較高的泛化能力和預測精度。endprint由上述文獻分析可知,支持向量機算法適用于小數(shù)據(jù)集
10、的稅收預測,能有效改善模型泛化能力。但是傳統(tǒng)的稅收預測模型都是進行驗證性試驗,沒有實現(xiàn)預測未來稅收收入的功能,模型的實用性有待提高。本文基于模型的實用性問題,建立了將gm(1,1)與支持向量機相結合的稅收預測模型,應用1994年-2009年的稅收數(shù)據(jù)作為訓練集,2010-2014年的數(shù)據(jù)作為測試集,預測了2015-2020年的稅收收入,結果證明了該方法在稅收預測領域的實用性。2 預測算法及實現(xiàn)過程本文通過應用gm(1,1)算法8輸出稅收指標因子的預測值,然后應用網(wǎng)格搜索法9求解優(yōu)化的平衡參數(shù)和核函數(shù)參數(shù),最后建立基于支持向量機算法10的預測模型。算法流程如圖1所示。算法詳細步驟如下:1) 根據(jù)
11、相關參考文獻選擇稅收收入的影響因子,依據(jù)指標在中國統(tǒng)計年鑒中收集稅收相關數(shù)據(jù)。2) 對稅收數(shù)據(jù)進行標準化處理,消除各指標因子之間的量綱差異對稅收預測結果的影響。3) 采用gm(1,1)對各個稅收指標因子分別建立預測模型,求解各個指標2015-2020年的數(shù)據(jù)預測值。4) 建立基于支持向量機的預測模型,初始化模型參數(shù),基于默認值求解稅收預測值。5) 應用網(wǎng)格搜索法求解最優(yōu)的模型參數(shù):平衡參數(shù)c和核函數(shù)參數(shù)g。6) 將最優(yōu)參數(shù)對應用于支持向量機模型,建立最優(yōu)預測模型。7) 對訓練集進行學習,對測試集進行測試,輸出稅收預測結果,分析預測模型的預測誤差和實用性。后續(xù)部分將對具體步驟進行詳細介紹。2.1
12、 樣本數(shù)據(jù)收集稅收收入的影響因素比較多,至今也沒有統(tǒng)一的判斷標準,文中參考多個文獻資料,基于影響稅收收入水平的產(chǎn)業(yè)發(fā)展狀況、反映稅收規(guī)模大小、人民生活水平、影響稅收收入增長狀況和反映稅收增長與經(jīng)濟發(fā)展相互關系等因素,最終選擇國內(nèi)生產(chǎn)總值(x1)、國內(nèi)增值稅(x2)、營業(yè)稅(x3)、國內(nèi)消費稅(x4)、個人所得稅(x5)、企業(yè)所得稅(x6)、第一產(chǎn)業(yè)(x7)、第二產(chǎn)業(yè)(x8)、第三產(chǎn)業(yè)(x9)、批發(fā)和零售業(yè)(x10)、關稅(x11)等11項指標作為實驗分析指標,根據(jù)中國統(tǒng)計年鑒和中國稅務年鑒得到11項指標的原始數(shù)據(jù),選取1994年-2009年的數(shù)據(jù)作為訓練數(shù)據(jù),2010-2014年的數(shù)據(jù)作為測試
13、數(shù)據(jù),如表1所示。2.2 歸一化過程很多學者已經(jīng)驗證了不同量綱的實驗數(shù)據(jù)會影響預測模型的預測結果和模型精度。本文中用于實驗的稅收數(shù)據(jù)單位不同,相關指標數(shù)據(jù)值的差異也比較大。為了消除預測指標數(shù)據(jù)之間的差異對稅收預測模型性能的影響,需要在模型訓練之前對稅收數(shù)據(jù)進行標準化處理,即把所有數(shù)據(jù)歸一化到 0,1 區(qū)間,具體處理過程如式(1)所示:x'i=xi-xminxmax-xmin x'i=(xi-xmin)/(xmax-xmin) (1)其中,x'i表示歸一化后的稅收值,xi表示稅收數(shù)據(jù)實際值,xmin表示實際稅收序列中的最小值,xmax 表示實際稅收序列中的最大值。2.3
14、gm(1,1)預測模型對每一個稅收指標因子的原始數(shù)據(jù)序列進行預處理,求解灰色參數(shù),建立gm(1,1)預測模型。首先對共17組稅收樣本數(shù)據(jù)進行學習,然后應用5組測試數(shù)據(jù)集進行預測驗證,預測誤差結果如表2所示。最后,預測2015至2020年的稅收收入預測值,預測結果如表3所示。通過對比分析預測結果可以看到:指標x5的相對誤差和絕對誤差比較小,而指標x6的相對誤差和絕對誤差值較大,預測結果表現(xiàn)出強烈的不穩(wěn)定性。所以本文選用穩(wěn)定性能較強的支持向量機算法來改善稅收預測模型。2.4 網(wǎng)格搜索優(yōu)化參數(shù)網(wǎng)格搜索法雖然預測速度相對較慢,但可以保證搜索到最優(yōu)參數(shù),進而達到理想的預測精度。稅收數(shù)據(jù)集屬于小樣本數(shù)據(jù),
15、考慮到模型的實用性和預測性能,本文應用網(wǎng)格搜索法求解得到平衡參數(shù)c = 1.7411,g = 0.020617。遍歷過程如圖2所示。圖2 最優(yōu)參數(shù)結果3 實驗與結果分析3.1 實驗設計為了提高稅收模型預測精度,進而得到更準確的稅收值,通過歷史數(shù)據(jù)對稅收預測模型進行驗證。1) 基于原始數(shù)據(jù)序列依次生成累加生成數(shù)據(jù)序列、緊鄰均值生成序列、常數(shù)項量矩陣和累加矩陣,構造灰色微分方程,建立gm(1,1)預測模型,求解稅收預測值系列xi, yi xi,yi。2) 利用默認參數(shù)建立基于支持向量機的稅收預測函數(shù)f(x)=i=1t(*i-i)k(xi,x)+b (2)3) 應用網(wǎng)格搜索法求最優(yōu)參數(shù)平衡參數(shù)和核函
16、數(shù)參數(shù),先定義大范圍的數(shù)據(jù)區(qū)域求解,然后在求解的結果基礎上再定更小范圍數(shù)值。最終確定最優(yōu)參數(shù)c和g。4) 利用最優(yōu)參數(shù)建立最優(yōu)稅收預測模型f(x)=i=1l(*i-i)k*(xi?x)+b (3)5) 求解稅收預測值,并分析模型精度,檢驗模型預測性能。3.2 稅收預測結果及分析應用網(wǎng)格搜索法得到最佳懲罰因子c和核函數(shù)參數(shù)g,然后基于最優(yōu)參數(shù)建立最優(yōu)預測模型,經(jīng)過對訓練樣本學習和對測試樣本測試,最后求得優(yōu)化的稅收預測結果。稅收預測結果如表4所示。預測誤差結果如表5所示。 由表5可以看出三種稅收預測模型分別實現(xiàn)了對2010-2014年共5年的稅收樣本數(shù)據(jù)進行測試。其中,gm(1,1)的預測結果穩(wěn)定
17、性較差,基于支持向量機的預測模型的結果穩(wěn)定,但是預測精度不高,最優(yōu)預測模型彌補了gm(1,1)模型的不穩(wěn)定性,同時應用網(wǎng)格搜索法優(yōu)化了支持向量機預測模型參數(shù),優(yōu)化的預測結果表明,最優(yōu)模型預測結果穩(wěn)定,而且預測精度提高了,所以本文選取gm(1,1)與網(wǎng)格搜索法優(yōu)化的支持向量機預測模型結合作為最終的預測模型。基于最優(yōu)預測模型求解得到2015-2020年的稅收預測值,其中2015年148121.8億元,2016年171217.3億元,2017年197544.7億元,2018年226603億元,2019年256106.3億元,2020年280001.5億元。同1994-2014年的稅收數(shù)據(jù)對比的結果如
18、圖3所示,稅收預測數(shù)據(jù)的增長趨勢基本趨于指數(shù)增長模式,符合實際數(shù)據(jù)序列的增長趨勢,實驗驗證了模型的可行性和實用性。4 結束語針對數(shù)據(jù)量較少的稅收數(shù)據(jù)序列,為保證稅收預測精度,采用網(wǎng)格搜索法尋求最優(yōu)參數(shù),應用原始數(shù)據(jù)集以及由gm(1,1)生成的稅收指標因子預測序列數(shù)據(jù)作為支持向量機預測模型的數(shù)據(jù)集,建立最優(yōu)預測模型對稅收進行預測。通過實驗驗證及預測,可以證明,基于網(wǎng)格搜索優(yōu)化的支持向量機預測模型預測精度高,而且在稅收預測中表現(xiàn)出良好的可用性。參考文獻:1 李繼嵬, 劉書明, 李春平, 等. 數(shù)據(jù)挖掘技術在稅收預測分析中的應用j. 計算機系統(tǒng)應用, 2006, 15(9):61-64.2 shen c, zhang w. economic analysis on tax model based on b
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 合唱服裝采購合同范例
- 中介合同范例里買
- 外貿(mào)貨物銷售合同范例
- 代課教師合同范例
- 商用房合租合同模板
- 合同范例源碼
- 樂高購銷合同范例
- 代購代加工合同范例
- 加盟服裝采購合同范例
- ice 系列合同范例
- 2024-2030年組氨酸行業(yè)市場現(xiàn)狀供需分析及投資評估規(guī)劃分析研究報告
- 教育信息化教學資源建設規(guī)劃
- 屠宰場食品安全管理制度
- 部編版(2024秋)語文一年級上冊 6 .影子課件
- 2024秋期國家開放大學專科《刑事訴訟法學》一平臺在線形考(形考任務一至五)試題及答案
- 基于SICAS模型的區(qū)域農(nóng)產(chǎn)品品牌直播營銷策略研究
- 病例討論英文
- 2024秋期國家開放大學??啤兑簤号c氣壓傳動》一平臺在線形考(形考任務+實驗報告)試題及答案
- 【課件】植物體的結構層次課件-2024-2025學年人教版生物七年級上冊
- 24秋國家開放大學《0-3歲嬰幼兒的保育與教育》期末大作業(yè)參考答案
- 相對濕度計算公式
評論
0/150
提交評論