基于網(wǎng)絡(luò)搜索數(shù)據(jù)的平遙旅游客流量預(yù)測(cè)分析_第1頁(yè)
基于網(wǎng)絡(luò)搜索數(shù)據(jù)的平遙旅游客流量預(yù)測(cè)分析_第2頁(yè)
基于網(wǎng)絡(luò)搜索數(shù)據(jù)的平遙旅游客流量預(yù)測(cè)分析_第3頁(yè)
基于網(wǎng)絡(luò)搜索數(shù)據(jù)的平遙旅游客流量預(yù)測(cè)分析_第4頁(yè)
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、基于搜集搜索數(shù)據(jù)的仄遠(yuǎn)旅旅客流量推測(cè)闡收基于搜集搜索數(shù)據(jù)的仄遠(yuǎn)旅旅客流量推測(cè)闡收1、引止遠(yuǎn)年去,我國(guó)旅游財(cái)富范疇沒(méi)有竭擴(kuò)年夜,仄遠(yuǎn)古鄉(xiāng)做為中國(guó)境內(nèi)保存最完好的現(xiàn)代縣鄉(xiāng)與票號(hào)文明去源天,旅客量快速刪減,逐年刪減的旅客對(duì)古鄉(xiāng)啟載力及景區(qū)成坐提出了更下要供。與此同時(shí),跟著互聯(lián)網(wǎng)妙技的死少和年夜數(shù)據(jù)時(shí)期的到去,旅游疑息傳播形式、旅客疑息搜索方法、旅游耗損舉措等均收死了宏年夜改動(dòng)。許多旅游籌劃者、旅游企業(yè)及政府機(jī)構(gòu)皆經(jīng)由過(guò)程互聯(lián)網(wǎng)仄臺(tái)公布收表旅游疑息,隨之互聯(lián)網(wǎng)仄臺(tái)同樣成為寬年夜旅客出游的慌張疑息根源,響應(yīng)收死的搜集搜索數(shù)據(jù)那么垂垂成為下量量的旅客旅游搜索舉措數(shù)據(jù)庫(kù)。2022年百度推出的百度指數(shù)可以間接

2、、客沒(méi)有俗觀天反響某特定工夫段內(nèi)的社會(huì)熱面、用戶愛(ài)好戰(zhàn)需供,并且真證說(shuō)明操縱百度指數(shù)那一搜集搜索指數(shù)舉止推測(cè)抑制了傳統(tǒng)推測(cè)中存正在的數(shù)據(jù)滯后和數(shù)據(jù)量沒(méi)有夠的缺點(diǎn),成果更減準(zhǔn)確、更具時(shí)效性。果而,本文依托百度指數(shù)的時(shí)效性,開(kāi)挖旅游搜集關(guān)注度戰(zhàn)理想旅游需供的關(guān)連,推測(cè)景區(qū)客流量,對(duì)指導(dǎo)旅游打面部門做出科教、公允的決定安排,增進(jìn)旅游可持絕死少具有慌張意義。2、目的拔與與數(shù)據(jù)一目的拔與按照目的拔與實(shí)際的闡收可知,用戶搜索舉措反響了用戶遠(yuǎn)期舉措,但因?yàn)樗阉饔脩舻耐啃裕瑳](méi)有同用戶對(duì)某一事物的關(guān)注度有所沒(méi)有同,從而使得搜索關(guān)鍵詞也具有多樣性,且關(guān)鍵詞應(yīng)包含與目的事物相關(guān)的各個(gè)圓里。果而,本文正在已有文獻(xiàn)根

3、柢上,按照相關(guān)旅游經(jīng)歷及人們中出沒(méi)有俗參觀時(shí)的主要考慮果素,即衣、食、注止、游5個(gè)圓里,經(jīng)由過(guò)程百度指數(shù)趨向研討戰(zhàn)需供圖譜兩個(gè)模塊去舉止關(guān)鍵詞的提與,那5個(gè)圓里涵蓋了仄遠(yuǎn)天氣、仄遠(yuǎn)牛肉、仄遠(yuǎn)古鄉(xiāng)過(guò)夜、仄遠(yuǎn)古鄉(xiāng)門票、仄遠(yuǎn)古鄉(xiāng)旅游攻略等多圓里疑息。本文將那5個(gè)圓里的相關(guān)詞做為初初關(guān)鍵詞,使用百度關(guān)鍵詞開(kāi)挖本文由搜集拾掇整頓舉止關(guān)鍵詞搜索,從而獲得最終的關(guān)鍵詞目的。兩數(shù)聽(tīng)分析本文的關(guān)鍵詞數(shù)據(jù)是操縱搜集爬蟲(chóng)妙技從百度指數(shù)網(wǎng)頁(yè)源代碼中提獲獲得的。正在操縱初初詞舉止關(guān)鍵詞搜索過(guò)程中,剔除出無(wú)數(shù)據(jù)對(duì)應(yīng)戰(zhàn)數(shù)據(jù)量很少的關(guān)鍵詞,最終獲得57個(gè)關(guān)鍵詞從2022年12月到2022年12月共162周的數(shù)據(jù)。仄遠(yuǎn)古鄉(xiāng)旅旅

4、客流量數(shù)據(jù)去自山西省旅游局,拔與的工夫區(qū)間為2022年12月至2022年12月,共37個(gè)數(shù)據(jù)。因?yàn)槲覀儷@得的關(guān)鍵詞數(shù)據(jù)為周度數(shù)據(jù),而本文研討的是月度數(shù)據(jù),所以要對(duì)關(guān)鍵詞數(shù)據(jù)舉止處理,將周度數(shù)據(jù)轉(zhuǎn)化為月度數(shù)據(jù),即按照日歷中各月周數(shù)舉止減總,將每個(gè)月終了幾天數(shù)據(jù)按所在周的天數(shù)做為權(quán)重,將該周的數(shù)據(jù)按權(quán)重分撥到相鄰月中,最終獲得37個(gè)月的搜索指數(shù)數(shù)據(jù)。3、真證闡收起尾對(duì)模型擬開(kāi)戰(zhàn)推測(cè)有兩面分析:一是擬開(kāi)樣本區(qū)間為2022年12月到2022年10月,共35個(gè)數(shù)據(jù),用于推測(cè)檢驗(yàn)的樣本區(qū)間為2022年的11月到12月2個(gè)月的數(shù)據(jù)。兩是正在模型擬開(kāi)成果的比較上,本文引進(jìn)SE戰(zhàn)NSE兩個(gè)目的,分別代表模型的穩(wěn)

5、定性戰(zhàn)擬開(kāi)度。一搜索關(guān)鍵詞肯定起尾,操縱簡(jiǎn)樸腳動(dòng)挑選,沒(méi)有俗觀察局部關(guān)鍵詞數(shù)據(jù),將趨向變化沒(méi)有隱著或幾乎無(wú)變化趨向的剔除;然后,操縱Pearsn相關(guān)連數(shù)挑選,分別策繪各關(guān)鍵詞與果變量的Pearsn相關(guān)連數(shù),將相關(guān)連數(shù)小于0.6的剔除;終了,操縱線性回回挑選,并診斷回回的多重共線性戰(zhàn)自相關(guān),操縱垂垂回回及AI本那么選出最終的4個(gè)關(guān)鍵詞:仄遠(yuǎn)古鄉(xiāng)旅游攻略、仄遠(yuǎn)古鄉(xiāng)天圖、山西旅游景面年夜齊、仄遠(yuǎn)過(guò)夜。兩模型估計(jì)正在挑選關(guān)鍵詞過(guò)程中,我們構(gòu)建了一個(gè)線性回回圓程,回回估計(jì)以下:從回回成果看,整體擬開(kāi)成果較好,變量系數(shù)均經(jīng)由過(guò)程較著性檢驗(yàn),果而該線性模型仿佛具有較好推測(cè)成果。但為進(jìn)一步?jīng)]有俗觀察模型假定能

6、可成坐,我們舉止殘好的Shapir-ilk正態(tài)性檢驗(yàn),并且描繪了果變量曲圓圖及對(duì)應(yīng)的線性分布圖,檢驗(yàn)成果均說(shuō)明果變量沒(méi)有服從正態(tài)分布,果而本文操縱線性回回舉止模型模擬時(shí)其真沒(méi)有能開(kāi)意其對(duì)果變量分布的假定,從而會(huì)收死較年夜偏偏背,影響擬開(kāi)戰(zhàn)推測(cè)成果。故本文采與了對(duì)數(shù)據(jù)分布出有任何假定且成果可用交織考證要收去評(píng)判的四種機(jī)器進(jìn)修要收舉止模型擬開(kāi)及推測(cè),并比較了決定樹(shù)、bgging、隨機(jī)森林、支撐背量機(jī)那四種算法模型的擬開(kāi)度、穩(wěn)定性與推測(cè)成果。三模型成果闡收操縱以上四種算法估計(jì)模型,策繪出各模型的SE戰(zhàn)NSE,成果睹表1。從模型的擬開(kāi)度戰(zhàn)穩(wěn)定性去看,回回樹(shù)戰(zhàn)Bagging皆存正在隱著沒(méi)有夠,其SE戰(zhàn)N

7、SE值均年夜于其中兩個(gè)模型,回回示范型正在局部模型中擬開(kāi)成果最好。而隨機(jī)森林戰(zhàn)支撐背量機(jī)SV那兩種模型的成果較好,其中隨機(jī)森林的擬開(kāi)度戰(zhàn)穩(wěn)定性最好,SV模型的擬開(kāi)度較好,但模型穩(wěn)定性欠安。終了分別用以上算法模型對(duì)樣本期中兩個(gè)月的客流量舉止推測(cè),并將其與真正在值相比,策繪其仄均偏偏背率,成果睹表2。如表2所示,模型擬開(kāi)成果較好的回回樹(shù)戰(zhàn)bagging的推測(cè)成果仍沒(méi)有理想,仄均偏偏背率分別抵達(dá)了11.55%戰(zhàn)7.18%,與真正在客流量數(shù)據(jù)相比存正在較年夜缺面。同時(shí),擬開(kāi)成果最好的隨機(jī)森林推測(cè)成果其真沒(méi)有理想,其仄均偏偏背率達(dá)8.54%,以致好于bagging。而SV模型的仄均偏偏背率唯一1.46%

8、,具有較好的推測(cè)成果。闡收去由本由,筆者覺(jué)得年夜要是因?yàn)閎agging、回回樹(shù)、隨機(jī)森林三種算法模型的分類本理素量上源于回納算法,那類模型正在規(guī)劃龐年夜的數(shù)據(jù)散上進(jìn)修本領(lǐng)戰(zhàn)逆應(yīng)性沒(méi)有夠強(qiáng),有效性戰(zhàn)伸縮性沒(méi)有夠,而SV那么采與了與傳統(tǒng)模型沒(méi)有同的思維,具有較強(qiáng)的泛化本領(lǐng),所以推測(cè)成果與理想較為接遠(yuǎn)。4、結(jié)論本文正在闡收旅旅客流量戰(zhàn)百度搜索指數(shù)關(guān)連的根柢上,使用一系列要收挑選出與旅旅客流量相關(guān)性最下的四個(gè)關(guān)鍵詞,并使用回回樹(shù)、bagging、隨機(jī)森林戰(zhàn)SV四種機(jī)器進(jìn)修算法模型對(duì)客流量數(shù)據(jù)舉止了擬開(kāi)戰(zhàn)推測(cè)。研討詳細(xì)結(jié)論主要有三面,一是主要或埋伏旅客主要經(jīng)由過(guò)程對(duì)仄遠(yuǎn)古鄉(xiāng)旅游攻略、仄遠(yuǎn)古鄉(xiāng)天圖、山西旅游景面年夜齊、仄遠(yuǎn)過(guò)夜等關(guān)鍵詞的搜索去獵與仄遠(yuǎn)古鄉(xiāng)旅游疑息。兩是回回樹(shù)、bagging、隨機(jī)森林戰(zhàn)SV模型中,擬開(kāi)成果最好的是隨機(jī)森林戰(zhàn)SV模型,穩(wěn)定性最好的為隨機(jī)森林模型,回回樹(shù)、bagging的擬開(kāi)度戰(zhàn)穩(wěn)定性皆較好;推測(cè)成果最好的為SV

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論