香港科技大學-旅游指數白皮書_第1頁
香港科技大學-旅游指數白皮書_第2頁
香港科技大學-旅游指數白皮書_第3頁
香港科技大學-旅游指數白皮書_第4頁
香港科技大學-旅游指數白皮書_第5頁
已閱讀5頁,還剩27頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1.項目任務介紹 41.1背景介紹 41.2研究目標:慧科-港科大旅游指數 41.3研究團隊 42.項目方法論 52.1數據理解和采集 52.2變量設計和提取 72.3數據處理和量化 92.4模型建立 10 3.1預測結果 133.2模型評估 143.3模型解釋 153.3.1酒店入住率預測模型 153.3.2到訪人數預測模型 173.3.3酒店價格預測模型 203.4慧科-港科大旅游指數 21總結 23占全部訪港旅客客最常用的分享和熟的自然語言處商業(yè)洞悉重要信數性指關數字和趨勢 (如下個月的旅客到訪人數等)?;劭疲劭拼舐糜沃笖档闹饕鼙姙檎途频甑嚷糜蜗嚓P商業(yè)。對于政府,慧科-港科大旅游指數的預測能力能夠協助其調整未來的旅游業(yè)相關政策并落相關部門(如入境處等)。對于旅游相關商業(yè),慧科-港科大旅游指數的作完成。領域多元化數據經濟學、機器學習和人工智能工具于分析新興的大數據趨勢以產生商業(yè)和社會調查和民意調查及分析以提供創(chuàng)新的商業(yè)和社會見解。這些見解和建議將有助地區(qū)的經濟和社會發(fā)展。位和分析能夠因素名稱定義包含內容到訪方法旅客到訪香港的方式設施景點季節(jié)性景點等娛樂活動當地社群訪港旅客對香港本地人/社群的觀感當地人友好程度附帶因素除去上述五大類外,吸引旅客訪港的附帶因素購買保險等查或專家小組香港旅游業(yè)變化。香港旅游攜程以及各大旅游論壇。這些線上旅行機構及旅游論壇有專門的目的地版塊,社交媒體類型新浪微博旅行論壇及線上旅行機構其他流行社交媒體社交媒體新浪微博小紅書,嗶哩嗶哩,抖音時間范圍2018年1月至2023年3月數據總量每日1000萬條左右過濾方法關鍵詞/標簽過濾版面過濾關鍵詞/標簽過濾過濾后數據總量119,391條30,021條34,612條標注表示方法WeiboOTA我們根據上一節(jié)中定義的六大旅游因素導出此次項目預測模型的自變量。盡管大因素所包括的細分因素對旅游業(yè)的影響不盡相同。例如當地社群因素可以進一步細分為當地社群-正面(友好)以及當地社群-負面(敵視),而這兩個細*2=22個自變量。期,細分變量名稱細分變量定義細分變量性質到訪方法-交通訪港旅客到訪香港時的交通方式體上與訪港交通相關的月度數據量到訪方法-簽證訪港旅客到訪香港時的相關簽證體上與訪港簽證相關的月度數據量設施體上與旅游設施相關的月度數據量景點訪港旅客在香港到訪的景點體上與香港旅游景點相關的月度數據量當地社群-正面訪港旅客對香港本地體上對香港本社群的正面觀感地社群正面觀感的月度數據量當地社群-負面訪港旅客對香港本地社群的負面觀感體上對香港本地社群負面觀感的月度數據量娛樂活動-購物訪港旅客在香港的購物活動體上與在港購物相關的月度數據量娛樂活動-運動訪港旅客在香港的體育類活動體上與在港體育活動相關的月度數據量娛樂活動-文娛訪港旅客在香港的文娛類活動體上與在港文娛相關的月度數據量娛樂活動-展覽訪港旅客在香港的文化展覽類活動體上與展覽相關的月度數據量附帶因素除去上述10個變量帶因素體與其它訪港原因相關的月度數據,如注射HPV疫苗、購買保險等外生變量名稱外生變量定義外生變量性質公眾假期內地公共假期時間01變量,如該月有內地公共假期則為1(5月有五一勞動節(jié)公共學生寒暑假期內地學生的寒暑假期01變量,如該月有內地學生寒暑假期則為1(如6月為學生暑假),否則為0港幣人民幣匯率港幣兌人民幣月度平均匯率時間變動的月度時間序列香港社會運動-實際發(fā)生香港社會運動的實際發(fā)生時間01變量,如該月有實際發(fā)生香港社會運動則為1(2019年7月),否則為0香港社會運動-內地媒體大量報導內地媒體大量報導香港社會運動的時間01變量,如該月內地媒體有大量報導香港社會運動則為1(2019香港內地通關政策受疫情影響香港內地是否通關01變量,如該月內香港內地由于疫情原因尚未通關則為1,否則氣溫月度平均氣溫溫隨時間變動的月度時間序列環(huán)境-空氣質量月度平均pm2.5指數凈值變量,平均pm2.5指數隨時間變動的月度時間序列月份當時月份凈值變量科自主研發(fā)的自然樂由于量化之后的數據(自變量)都和我們想要預測的旅游業(yè)統(tǒng)計數字(因變量)局部解釋也可以進行基于全體樣本的全局解釋。P實時的社交媒體數據。但香港旅游業(yè)數字的統(tǒng)計因為存在實際發(fā)生-數據生成-數據披 (在X-1月末拿到的)X-2月的數據。所以我們將使用X-1月的社交媒體數據和X-2XX(本月)X-1月X-2月X-1月X-2月X-1月X-2月入住率入住率入住率人數人數訪人數價格價格店價格特征影響全局解釋主要根據SHAPvalue分析模型中每個特征對模型預測值產對值的平均值求出。下圖反映了特征重要性排名和特征對模型預測值的影響正入住率模型中各因子對于預測值的影響入住率模型中各因子對于預測值的影響店入住率模型中各因子對于預測值的影響最重要的特征為OTA社交媒體上對于簽證o數模型中各因子對于預測值的影響數模型中各因子對于預測值的影響訪人數模型中各因子對于預測值的影響格模

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論