哈工大中期報(bào)告_第1頁
哈工大中期報(bào)告_第2頁
哈工大中期報(bào)告_第3頁
哈工大中期報(bào)告_第4頁
哈工大中期報(bào)告_第5頁
已閱讀5頁,還剩4頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

畢業(yè)設(shè)計(jì)(論文)中期報(bào)告:基于深度學(xué)習(xí)的短時(shí)交通流預(yù)測(cè)技術(shù)研究與實(shí)現(xiàn)業(yè) 生 號(hào) 指導(dǎo)教師 日期 哈爾濱工業(yè)大學(xué)教務(wù)處制目錄TOC\o"1-5"\h\z\o"CurrentDocument"1.論文工作是否按開題報(bào)告預(yù)定的內(nèi)容及進(jìn)度安排進(jìn)行 3已完成的研究工作及成果 3數(shù)據(jù)處理 3數(shù)據(jù)描述 3交通流量問題定義 3數(shù)據(jù)預(yù)處理 4模型構(gòu)建 4數(shù)據(jù)擴(kuò)展 4交通流量預(yù)測(cè)模型 5\o"CurrentDocument"實(shí)驗(yàn)結(jié)果 8\o"CurrentDocument"后期擬完成的研究工作及進(jìn)度安排 9\o"CurrentDocument"存在的問題與困難 9\o"CurrentDocument"5.論文按時(shí)完成的可能性 91.論文工作是否按開題報(bào)告預(yù)定的內(nèi)容及進(jìn)度安排進(jìn)行開題報(bào)告中預(yù)定了如下研究?jī)?nèi)容:針對(duì)交通流數(shù)據(jù)具有的時(shí)間臨近性、空間鄰近性、周期性等特點(diǎn),使用深度學(xué)習(xí)方法提取數(shù)據(jù)特征,對(duì)此地區(qū)下一時(shí)刻的交通流量進(jìn)行預(yù)測(cè),使用MAE、RMSE、尺2評(píng)測(cè)模型的準(zhǔn)確性,研究?jī)?nèi)容分為三部分:(1)將交通數(shù)據(jù)轉(zhuǎn)化為時(shí)空矩陣,并完成標(biāo)準(zhǔn)化、歸一化(2)使用自編碼網(wǎng)絡(luò)提取數(shù)據(jù)特征,與原數(shù)據(jù)融合實(shí)現(xiàn)數(shù)據(jù)擴(kuò)展(3)構(gòu)建深度學(xué)習(xí)模型,提取數(shù)據(jù)時(shí)間臨近性、空間鄰近性、周期性特征預(yù)定進(jìn)度如表所示:表1-1預(yù)2019年11月底-2019年12月底定進(jìn)度安排完成前期調(diào)研工作,了解LSTM、SAE、CNN等神經(jīng)網(wǎng)絡(luò)特性2019年12月底-2020年1月底將交通數(shù)據(jù)轉(zhuǎn)化為時(shí)空矩陣,完成數(shù)據(jù)預(yù)處理2020年1月底-2020年3月底完成初始模型構(gòu)建,提取數(shù)據(jù)特征2020年3月底-2020年4月底結(jié)合實(shí)驗(yàn)結(jié)果,對(duì)模型進(jìn)行參數(shù)調(diào)優(yōu)2020年4月底-2020年5月底目前畢業(yè)設(shè)計(jì)已按照開題報(bào)告預(yù)定的進(jìn)出初始構(gòu)建,總體達(dá)到了開題時(shí)預(yù)定的期望。2.已完成的研究工作及成果數(shù)據(jù)處理數(shù)據(jù)描述本研究使用的數(shù)據(jù)集來源于美國(guó)加利福1數(shù)據(jù)集記錄了城市附近高速公路的33個(gè)站點(diǎn)通流量數(shù)據(jù),數(shù)據(jù)的采樣時(shí)間間隔為5分鐘,如圖2-1所示:6MinutesFlow(Veh/5Minutes)01/01/201700:00 350.0 601/01/201700:05 394.0 601/01/20170010 3E3,O 601/01/201700:15 360.0 6撰寫畢業(yè)論文,準(zhǔn)備結(jié)題答辯萱完成了數(shù)據(jù)預(yù)處理,數(shù)據(jù)擴(kuò)展與預(yù)測(cè)模型的尼亞運(yùn)輸部的性能測(cè)量系統(tǒng)^0忖5)數(shù)據(jù)庫,該自2017年1月1日至2017年7月15日的交數(shù)據(jù)包含時(shí)刻與該時(shí)刻對(duì)應(yīng)的車流量等信息,#LanePoints %Observed0.00.0000.0圖2-1訓(xùn)練集數(shù)據(jù)示例實(shí)驗(yàn)的訓(xùn)練集包括33539條數(shù)據(jù),驗(yàn)證集包括10000條數(shù)據(jù),測(cè)試集包括10885條數(shù)據(jù)2.1.2交通流量問題定義設(shè)當(dāng)前時(shí)刻t,地點(diǎn)p在當(dāng)前時(shí)刻的交通流量為%(t),在下一時(shí)刻的交通流量為%(t+1),p p使用包括地點(diǎn)p在內(nèi)的n個(gè)相鄰地點(diǎn){pIi=1,2,3,...,n}在過去N個(gè)時(shí)間段(t-N+1,t)的交通i流量數(shù)據(jù)對(duì)地點(diǎn)p的下一時(shí)刻的交通流量數(shù)據(jù)X(t+1)進(jìn)行預(yù)測(cè)即為交通流量預(yù)測(cè),用數(shù)p

學(xué)語言表示如下:輸入可表示矩陣如下:a-n+1)J(a-n+1)J(t-N+1)2X= ...nxNj(t-N+1)n-1j(t-N+1)n此問題可簡(jiǎn)化為:j(t-N+2)1j(t-N+2)2...j(t-1)

1

...j(t-1)

2j(t-N+2)...j (t-1)n-1 n-1j(t-N+2)...j(t-1)nnj(t+1)

pj(t)1j(t)2j(t)n-1j(t)n=predict(X)nxN2.1.3數(shù)據(jù)預(yù)處理設(shè)共有m設(shè)共有m個(gè)時(shí)間點(diǎn),te{1,2,...,m},q個(gè)地點(diǎn),pe{1,2,...,q},對(duì)輸入數(shù)據(jù)進(jìn)行分組整合,得到輸入矩陣X與標(biāo)簽Y:m1mX11--mm1mX11--m1mXt1tX212X111XY111-mmY1.ttY122Y111Y1222......... ... .X-X1X2...Xt.ppp......... ... .X1X2...Xt.q-1q-1q-1X1X2...Xt.qqq對(duì)輸入矩陣進(jìn)行數(shù)據(jù)歸一化2...2......2......2...Xm-1XmY-Y1Y2p...p...p...p...Xm-1XmY1Y2q-1q-1q-1q-1Xm-1XmY1Y2qqqqj-jJ- min—2 22Yt... Ym-1 Ymp pp... ... ... ...Yt ... Ym-1 Ymq-1 q-1 q-1Yt ... Ym-1 Ymq qqJ-Jmaxmin2.2模型構(gòu)建2.2.1數(shù)據(jù)擴(kuò)展由于訓(xùn)練數(shù)據(jù)有限,為增加訓(xùn)練集數(shù)目,提高預(yù)測(cè)的準(zhǔn)確率,使用自編碼器對(duì)數(shù)據(jù)進(jìn)行擴(kuò)展。自編碼器是一種基于神經(jīng)網(wǎng)絡(luò)的無監(jiān)督學(xué)習(xí)技術(shù),它將輸入壓縮成潛在空間表征,然后將這種表征重構(gòu)為輸出,是一種數(shù)據(jù)有損的壓縮算法,經(jīng)過這種有損的數(shù)據(jù)壓縮,可以學(xué)習(xí)到輸入數(shù)據(jù)中最重要的特征。自編碼器由兩部分構(gòu)成:編碼器和解碼器,編碼器將輸入壓縮為潛在空間表征,解碼器將潛在表征重構(gòu)為輸出,本研究使用全連接網(wǎng)絡(luò)作為編碼器和解碼器。本研究自編碼器結(jié)構(gòu)如圖2-2所示(設(shè)輸入乂為\xjj...jjj]):123 n-2n-1n

圖2-2自編碼器結(jié)構(gòu)H為壓縮后的特征向量,圖2-2自編碼器結(jié)構(gòu)~rX=X1x2x3...xn-2H=hl ...h1] 0Xn-1 XnH=hl ...h1] 0Xn-1 XnJ...h1X為重構(gòu)后樣本矩陣,qf(x)-s(wx+b)fg(x)-s(Wx+b)gs為編碼器激活函數(shù),s為解碼器激活函數(shù),輸入層和隱藏層之間的權(quán)值矩陣為W,f g隱藏層和輸出層之間的權(quán)值矩陣為W,設(shè)經(jīng)過自編碼神經(jīng)網(wǎng)絡(luò)后的輸出向量為B(x),則將其與歸一化的時(shí)空矩陣融合在一起,得到融合后的訓(xùn)練集及B(x)]。2.2.2交通流量預(yù)測(cè)模型整體架構(gòu)針對(duì)交通數(shù)據(jù)具有的時(shí)空特性,本研究從兩方面構(gòu)建模型,分別提取交通數(shù)據(jù)的時(shí)間特征與空間特征,模型的總體架構(gòu)圖如圖2-3所示:

hr?產(chǎn)區(qū)LSTMhr?產(chǎn)區(qū)LSTM1 wLSTMn LSTM圖2-3模型總體架構(gòu)對(duì)鄰近性特征的獲取,本研究使用時(shí)間間隔為40分鐘的交通數(shù)據(jù)序列,對(duì)周期性特征的獲取,本研究使用每天同一時(shí)刻,一周的同一時(shí)刻的交通數(shù)據(jù)序列,預(yù)測(cè)流程如下:將交通數(shù)據(jù)轉(zhuǎn)化為時(shí)空矩陣,經(jīng)過歸一化處理,傳入自編碼模型中得到擴(kuò)展數(shù)據(jù),通過融合擴(kuò)展數(shù)據(jù)與原始數(shù)據(jù),得到增強(qiáng)后的數(shù)據(jù)集,將其傳入上圖所示的模型中,使用CNN提取數(shù)據(jù)的空間特征,并使用BILSTM提取數(shù)據(jù)的時(shí)間特征,融合提取到的時(shí)空特征,并通過全連接層得到預(yù)測(cè)結(jié)果。對(duì)空間鄰近性特征的提取城市的交通路網(wǎng)受限于網(wǎng)絡(luò)本身結(jié)構(gòu),相鄰地區(qū)的交通流量相互存在一定影響,空間鄰近性特征的獲取對(duì)于交通流量預(yù)測(cè)具有重要意義。本研究采用卷積神經(jīng)網(wǎng)絡(luò)CNN獲取交通數(shù)據(jù)的空間特征,由于實(shí)驗(yàn)數(shù)據(jù)來源于高速公路網(wǎng)絡(luò),以站點(diǎn)標(biāo)號(hào)代替經(jīng)緯度,反映相關(guān)的地理位置信息,更適用于使用一維卷積網(wǎng)絡(luò)提取特征,故本研究網(wǎng)絡(luò)結(jié)構(gòu)基于一維卷積網(wǎng)絡(luò)進(jìn)行設(shè)計(jì),在每個(gè)時(shí)間間隔t內(nèi),將區(qū)域p與其臨近區(qū)域的交通數(shù)據(jù)整合成一個(gè)序列X,作為輸入傳入卷積層中,在每個(gè)卷積層的處理過程可表示如下:ps(n)=f(n)*g(n)=2f(m)g(n-m)m二一8經(jīng)過i層卷積后,得到結(jié)果s,,iGRnxNxy,經(jīng)過扁平層處理后,得到特征向量口eRnxni,p p使用全連接層降低向量維度,得到該區(qū)域的空間位置特征。本研究目前設(shè)計(jì)了兩種CNN網(wǎng)絡(luò)模式來提取空間特征,方案一和方案二分別如圖2-4和圖2-5所示:圖2-4CNN網(wǎng)絡(luò)方案一方案一為直接連接模式,經(jīng)過一系列卷積歸一化操作后,將傳出數(shù)據(jù)降維,傳入下一模塊圖2-5CNN網(wǎng)絡(luò)方案二p圖2-5CNN網(wǎng)絡(luò)方案二p方案二將每一層的輸入與該層的輸出的連接在一起,增加了網(wǎng)絡(luò)的稠密度。對(duì)時(shí)間特征的提取交通數(shù)據(jù)具有鮮明的時(shí)間特性,同一地區(qū)前后時(shí)間關(guān)聯(lián)性較強(qiáng),并且會(huì)隨著時(shí)間的推移呈現(xiàn)出一定的周期性變化,本研究擬采用多層雙向長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)模型(BILSTM),BILSTM由前向LSTM和后向LSTM結(jié)合而成,能夠獲取前后數(shù)據(jù)的變化規(guī)律,從而更有效地提取交通流的時(shí)間特征。本研究將X={x0,x1,…,xn}(區(qū)域p的N個(gè)歷史時(shí)間交通流作為輸入,將時(shí)間序列傳pppp入模型,BILSTM處理過程如下:TOC\o"1-5"\h\z—? —?h=LSTM(x,h)t tt—1<— <—h=LSTM(x,h)t tt—1—— ——)=g(W—h+W—h+b)

t hythytyLSTM處理過程如下:f=o(Wx+Wh+b)

t xfthft-1fi=o(Wx+Wh+b)

t xiihit-1io=o(Wx+Wh+b)

t xothot-1oc=fc+itanh(Wx+Wh+b)

ttt-1t xcthct-1ch-otanh(c)tt t將多層BILSTM網(wǎng)絡(luò)中的輸出結(jié)果y傳入全連接層,得到最終的預(yù)測(cè)結(jié)果y。t ?+12.3實(shí)驗(yàn)結(jié)果將實(shí)驗(yàn)結(jié)果形象化表示如圖2-6和圖2-7所示,圖2-6為某一時(shí)刻所有站點(diǎn)的交通流量,紅色折線表示實(shí)際流量,藍(lán)色折線表示預(yù)測(cè)流量。圖2-7為某一站點(diǎn)在三小時(shí)內(nèi)的交通流量,紅色折線表示實(shí)際流量,藍(lán)色折線表示預(yù)測(cè)流量。圖2-6某一時(shí)刻所有站點(diǎn)的交通流量900-S00-700600500-40030020010000 3 6 9 121518212427303336圖2-7某一站點(diǎn)三小時(shí)內(nèi)的交通流量(計(jì)數(shù)間隔為5分鐘)將不同模型的實(shí)驗(yàn)結(jié)果進(jìn)行對(duì)比,如表2-1如下:表2-1模型對(duì)比結(jié)果MAERMSER2SAE22.5996832.7200360.9549491046518688CNNiBILSTM22.42355332.030030.9569004005739206CNN2BILSTM22.66000232.5081250.9554865502915436AECNN1BILSTM21.83085431.3658370.9585459328801831從實(shí)驗(yàn)結(jié)果可以看出,CNN_BILSTM模型比SAE精確度高,同時(shí),對(duì)CNN進(jìn)行一定的連接改動(dòng)不會(huì)提升預(yù)測(cè)精度,但經(jīng)過數(shù)據(jù)擴(kuò)展,模型的預(yù)測(cè)效果有了一定提升。3.后期擬完成的研究工作及進(jìn)度安排后期擬完成的研究工作如下:調(diào)節(jié)參數(shù),找到更合適的網(wǎng)絡(luò)層數(shù),優(yōu)化模

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論