用出租車GPS數(shù)據(jù)分析深圳道路交通情況_第1頁
用出租車GPS數(shù)據(jù)分析深圳道路交通情況_第2頁
用出租車GPS數(shù)據(jù)分析深圳道路交通情況_第3頁
用出租車GPS數(shù)據(jù)分析深圳道路交通情況_第4頁
用出租車GPS數(shù)據(jù)分析深圳道路交通情況_第5頁
已閱讀5頁,還剩9頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、 D題:用出租車GPS數(shù)據(jù)分析深圳道路交通情況各大城市出租車越來越多的安裝了GPS終端,這些終端能夠每隔1分鐘向出租車管理中心發(fā)送本車的位置、速度和方向等信息,是車輛GPS實時數(shù)據(jù)。原始數(shù)據(jù)主要保存出租車上裝配的GPS終端所采集的數(shù)據(jù),這些數(shù)據(jù)包括序號,車牌號碼,GPS時間,經(jīng)度,緯度,車輛狀態(tài)(空車、重車),車輛速度,車輛方向(8個方向)等信息。附注網(wǎng)站提供了深圳市出租車GPS數(shù)據(jù),從這些數(shù)據(jù)你是否能夠:1. 根據(jù)出租車載客的起訖點,結(jié)合深圳市的交通地圖,恰當(dāng)?shù)膭澐纸煌ㄐ^(qū),并選擇小區(qū)中的某一點,用其經(jīng)緯數(shù)值作為該小區(qū)的坐標。2. 根據(jù)小區(qū)劃分和出租車GPS數(shù)據(jù),給出載客出租車的OD時空分布

2、。如:某時刻從坐標到、的出租車有多少輛。3. 由此,在合理的假設(shè)條件下,能否對人們出行的OD時空分布進行推斷?4. 根據(jù)出租車載客后的行駛數(shù)據(jù),篩選出擁堵的路段時段以及擁堵的路口時段。擁堵的標準自己設(shè)定,如某路段在某個時段平均行駛速度小于多少公里/小時(比如,10公里/小時),可認為是擁堵。附注:部分有關(guān)資料請上網(wǎng)站,在數(shù)學(xué)建?;A(chǔ)數(shù)據(jù)頁之交通問題基礎(chǔ)數(shù)據(jù)下載:深圳出租車GPS數(shù)據(jù),數(shù)據(jù)文件較大,我們分解成若干個小文件提供。摘要 一個完整的城市交通系統(tǒng)非常龐大、復(fù)雜,這種情況使得數(shù)學(xué)建模交通問題分析求解的困難、復(fù)雜度提高,將完整的城市交通系統(tǒng)按照交通流向、路網(wǎng)布局等特性劃分為若干交通小區(qū),然后

3、對不同的交通小區(qū)進行數(shù)學(xué)建模,可以有效地降低這種復(fù)雜性。各大城市出租車越來越多的安裝了GPS終端,這些終端能夠每隔1分鐘向出租車管理中心發(fā)送本車的位置、速度和方向等信息,是車輛GPS實時數(shù)據(jù)。原始數(shù)據(jù)主要保存出租車上裝配的GPS終端所采集的數(shù)據(jù)目前對于交通小區(qū)的研究主要集中在應(yīng)用層次,本文針對交通出行數(shù)據(jù)的空間分布特征,利用 K-Means 空間聚類算法進行交通小區(qū)的自動劃分,為城市交通系統(tǒng)的管理、控制及規(guī)劃提供技術(shù)支持,對交通出行數(shù)據(jù)進行優(yōu)化,抽取出租車載客過程中乘客上下車的 GPS 位置坐標?;诰垲惻c交通小區(qū)劃分的相似性,采用 K- Means 聚類法進行交通小區(qū)的劃分。首先,通過聚類得

4、到交通出行 OD 矩陣,然后據(jù)此劃分出交通小區(qū)?;?Google Maps API,搭建了軟件平臺。通過試驗可以看出,這種動態(tài)劃分方法得到的區(qū)域能夠與現(xiàn)有的交通小區(qū)相吻合。這種高實時的交通小區(qū)劃分方法將對動態(tài)的 OD 估計有著極大的參考價值。關(guān)鍵詞:GPS;交通小區(qū);K-Means ;空間聚類算法;動態(tài)分析;k 均值聚類;邊界計算一、問題重述各大城市出租車越來越多的安裝了GPS終端,這些終端能夠每隔1分鐘向出租車管理中心發(fā)送本車的位置、速度和方向等信息,是車輛GPS實時數(shù)據(jù)。原始數(shù)據(jù)主要保存出租車上裝配的GPS終端所采集的數(shù)據(jù)。 問題一,根據(jù)出租車載客的起訖點,結(jié)合深圳市的交通地圖,恰當(dāng)?shù)膭?/p>

5、分交通小區(qū),并選擇小區(qū)中的某一點,用其經(jīng)緯數(shù)值作為該小區(qū)的坐標。問題二, 根據(jù)小區(qū)劃分和出租車GPS數(shù)據(jù),給出載客出租車的OD時空分布。如:某時刻從坐標到、的出租車有多少輛。問題三, 由此,在合理的假設(shè)條件下,能否對人們出行的OD時空分布進行推斷?問題四, 根據(jù)出租車載客后的行駛數(shù)據(jù),篩選出擁堵的路段時段以及擁堵的路口時段。擁堵的標準自己設(shè)定,如某路段在某個時段平均行駛速度小于多少公里/小時(比如,10公里/小時),可認為是擁堵。2、 模型假設(shè) 一般來說,交通小區(qū)的劃分應(yīng)該遵循以下原則:(1) 同質(zhì)性,分區(qū)內(nèi)的經(jīng)濟 社會等特性盡量一致;(2) 小區(qū)劃分盡量不打破行政區(qū)的劃分,以便可以利用行政區(qū)

6、的統(tǒng)計資料; (3) 分區(qū)數(shù)量適當(dāng),中等城市不超過 50 個,大城市最多不超過100-150 個 數(shù)量太多將加重規(guī)劃的工作量,數(shù)量太少又會降低調(diào)查和分析的精度;(4) 對于已做過 OD調(diào)查的城市,最好維持原已劃分的小區(qū)。三、符號說明1.name車牌號2.time采集時間點(格式:YYYY/MM/DD hh:mm:ss)3.jd 經(jīng)度4.wd 緯度5.status車輛狀態(tài)(0非打表,即:空載;1已打表,即:重載)6.v 車速(單位為:km/h)7.angle行車方向(0東;1東南;2南;3西南;4西;5西北;6北;7東北)四、 問題分析與模型建立4.1對問題的分析和模型建立 4.1.1 交通小區(qū)

7、概念 交通小區(qū)是具有一定交通關(guān)聯(lián)度和相似度的節(jié)點或連線的集合,反映了城市路網(wǎng)交通特征的時空變化特性、交通小區(qū)具有同質(zhì)性、關(guān)聯(lián)性、動態(tài)性、穩(wěn)定性、自組織性等特性。交通小區(qū)的劃分是分析城市交通網(wǎng)絡(luò)的一個很好的方式,因為交通小區(qū)內(nèi)具有相似的交通特征和較強的交通關(guān)聯(lián)性交通小區(qū)的劃分與該城市的人口 面積 經(jīng)濟特征 產(chǎn)業(yè)結(jié)構(gòu)等密切相關(guān),并在一定程度上反應(yīng)了一個城市的吸引力 4.1.2 交通小區(qū)劃分概況 國內(nèi)部分城市在不同時期的交通小區(qū)的平均面積可以看出,單個小區(qū)的平均面積有逐年變小的趨勢,劃分小區(qū)的數(shù)量在逐漸增加,傳統(tǒng)的進行交通小區(qū)劃分的方法主要基于大規(guī)模的人工抽樣調(diào)查,這種劃分方法成本高、周期長,調(diào)查的

8、數(shù)據(jù)存在抽樣率低、抽樣統(tǒng)計的精度不高、數(shù)據(jù)更新周期長等問題。由于我國大部分城市正處于快速發(fā)展期,土地利用不斷變化,人口高速增長,通過這種方式進行交通小區(qū)的劃分時效性較差。本文通過交通出行數(shù)據(jù)的聚類運算,提供實時的交通小區(qū)的分布狀態(tài),這種快速、動態(tài)的劃分方法彌補了傳統(tǒng)劃分方式的不足。 原始出租車數(shù)據(jù) 設(shè)定精度E 數(shù)據(jù)預(yù)處理 隨機選擇數(shù)據(jù)中心 M尋找距離最近的聚類中心井入組 M+ 更新數(shù)據(jù)中心計算方差E(M) E(M)E 否 是E(M-1)E 否 包含中心點的數(shù)據(jù)聚類 是 交通小區(qū) 邊界計算 圖1 交通小區(qū)分過程 五、 模型求解5 .1基于 K均值聚類算法的交通小區(qū)劃分方法 5.1.1 劃分方法

9、本劃分方法首先對坐標數(shù)據(jù)進行空間聚類運算,得到出行起訖點的 OD矩陣,最后以此為依據(jù)進行交通小區(qū)的劃分劃分過程如圖 1所示。 5.1.2 出租車 GPS 數(shù)據(jù)預(yù)處理 試驗中所用到的數(shù)據(jù)來源于北京奇華通訊有限公司,主要包括車輛 GPS實時數(shù)據(jù)和車輛類型等相關(guān)數(shù)據(jù)信息,原始數(shù)據(jù)表主要保存了出租車上裝配的 GPS終端所采集的數(shù)據(jù),這些數(shù)據(jù)包括車牌號時間經(jīng)緯度速度以及該車的空重車狀態(tài)等。由于每天的數(shù)據(jù)量龐大(2.5 千萬條 / 天),基于縮短數(shù)據(jù)查詢時間以及提高整體運算性能等方面的考慮,需要對原始數(shù)據(jù)進行優(yōu)化。原始數(shù)據(jù)內(nèi)容見表4。表4 原始表據(jù)nametimeJdwdstatusVangle粵B00D

10、102011/04/18 00:00:05113.58599923.1332740620粵B4906B2011/04/18 00:00:10113.88836722.780216004粵B00D162011/04/18 00:00:04114.05538222.625116052粵B5223B2011/04/18 00:00:49114.01363422.665283101粵B5357B2011/04/18 00:00:30114.04508222.7112670406粵B5996D2011/04/18 00:00:28113.92620822.5657670333粵B6618E2011/04

11、/18 00:00:28114.06033322.526083006 其中status字段代表的是出租車的空重車狀態(tài),當(dāng)值為 0 時表示車的狀態(tài)為空車,值為 1 時表示車的狀態(tài)為重車當(dāng)status值由 0 變?yōu)?1 時,status值為 1 的車的位置即為乘客上車時的位置;相反地,乘客下車時的位置也可以得到 根據(jù)這一特性剔除原始表中的無用數(shù)據(jù),優(yōu)化后的數(shù)據(jù)見表 5。表5 優(yōu)化后的數(shù)據(jù)nametimeJdwdstatusVangle粵B00D162011/04/18 00:00:04114.05538222.625116052粵B5223B2011/04/18 00:00:49114.01363

12、422.665283101粵B5357B2011/04/18 00:00:30114.04508222.7112670406 5.1.3 聚類計算 經(jīng)過上一步的數(shù)據(jù)優(yōu)化,即可得到由起訖點數(shù)據(jù)組成的數(shù)據(jù)集,現(xiàn)在需要對這些數(shù)據(jù)進行聚類運算:一段時間內(nèi)的起點或者訖點被劃分為若干個區(qū)域,每個區(qū)域中的點分布緊湊,區(qū)域與區(qū)域之間自然分開。本文采用了K-Means聚類算法,K-Means 聚類算法是一種分割式聚類方法,它是數(shù)據(jù)挖掘技術(shù)中一種經(jīng)典的基于劃分的聚類算法,其目的在于從大量數(shù)據(jù)點中找出具有代表性的數(shù)據(jù)點,即中心點,然后再根據(jù)這些中心點進行后續(xù)的處理K-Means 算法采用了迭代更新的運算思想,聚類過

13、程如下: 首先從 n 個數(shù)據(jù)點隨機選擇 k 個點作為初始聚類中心;通過運算其它點與這些聚類中心點的相似度(距離),將其分別分配給與其相似度最高(距離最近)的中心點所在的聚類;然后對劃分好后的聚類重新運算聚類中心。這一過程不斷重復(fù)直到標準測度函數(shù)開始收斂。 5.1.4 對區(qū)域數(shù)據(jù)進行邊界運算 聚類運算結(jié)束之后,得到若干組包含中心點在內(nèi)的一些坐標點,如圖 2 所示(點 X表示出租車的坐標點,實心圓點表示交通小區(qū)中心) 將所有聚類后的坐標通過 GIS平臺輸出,通過這種方式很難看出不同區(qū)域之間的界線 這時需要將區(qū)域的邊界繪制出來。本文采用的邊界運算過程如下:首先建立平面直角坐標系,將坐標系以(0,0)

14、為中心點均分為 n等份區(qū)域(n 的值將決定邊界運算結(jié)果的精度),每個區(qū)域的角度為360/n,如圖 3所示圖 3 360度分為n份 圖4 距離中心點的距離 然后,將某個聚類的點集放入該坐標系,使得區(qū)域中心點與坐標原點重合,通過計算其它點與中心所形成的角的正余弦,即可得到每個點與中心點所形成的夾角,進而將這些點歸入上一步所劃分的區(qū)域。 依次計算第i個區(qū)域里每個點距離中心點的距離,記錄距離中心點最遠的點為ci,如圖4中P點等最后,將這所有的 ci 點相連接,即可得到點集的相應(yīng)邊界,如圖5 所示5.2 試驗平臺搭建與實例分析 5.2.1 試驗平臺搭建 為了檢驗劃分結(jié)果的準確度,本文搭建了具有 GIS功

15、能的試驗平臺平臺,使用 Java 語言進行開發(fā),GIS功能采用GoogleMapsAPI解決方案。平臺通信過程如圖6 所示 5.2.2 實例分析 通過上述方法,利用2008年8月3號北京市出租車 GPS數(shù)據(jù)進行交通小區(qū)的劃分,并將劃分結(jié)果輸出到 GIS平臺上,如圖7 所示 可以看出這種動態(tài)劃分方法產(chǎn)生的結(jié)果能夠與現(xiàn)有的部分交通小區(qū)相吻合(標注 A為CBD小區(qū),標注 B為西郊小區(qū)),詳細的 OD矩陣數(shù)據(jù)見表 6 表6中 O 代表起點,D 代表訖點,比如坐標位置(2, 5)的值為 2,代表某一段時間內(nèi),共有 2 輛出租車從 5 號區(qū)域前往 2 號區(qū)域,并且乘客是在5 號區(qū)域上車,在 2號區(qū)域下車六

16、、模型評價與推廣6.1 模型評價:本文通過對出租車GPS數(shù)據(jù)進行聚類運算,快速計算出不同時間段內(nèi)出租車載客 OD矩陣,進而將劃分好的區(qū)域在GIS平臺中顯示出來。從實驗結(jié)果可以看出:這種劃分方法能夠反映出不同時間段內(nèi)交通小區(qū)的絕對動態(tài)性以及相對穩(wěn)定性的特征,對城市交通小區(qū)的劃分具有很高的參考價值。但本文所使用的交通小區(qū)劃分方法也存在一定的不足:首先,劃分算法使用了純粹的 K-Means 空間聚類法,沒有與現(xiàn)有的位置屬性相結(jié)合,比如住宅區(qū)、商業(yè)區(qū)等屬性;其次,算法沒有對出租車的特殊數(shù)據(jù)和異常數(shù)據(jù)進行處理,比如紅綠燈停車 GPS信號機發(fā)生故障等情況,這些都將影響最終結(jié)果的準確性;再次,針對特定時間段進行交通小區(qū)的劃分更有代表性,比如早晚高峰等,本文沒有對此展開討論,這些都是今后的改進方向。 6.2 模型推廣:本文中的模型都是在綜合考慮了各種不同情況下得出的滿足實際需求的優(yōu)化模型,因此它的適用性很強,可以推廣到很多類似的現(xiàn)實問題。七、參考文獻1李曉丹,楊曉光,陳華杰.城市道路網(wǎng)絡(luò)交通小區(qū)劃分方法研究.計算機工程與應(yīng)用, 2009,45(5):19-22.2楊波,劉海洲.基于聚類分析的交通小區(qū)劃分方法的改進.交通與運輸, 2007,(7):23-26.3徐吉謙.交通工程總論.北京:人民交通出版社,2003.4馬超群,王

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論