5月29日,在2018中國(guó)國(guó)際智能交通展覽會(huì)“智慧出行”專題報(bào)告會(huì)中,清華大學(xué)交通工程與地球空間信息研究所副所長(zhǎng)、清華大學(xué)-戴姆勒可持續(xù)交通聯(lián)合研究中心執(zhí)行主任李萌做了《大數(shù)據(jù)交通管理決助力智慧出行》的主題演講。以下內(nèi)容為ITS114整理發(fā)布,未經(jīng)李萌本人審核。
清華大學(xué)-戴姆勒可持續(xù)交通聯(lián)合研究中心執(zhí)行主任 李萌
1背 景
隨著新技術(shù)的不斷發(fā)展,我們看到了新興的互聯(lián)網(wǎng)企業(yè)在資本的推動(dòng)下,讓很多的數(shù)據(jù)成為了可能。
近幾年,我們看到交通信息從數(shù)字化向數(shù)據(jù)化過渡,數(shù)據(jù)化向數(shù)據(jù)服務(wù)轉(zhuǎn)化。我們發(fā)現(xiàn),在這里仍然存在一些缺陷和病毒。目前的政策沒有完全基于量化的分析和量化的管理,車輛畫像難以建立,警衛(wèi)部署缺乏量化的支撐,我們應(yīng)該要把數(shù)據(jù)去落到實(shí)處。
數(shù)據(jù)已經(jīng)出現(xiàn)卻幫不上忙,為什么會(huì)存在這樣的問題呢?我們列舉了以下幾點(diǎn):
▼數(shù)據(jù)孤島
許多行業(yè)中數(shù)據(jù)確實(shí)出現(xiàn)了,各個(gè)部門的數(shù)據(jù)也出現(xiàn)了。但是許多人認(rèn)為數(shù)據(jù)是“新的石油、新的資產(chǎn)、新的金礦”,大家都想去挖取。許多管理部門過高地估計(jì)了數(shù)據(jù)的價(jià)值,他們普遍存在管理的屏障和管理的困難。
▼無法便捷提取并分析
一方面,數(shù)據(jù)本身沒有足夠的工具去保證,包括個(gè)人隱私問題。我們并不能因?yàn)殡[私問題而不去分析數(shù)據(jù),我們可以研發(fā)一些分析辦法,在保障個(gè)人隱私的情況下,讓數(shù)據(jù)本身的價(jià)值發(fā)揮出來。另一方面,它和交通學(xué)界有關(guān),長(zhǎng)期以來,我們的數(shù)據(jù)系統(tǒng)幫助我們的規(guī)劃、管理、決策。這樣的模型實(shí)際是基于小樣的數(shù)據(jù),所以我們?cè)趶氐鬃兏锝煌ǖ慕J侄危@也是一個(gè)過程。
另外,我們交通行業(yè)在發(fā)展交通大數(shù)據(jù)的時(shí)候,我們更多的不是提及數(shù)據(jù)科學(xué)。我們的優(yōu)勢(shì)是對(duì)行業(yè)的理解和深度把握、知道行業(yè)的需要,在這里,更多需要的是決策科學(xué)。我們現(xiàn)在想去推動(dòng)的是,怎么樣基于這樣大量的數(shù)據(jù),用數(shù)據(jù)驅(qū)動(dòng)的方法、數(shù)據(jù)的思維模式去改變我們現(xiàn)在的一些思維和決策的方法。
2數(shù)據(jù)模型支撐交通管理決策
從2012年開始,隨著各方面的合作和中心重要人員的加入,我們的數(shù)據(jù)開拓了一個(gè)新的市場(chǎng)。很多傳統(tǒng)的、單獨(dú)管理部門的檢測(cè)數(shù)據(jù)和社會(huì)、企業(yè)相結(jié)合,包括和高德浮動(dòng)車的數(shù)據(jù)合作、公交集團(tuán)公交車的數(shù)據(jù)和公交刷卡的信息、交通事故以及地磁檢測(cè)的數(shù)據(jù),這樣的數(shù)據(jù)匯總起來,融合交叉碰撞進(jìn)行一系列研究。
我們研究包括擁堵機(jī)理及治堵建議、交通事故分析、公交線路優(yōu)化研究、信號(hào)評(píng)價(jià)方法研究以及交通流等等最基礎(chǔ)的理論。
我重點(diǎn)介紹以下幾個(gè)方面:
▼基于可預(yù)測(cè)性的旅行時(shí)間可靠性度量
旅行時(shí)間的預(yù)測(cè)在交通服務(wù)中是關(guān)注的要點(diǎn),所以我們對(duì)此做了一個(gè)根本性的研究。
例如:一周旅行時(shí)間,分為周一至周五,在特定的場(chǎng)景和特定的時(shí)間下,不同的旅行時(shí)間波動(dòng)大不一定意味著旅行時(shí)間的不可靠,周一至周五的旅行時(shí)間雖然變化很大,但是像以上情況每周基本不變,通勤者是可以提前感知到每天的行程,根據(jù)合格時(shí)間可以進(jìn)行可預(yù)測(cè)性或不可預(yù)測(cè)性分析。
旅行時(shí)間的可靠性是通過其波動(dòng)的不可預(yù)測(cè)性,主要有兩種類型的變化:不規(guī)則性事件(例如交通事故和崩潰)和常規(guī)波動(dòng)(例如日常需求變化)。
如果用可預(yù)測(cè)性的方法,可以有效對(duì)這兩個(gè)信息進(jìn)行交流,這樣就可以區(qū)別于傳統(tǒng),只看波動(dòng)性,就認(rèn)為系統(tǒng)穩(wěn)定性差,為此做出很多的糾正。
另外,標(biāo)準(zhǔn)差的變化跟時(shí)間的序列有關(guān)系,所以我們?nèi)我庹{(diào)整他們的關(guān)系并不會(huì)影響功能性,但是調(diào)整這樣的順序?qū)ξ覀兂掷m(xù)變化的模式產(chǎn)生巨大的影響。我們做了一些實(shí)驗(yàn)去隨機(jī)任意的調(diào)整數(shù)據(jù)的順序和次序,發(fā)現(xiàn)調(diào)整的越亂可預(yù)測(cè)性的部分就會(huì)變得越來越差,整個(gè)模式也變得越來越差。
我們同時(shí)對(duì)道路,例如快速路、高速路、主干路和次干路也做了不同的數(shù)據(jù)分析,通過不同的計(jì)算方法發(fā)現(xiàn)了UBP它對(duì)異常的波動(dòng)越少,可預(yù)測(cè)性越高。UBP能在一定程度識(shí)別出一周的旅行時(shí)間的額變化模式,從預(yù)測(cè)性的角度反映人們對(duì)旅行時(shí)間可靠性的感知。
UBP與小波變換的聚集系數(shù)呈正相關(guān),對(duì)于一級(jí)二級(jí)道路,UBP和傅里葉變換的聚集系數(shù)呈正相關(guān)(高頻波動(dòng)越少,UBP越高),但對(duì)與快速路,較低的聚集系數(shù)的高頻成分會(huì)呈現(xiàn)更高的UBP,因此我們可以推測(cè),快速路的周期性更強(qiáng),對(duì)高頻(短周期)的波動(dòng)更不敏感。
▼基于深度學(xué)習(xí)模型的旅行時(shí)間預(yù)測(cè)
旅行時(shí)間預(yù)測(cè)面臨諸多挑戰(zhàn),對(duì)比于高速路、快速路、城市路網(wǎng)交通流的特性更為復(fù)雜;路網(wǎng)空間拓?fù)浣Y(jié)構(gòu)復(fù)雜,傳統(tǒng)模型很難考慮空間關(guān)聯(lián)性;多步預(yù)測(cè)準(zhǔn)確度低。
旅行時(shí)間預(yù)測(cè)可為我們的交通管理提供信息支撐,即為導(dǎo)航應(yīng)用提供核心支撐;從被動(dòng)式交通管理轉(zhuǎn)變?yōu)橹鲃?dòng)式交通管理,動(dòng)態(tài)路徑誘導(dǎo)實(shí)現(xiàn)路網(wǎng)流量均衡分配。
旅行時(shí)間預(yù)測(cè),我們?cè)诰矸e神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)之上應(yīng)用新一代圖卷積神經(jīng)網(wǎng)絡(luò),利用圖譜理論將卷積運(yùn)算推廣到非歐數(shù)據(jù),適用于提取交通路網(wǎng)空間信息。
我們選取交通指揮網(wǎng)絡(luò),通過傳統(tǒng)的交通流理論,提出了關(guān)鍵的特征,在此基礎(chǔ)上搭建圖卷積神經(jīng)網(wǎng)絡(luò)的模型,我們現(xiàn)在能夠通過結(jié)合空間特征,圖卷積神經(jīng)網(wǎng)絡(luò)的模型更好的預(yù)測(cè)出交通流劇烈地變化,而傳統(tǒng)模型具有明顯的滯后現(xiàn)象。
▼城市動(dòng)態(tài)特征分析—非直線系數(shù)分析
城市中小汽車的繞行是廣泛存在的,基于大數(shù)據(jù)不同城市非直線系數(shù)分析能夠幫助我們深入理解城市路網(wǎng)的拓?fù)浣Y(jié)構(gòu)和出行規(guī)律。
我們將中國(guó)北京、廣州、天津、成都的數(shù)據(jù)融合在一起,同時(shí)把紐約的數(shù)據(jù)也整理出來,在紐約的路網(wǎng)里是否也存在為了減少旅行時(shí)間去選擇大量繞行的相關(guān)分析。在這個(gè)分析中,首先對(duì)比北京、廣州和成都最短路徑繞行比率。最短路平均值以成都為基準(zhǔn),北京高2.73% 廣州高1.64%,額外的繞行三個(gè)城市對(duì)比北京超過廣州廣州超過成都。
因此,我們可以看出,繞行的原因跟路網(wǎng)相關(guān)。北京的路網(wǎng)尺度較大,一旦繞行相對(duì)于其他城市繞行時(shí)間更多,路網(wǎng)的密度也是一個(gè)關(guān)鍵指標(biāo),路網(wǎng)密度在北京5.59/平方公里、廣州7.02/平方公里、成都8.0/平方公里,成都是最為密集的路網(wǎng),選擇最短的時(shí)間之后繞行的距離較短。
另外,現(xiàn)在的城市交通也面臨這一個(gè)新的問題,導(dǎo)航堵。隨著出行導(dǎo)航普及率較高的條件下,由于過多人,同時(shí)走導(dǎo)航推薦道路而產(chǎn)生交通擁堵的情況,數(shù)據(jù)顯示,只有50%-60%的車輛通過導(dǎo)航推薦路徑繞行而提升平均速度,降低旅行時(shí)間。
主要原因在于,現(xiàn)在的導(dǎo)航軟件發(fā)布信息的滯后性,交通誘導(dǎo)僅從用戶均衡的角度考慮,導(dǎo)航軟件應(yīng)開發(fā)路況預(yù)測(cè)信息,方便司機(jī)提前決策,并從全局最優(yōu)角度考慮誘導(dǎo)策略,實(shí)現(xiàn)群體誘導(dǎo)和個(gè)體誘導(dǎo)相結(jié)合。
3數(shù)據(jù)分析能力平臺(tái)化
我們正在嘗試把分析合作工具化、服務(wù)進(jìn)行平臺(tái)化,我們希望以平臺(tái)作為一個(gè)載體,數(shù)據(jù)作為一個(gè)基礎(chǔ),利用工具去挖掘已有的數(shù)據(jù),做一些相關(guān)的服務(wù)支撐。
基于我們對(duì)行業(yè)、對(duì)交通管理的理解,我們提出這種報(bào)告分析的體系。這個(gè)報(bào)告的體系基于不同的數(shù)據(jù),包括互聯(lián)網(wǎng)數(shù)據(jù)、各類的交通的數(shù)據(jù)以及我們建立的大數(shù)據(jù)的平臺(tái)。
我們提出一系列管理職能相關(guān)的工具和分析手段,可自由地選取分析目標(biāo)的區(qū)域、參數(shù)、時(shí)段及展示方式,從而得出有效的分析結(jié)果標(biāo)準(zhǔn)化工具。
4數(shù)據(jù)輔助決策案例
1、針對(duì)大型事件分析及警力部署
在天津全運(yùn)會(huì)主要場(chǎng)館區(qū)域之內(nèi),我們通過歷史數(shù)據(jù)的變化分析他們常態(tài)化的數(shù)據(jù),然后累加上可能會(huì)發(fā)生的事件,分別從中觀、微觀角度對(duì)比分析路況擁堵情況,并通過有效的交通優(yōu)化管理決策實(shí)現(xiàn)整個(gè)區(qū)域的優(yōu)化。
2、 交通組織輔助決策
針對(duì)施工占道等問題,我們可以識(shí)別主要影響路口位置,提取主要影響路徑,最后根據(jù)道路承載力及路網(wǎng)結(jié)構(gòu)設(shè)計(jì)最優(yōu)交通組織方案。
5總 結(jié)
數(shù)據(jù)移動(dòng)互聯(lián)網(wǎng)技術(shù)、物聯(lián)網(wǎng)感知技術(shù)推動(dòng)多種交通信息來源的涌現(xiàn),決策分析已具備數(shù)字化基礎(chǔ),但我們?nèi)匀蝗狈?shù)據(jù)驅(qū)動(dòng)的決策科學(xué)思維與研究,需要一系列數(shù)據(jù)模型支撐交通管理決策。另外,案例表明,交通大數(shù)據(jù)要“接地氣”,不能只有大腦。
掃一掃在手機(jī)上閱讀本文章