李萌:数据模型支撑交通管理决策
- 来源:智慧交通 作者: ITS114
- 2018/6/1 9:22:1546208
【中国安防展览网 视点跟踪】5月29日,在2018中国智能交通展览会“智慧出行”专题报告会中,清华大学交通工程与地球空间信息研究所副所长、清华大学-戴姆勒可持续交通联合研究中心执行主任李萌做了《大数据交通管理决助力智慧出行》的主题演讲。以下内容为ITS114整理发布,未经李萌本人审核。
背景
随着新技术的不断发展,我们看到了新兴的互联网企业在资本的推动下,让很多的数据成为了可能。
近几年,我们看到交通信息从数字化向数据化过渡,数据化向数据服务转化。我们发现,在这里仍然存在一些缺陷和病毒。目前的政策没有完全基于量化的分析和量化的管理,车辆画像难以建立,警卫部署缺乏量化的支撑,我们应该要把数据去落到实处。
数据已经出现却帮不上忙,为什么会存在这样的问题呢?我们列举了以下几点:
▼数据孤岛
许多行业中数据确实出现了,各个部门的数据也出现了。但是许多人认为数据是“新的石油、新的资产、新的金矿”,大家都想去挖取。许多管理部门过高地估计了数据的价值,他们普遍存在管理的屏障和管理的困难。
▼无法便捷提取并分析
一方面,数据本身没有足够的工具去保证,包括个人隐私问题。我们并不能因为隐私问题而不去分析数据,我们可以研发一些分析办法,在保障个人隐私的情况下,让数据本身的价值发挥出来。另一方面,它和交通学界有关,长期以来,我们的数据系统帮助我们的规划、管理、决策。这样的模型实际是基于小样的数据,所以我们在彻底变革交通的建模手段,这也是一个过程。
另外,我们交通行业在发展交通大数据的时候,我们更多的不是提及数据科学。我们的优势是对行业的理解和深度把握、知道行业的需要,在这里,更多需要的是决策科学。
我们现在想去推动的是,怎么样基于这样大量的数据,用数据驱动的方法、数据的思维模式去改变我们现在的一些思维和决策的方法。
数据模型支撑交通管理决策
从2012年开始,随着各方面的合作和中心重要人员的加入,我们的数据开拓了一个新的市场。很多传统的、单独管理部门的检测数据和社会、企业相结合,包括和高德浮动车的数据合作、公交集团公交车的数据和公交刷卡的信息、交通事故以及地磁检测的数据,这样的数据汇总起来,融合交叉碰撞进行一系列研究。
我们研究包括拥堵机理及治堵建议、交通事故分析、公交线路优化研究、信号评价方法研究以及交通流等等基础的理论。
我重点介绍以下几个方面:
▼基于可预测性的旅行时间可靠性度量
旅行时间的预测在交通服务中是关注的要点,所以我们对此做了一个根本性的研究。
例如:一周旅行时间,分为周一至周五,在特定的场景和特定的时间下,不同的旅行时间波动大不一定意味着旅行时间的不可靠,周一至周五的旅行时间虽然变化很大,但是像以上情况每周基本不变,通勤者是可以提前感知到每天的行程,根据合格时间可以进行可预测性或不可预测性分析。
旅行时间的可靠性是通过其波动的不可预测性,主要有两种类型的变化:不规则性事件(例如交通事故和崩溃)和常规波动(例如日常需求变化)。
如果用可预测性的方法,可以有效对这两个信息进行交流,这样就可以区别于传统,只看波动性,就认为系统稳定性差,为此做出很多的纠正。
另外,标准差的变化跟时间的序列有关系,所以我们任意调整他们的关系并不会影响功能性,但是调整这样的顺序对我们持续变化的模式产生巨大的影响。我们做了一些实验去随机任意的调整数据的顺序和次序,发现调整的越乱可预测性的部分就会变得越来越差,整个模式也变得越来越差。
我们同时对道路,例如快速路、高速路、主干路和次干路也做了不同的数据分析,通过不同的计算方法发现了UBP它对异常的波动越少,可预测性越高。UBP能在一定程度识别出一周的旅行时间的额变化模式,从预测性的角度反映人们对旅行时间可靠性的感知。
UBP与小波变换的聚集系数呈正相关,对于一级二级道路,UBP和傅里叶变换的聚集系数呈正相关(高频波动越少,UBP越高),但对与快速路,较低的聚集系数的高频成分会呈现更高的UBP,因此我们可以推测,快速路的周期性更强,对高频(短周期)的波动更不敏感。
▼基于深度学习模型的旅行时间预测
旅行时间预测面临诸多挑战,对比于高速路、快速路、城市路网交通流的特性更为复杂;路网空间拓扑结构复杂,传统模型很难考虑空间关联性;多步预测准确度低。
旅行时间预测可为我们的交通管理提供信息支撑,即为导航应用提供核心支撑;从被动式交通管理转变为主动式交通管理,动态路径诱导实现路网流量均衡分配。
旅行时间预测,我们在卷积神经网络的基础之上应用新一代图卷积神经网络,利用图谱理论将卷积运算推广到非欧数据,适用于提取交通路网空间信息。
我们选取交通指挥网络,通过传统的交通流理论,提出了关键的特征,在此基础上搭建图卷积神经网络的模型,我们现在能够通过结合空间特征,图卷积神经网络的模型更好的预测出交通流剧烈地变化,而传统模型具有明显的滞后现象。
▼城市动态特征分析—非直线系数分析
城市中小汽车的绕行是广泛存在的,基于大数据不同城市非直线系数分析能够帮助我们深入理解城市路网的拓扑结构和出行规律。
我们将中国北京、广州、天津、成都的数据融合在一起,同时把纽约的数据也整理出来,在纽约的路网里是否也存在为了减少旅行时间去选择大量绕行的相关分析。在这个分析中,首先对比北京、广州和成都短路径绕行比率。短路平均值以成都为基准,北京高2.73% 广州高1.64%,额外的绕行三个城市对比北京超过广州广州超过成都。
因此,我们可以看出,绕行的原因跟路网相关。北京的路网尺度较大,一旦绕行相对于其他城市绕行时间更多,路网的密度也是一个关键指标,路网密度在北京5.59/平方公里、广州7.02/平方公里、成都8.0/平方公里,成都是为密集的路网,选择短的时间之后绕行的距离较短。
另外,现在的城市交通也面临这一个新的问题,导航堵。随着出行导航普及率较高的条件下,由于过多人,同时走导航推荐道路而产生交通拥堵的情况,数据显示,只有50%-60%的车辆通过导航推荐路径绕行而提升平均速度,降低旅行时间。
主要原因在于,现在的导航软件发布信息的滞后性,交通诱导仅从用户均衡的角度考虑,导航软件应开发路况预测信息,方便司机提前决策,并从全局优角度考虑诱导策略,实现群体诱导和个体诱导相结合。
数据分析能力平台化
我们正在尝试把分析合作工具化、服务进行平台化,我们希望以平台作为一个载体,数据作为一个基础,利用工具去挖掘已有的数据,做一些相关的服务支撑。
基于我们对行业、对交通管理的理解,我们提出这种报告分析的体系。这个报告的体系基于不同的数据,包括互联网数据、各类的交通的数据以及我们建立的大数据的平台。
我们提出一系列管理职能相关的工具和分析手段,可自由地选取分析目标的区域、参数、时段及展示方式,从而得出有效的分析结果标准化工具。
数据辅助决策案例
1、针对大型事件分析及警力部署
在天津全运会主要场馆区域之内,我们通过历史数据的变化分析他们常态化的数据,然后累加上可能会发生的事件,分别从中观、微观角度对比分析路况拥堵情况,并通过有效的交通优化管理决策实现整个区域的优化。
2、 交通组织辅助决策
针对施工占道等问题,我们可以识别主要影响路口位置,提取主要影响路径,后根据道路承载力及路网结构设计优交通组织方案。
总 结
数据移动互联网技术、物联网感知技术推动多种交通信息来源的涌现,决策分析已具备数字化基础,但我们仍然缺乏数据驱动的决策科学思维与研究,需要一系列数据模型支撑交通管理决策。另外,案例表明,交通大数据要“接地气”,不能只有大脑。