王殿海教授:基于多源数据的交通分析案例
- 来源:智慧交通
- 2018/1/11 11:50:1839045
【中国安防展览网 企业关注】11月23日,由中国智能交通协会、公安部交通管理科学研究所、国家道路交通管理工程技术研究中心主办的2017’第十二届中国智能交通年会城市交通组织优化与控制论坛上,浙江大学交通研究院王殿海教授发表《基于多源数据的交通分析案例》的演讲,本文为速记整理,未经演讲者本人审核。鸣谢中国智能交通协会提供速记材料。
王殿海:各位下午好!今天下午我个讲,大家就当是开胃小菜了,后面有大餐。
多年来,我们一直想做交通评价方面的一个框架,不论是公安交管,还是城市管理都需要这份东西,但苦于一直没有数据,所以一直做不来。本次年会我的命题作文是交通评价,但不敢做这么大的内容,所以就点了“一盘小菜”。首先是建立交通评价的理论框架,其次是供需匹配和运行状态,三是交通系统复杂程度,四是管理的质量。这四方面,我也写了一些理论和过程,做了一个指标体系设计。今天分享几个小案例,和大家共同探讨。
应用案例1:基于手机信令的公交覆盖评价
交通评价中一个较重要的内容是城市公交的覆盖,谈公交的服务水平就会谈到公交服务覆概率。这个事情我想用手机信令的数据来评价分析公交覆盖,我们杭州五万多个基站,这是移动基站覆盖的情况,这是手机信令,我们可以把大概六百万左右出行者的运动轨迹描述出来。
手机信令和公交覆盖是怎么关联的?方圆五百米要有公交站点,是公交覆盖的概念,五百米半径覆盖要占多少?95%,还是?其实这个指标有问题,首先是覆盖面对人的出行吻合不太合适,因为这是空间的半径距离。一般来讲,公交站点覆盖的是二维,但是人出行还有一个时间维度,城市公交覆盖五百米没有时间的概念,这不是一个简单的半径问题,公交服务到底是什么水平?能不能跟手机运行轨迹匹配一下?
我做的就是这个事情。公交站点是有公交服务方向的,手机也有运动方向,和公交站点运动方向匹配。考虑出行习惯的时候,除了要和公交吻合以外,还要和开车一样,比如说开车和公交比较,综合成本考量应该选择什么出行?公交如果能覆盖,需要换乘几次?在这样情况下,就可以估计公交覆盖的情况。这个是我们的结果,实际上早高峰和晚高峰截然不同。
大家看这个图,这个是早高峰,这个是晚高峰,不同颜色公交覆盖的程度是不一样的,这个不直接,下面我们给直接的,左边这个是晚高峰,按手机信令覆盖的话,早高峰、晚高峰大概的覆盖程度是在0.3左右。也就是说公交覆盖与出行不太契合,按手机信令来看只有30%。这张图这个位置是按空间覆盖,接近90%多,但横向看手机信令覆盖是20%多,不到30%。可以得到一个结论,实际坐公交出行比较方便的人只有30%,公交分担率达不到百分之四五十,剩下的一些人要开车,不坐公交,所以公交分担率就上不去。这个分析大的作用,就是按照手机信令运动轨迹来优化公交站点的铺设。
应用案例2:基于车牌识别数据的在运车辆数计算
在一个城市里,或者一个路网中,有多少车辆在经常跑?限牌限号都要基于这个数据来做。车牌识别数据是公安交警都有的数据,比如说描述出行轨迹,时空分布,起始点的判断等。研究对象为在机动车道上行驶的城市机动车,以卡口布设点位作为出行的起讫点,将卡口数据按照车牌以时间顺序进行排列,可以得到每辆车经过的地点集合,即每辆车的出行路径。按照一次出行的定义,分别对卡口相邻记录行数据的时空信息进行筛选,将一条出行路径分割为若干次出行,得到出行的O点、中间点、D点以及出发、到达时间。将出行发生量与吸引量按照时间进行累计并做差值,得到任意时刻路网运行车辆数。
什么意思呢?我们叫打断出行链,如果有长期的数据,可以24小时不停的循环跟踪一辆车的轨迹,区分出不同的机动车出行模式 但是想知道滞留在路网上的车辆数,必须要把这个出行链条打断,什么意思?就是在时空两维意义上的停留,把它提出来,我们就可以计算O和D,进入路网多少车,出了路网多少车,用OD做差。
图上两个颜色,一个蓝色一个是粉色,一个是O,一个是D。从颜色来看,杭州市的几个结点,A点,早上送小孩的时候小高峰,B点上班早高峰,C点限号车带来的高峰,E点是晚上又一个高峰。OD做差得出来这张图就是路网上滞留的车辆数,把限号和不限号的高峰重合在一起了。所以这张路网上,大概只有七千辆左右的车,就形成了所说的堵车。这样的话,24小时都可以知道路上到底有多少车。从而为限号或是限牌决策,提供理论依据。
通勤车在城市交通当中究竟是起什么作用?我们经常说开车上班是城市交通里的重要组成部分。通过交警的车牌识别数据,我们可以来分析通勤车占的交通比重到底有多大?这件事儿的核心,还是要打断出行链的问题。这是一个比较具有交通涵义的,或者是交通学术意义的问题。怎么打断出行链?打断出行链以后,学术过程就不讲了。关键就是说,我们能打断出行链不要紧,得定义好什么叫通勤?指在工作时段内规律性地往返两地的机动车辆,一定要把通勤的概念搞清楚。除了一般的通勤以外,还有一种是高度依赖型通勤,大部分时间开车,有的是偶尔开车,今天分享的车牌识别分析是高度依赖。高度依赖型通勤是指一个月大概有65%左右的时间是开车上班,20天左右有超过13天是开车上班。
这是我们基于贵阳市2015年12月的卡口数据做的分析,贵阳登记有128万辆车,实际上我们每天能检测到上路的,平均85万。虽然上路未必能被抓拍到,但所有点位都抓不到的概率很低。贵阳高度依赖车辆通勤的大概有16.2万辆车。图上部的是周一到周五全部的车辆,底下的是周一到周五的通勤车辆,曲线是指不同时间占的比例。
应用案例3:基于电警数据的雨雪天交通运行状态评估
我们知道,一到下雨天就堵车,能不能用卡口数据分析一下,为什么下雨就堵?好多人说一下雨开车的人就多,后统计出的结果表明这不正确,一个月里面,下雨天和非雨天的车辆数是一样,没什么变化,下雨为什么堵了呢?这个也很容易分析,抓两个特点,一是车头时距怎么变,搞交通的都知道,通过估计饱和车头时据,计算通行能力折减。出行速度的变化,也影响了车辆输入输出的速度。
行程时间滤波流程图
饱和车头时距,这两个图的饱和车头时距不一样,晴天和下雨天差了0.2,损失的通行能力是百分之十几。行驶时间也增加了,一个固定的路程长度,雨天和晴天行驶时间差别很大。不同的雨,不同的雪,不同的天气是不一样的,但我们只找了两个雨天和晴天对比,就已经发现问题了。如果我们有常年的数据积累,会有更多的现象被挖掘出来。
我就讲这几个小案例,不是交通评价,是交通评价尾巴上的内容。如果要讲交通评价的话,像我前面讲大系统理论上的连接分析,也叫系统分析,现在这个显然不是。我们就做了一点点工作,和大家分享,作为开胃小菜,谢谢!
原标题 王殿海教授:基于多源数据的交通分析案例