智慧城市网

登录

“十三五” 安防领域机器视觉发展回顾与展望

来源:中国安防 作者:徐玉波
2020/9/28 10:18:2734061
  【安防展览网 企业关注】 2015年,由中国安防协会组织编撰了中国安防行业“十三五”发展规划,从国家战略、政策法规、“平安建设”推进、产业发展、市场应用、技术创新、行业发展、行业管理、问题和不足以及国内外等方面对中国安防行业的发展现状和发展环境进行了全*位、系统性的分析,高屋建瓴的提出了安防行业“十三五”发展目标和具体的措施建议,为中国安防行业发展指明了方向,规划了路线。“十三五”已步入尾声,徐玉波多年从事人工智能、机器视觉技术创新应用工作,就这一方面对“十三五”期间的发展做一个粗浅的回顾与分析,供同行批评指正。
 
  一、机器视觉技术发展与应用远超规划预期
 
  “十三五”规划在发展目标中提出“深入研究和应用人工智能、机器视觉等前沿技术并取得若干突破”;在措施与建议中提出要推动“机器视觉、语音识别、生物特征识别、安保机器人等关键技术的突破,提升智能技术在安防各领域的实战应用和效能”和视频结构化等智能化应用。从实际发展情况来看,在机器视觉技术突破和应用方面应该说是超出了“十三五”规划时的预期。
 
  以人像识别为代表的机器视觉技术在安防领域的应用在“十三五”期间得到了飞速的发展。早在2013年,徐玉波作为公安科技顾问参与某城市轨道交通安防系统的设计,就提出了利用人像识别技术来进行布控追逃的思路并得到了主管单位的认可,为此分别在2014、2015和2016年先后组织了三次现场技术测试,邀请了国内的企业和团队参与测试,前两次测试结果没有得到主管单位的认可,直到2016年,邀请到依图、商汤、旷视等人工智能新秀参与测试,测试结果与前两次相比有了质的提升,管理单位很满意。后来在实际运行中,在短短的半个月时间内就先后比中并抓获在逃人员十多名,引起了轰动。在这段时间内,各地也都在开展动态人像识别布控系统的试点应用,均取得了不少成效,从而掀起了一波动态人像识别布控系统的建设高潮。
 
  随着人像卡口建设数量的不断增多,单靠人像比对布控已无法发挥其应用价值,投入产出比越来越低。2018年,人像特征关联聚类技术出现,在不依赖人脸比对库的前提下,把同一个人在不同时间、地点拍摄到的人像进行聚类归档,生成基于虚拟身份的时空轨迹库,为公安机关提供直观、真实、有价值的基于“人”的时空轨迹大数据,参与到警务大数据应用,取得了很好的实战效果。人像聚类技术的突破极大地推动了人像卡口的大规模布建,截止到2020年6月份,某东部省份的人像卡口建设规模已接近十万路。
 
  在视频结构化方面,基于人体、车辆(机动车/非机动车)和行为特征的识别技术在日间和较好照度环境下已达到实用化程度,也超出了规划中仅仅基于视频结构化描述的“语义视频监控系统”的预期,基于人体、车辆目标特征的模糊比对的准确率有了突破性的进展,更接近于实战。
 
  借鉴人脸特征聚类,基于目标特征模糊比对技术的人体特征聚类技术也有了突破,通过人脸+人体的特征关联聚类,把人脸卡口和常规监控图像数据融合在一起,在实战中发挥出了更大的威力。
 
  在算力方面,除了在GPU上不断提升优化运算效率外,国产AI芯片的开发上也有了很大的突破,投身到AI芯片设计的企业有30余家,华为海思、寒武纪、深鉴、百度等以及安防AI四小龙也都已经推出或即将推出不同架构的AI芯片,涵盖云端与边缘、训练和推理,多数基于ASIC架构,在运算效率、功耗、成本等方面有明显的优势,从而推动了AI在各应用场景的快速落地和规模化部署。
 
  机器视觉的云端计算已具规模,但边缘计算能力还有待提升。目前边缘计算还主要以人脸检测和抓拍摄像机为主,受限于边缘计算的成本、功耗等因素,在计算能力和识别精度还有很大的发展空间。
 
  二、安防AI行业发展异军突起
 
  随着深度学习的再次兴起,恰巧在“十三五”期间,人工智能在范围全面爆发,来势汹汹,势不可挡。2016年(有说2017)被称为AI元年,“十三五”也就顺理成章的成为的AI的“一五”。在这个“一五”年里,资本市场在AI产业投入巨大,是自互联网产业后的又一次大规模产业投资。2017年,国务院印发《新一代人工智能发展规划》,2017年11月,为充分发挥人工智能企业、研究机构的示范作用,科技部分别依托科大讯飞(智能语音)、阿里巴巴(城市大脑)、腾讯(医疗影像)、百度(自动驾驶)四家企业推出了首批国家新一代人工智能开放创新平台;2018年7月,依托商汤科技建立了智能视觉开放创新平台;2019年8月,科技部印发《国家新一代人工智能开放创新平台建设工作指引》,先后又有10家企业入围,从政策引导层面对人工智能行业发展起到了极大推动作用。
 
  国内人工智能技术首先在安防领域得到快速普及和应用,特别是人像识别技术在公共安全领域内成为热点,“平安”“天网”“雪亮”工程从“补点、补空、补盲”向“补脸、补脑、补智”转变。除了传统的安防企业和互联网企业大举进入AI产业外,也产生了一大批人工智能独角兽企业,的有公认的机器视觉算法领域的AI四小龙—商汤、依图、旷视、云从,还有寒武纪、深鉴、地平线等AI芯片独角兽企业。
 
  在安防AI产业领域,可分为四大阵营:一是包括AI四小龙和寒武纪、深鉴、地平线等AI芯片类公司在内的AI新兴企业,二是海大宇为代表的传统安防企业,三是BAT为代表的互联网企业,四是以华为、紫光为代表的通信类企业。从“十三五”期间各自竞争与合作态势来看,这几大阵营之间既有竞争也有合作。在竞争层面,AI新兴企业之间、传统安防企业之间以及新兴企业与传统安防企业之间的竞争尤为激烈;而在其它阵营之间,合作大于竞争,如互联网巨头阿里巴巴先后投资了旷视、依图和商汤三家独角兽企业,华为也以“黑土地”战略与算法企业之间存在着良好的合作关系。
 
  四大阵营在安防市场的竞争也体现出不同的方向和侧重点——以BAT为代表的AI企业主要从智慧城市项目入手来撬动安防市场,以AI四小龙为代表的新兴企业则以算法赋能安防行业各应用场景,以华为、紫光为代表的通信类企业则以提供多算法融合的通用化算力调度平台为主,传统安防企业则以提供从前端边缘智能设备到云端AI解析运算平台的全面解决方案为主。AI四小龙之一的商汤科技依托其自主原创的深度学习框架逐渐从算法赋能向平台赋能转型,帮助政府打造集模型训练到视觉解析的城市级智能视觉中枢系统,已经走出了一条独特的道路。
 
  三、机器视觉为安防产业带来新的市场增长点
 
  “十二五”期间,由于技术更新迭代慢,传统的安防需求几近饱和,安防产业发展增长放缓。“雪亮”工程的启动虽然为安防行业带来一波市场机会,但在具体建设过程中往往是重数量考核指标,轻产品和建设质量,造成安防企业之间的低技术层次的竞争。机器视觉——尤其是人像识别技术的快速发展和应用为安防产业带来了新的市场增长点,以东部某经济发达城市为例,在2018年以前,历经平安城市、天网工程和雪亮工程建设积累,全市公安自建的视频监控点位只有4万路左右,但在2018和2019两年时间,新增人像卡口的建设数量就达到2万路之多,仅前端点位和存储系统建设投入就达数亿元;基于人像卡口数据,建设了市县两级人像识别与大数据系统,软硬件总投资上亿元。
 
  笔者从各地公安机关了解到,雪亮工程的建设都在重点围绕人像识别和视频结构化等智能视觉技术应用来展开。从智慧城市、城市大脑等政府层面的信息化系统建设情况来看,也把“视觉神经中枢”作为建设的重点,为各政府职能部门和视频图像智能化应用提供算法算力和数据支撑。
 
  四、机器视觉安防行业进入了一个新时代
 
  如前所述,传统安防仅仅致力于解决“看得见、看得清、查得到”的问题,大量的视频监控还需要人来解决“看得懂”的问题。历经多年的平安城市、天网工程和雪亮工程的建设,城市公共安全视频监控的覆盖密度已经达到了接近饱和程度,除了个别区域补点补盲、城市发展规划和设备故障带来的局部增量外,已经缺乏大规模的建设需求基础,传统安防产业的发展已经遇到了天花板。反而过去积累的存量视频监控图像数据资源需要盘活,现有的监控设备需要升级换代。在这样的需求背景下,机器视觉技术的出现为安防行业带来了生机,通过机器来解决“看得懂”的问题,催生了两个增量市场——一是对现有存量视频图像的云端视觉解析,二是对前端监控设备的智能化升级。
 
  在现有的算力条件下,由于对视频的解码和解析需要庞大的算力资源支撑,以业界通用的NVIDATeslaP4卡算力来看,单卡大可支持30路左右的1080P监控图像的解析处理能力,按照1万路监控规模来计算,需要300多块GPU卡,折合80余台GPU服务器。如果支持目标特征模糊比对,还需要增加20台特征比对服务器,同时也对视频网络传输带来极大的压力。因此对存量视频图像的云端视觉解析只能解决部分问题,或者说只能作为一个工具,在需要时才对与案件相关的监控录像进行解析处理。假如要对全量的视频图像进行解析,做到随查随有,就必须采用云+边的策略——即利用边缘计算来检测提取所关注的目标并进行粗略解析,再通过云端计算来进行精细化特征解析和比对。这样就同时催生了两个增量市场,安防行业进入一个新的时代。
 
  五、未来展望
 
  从技术发展和市场需求态势来看,未来安防领域机器视觉的发展将呈现以下两个方面的特点:
 
  一是边缘计算将成为主流。随着机器视觉ASIC专用芯片的技术突破,算力不断提升、耗电和成本不断降低,未来的边缘设备智能化程度和普及率将越来越高。预计在“十四五”末,经济较发达城市的公共安全视频监控设备的智能化率将超过80%,边缘智能设备预计可以承担80%以上的计算任务。
 
  二是算法模型训练将从“象牙塔”走到“田间地头”。机器视觉,算法是核心,数据是基础,算力是加速器。目前算法的产生主要来源于“象牙塔“——人工智能实验室,由于实验室远离实际应用场景,造成算法模型场景适应能力差、迭代周期长等缺点。随着深度学习平台和算法训练的专业化程度不断降低,预计到“十四五”末,算法模型训练将更靠近应用场景侧,和算法应用一起将成为城市和行业机器视觉中枢的标配双引擎。

上一篇:信息网络安全受重视 安防行业内这些标准值得重视

下一篇:政策助推之下 智能物联网产业的机遇和挑战

相关资讯:

首页|导航|登录|关于本站|联系我们