苏光大教授谈人脸识别存在问题及初创型公司发展前景
- 来源:慧聪安防网
- 2017/10/9 14:06:1835276
【中国安防展览网 视点跟踪】在安防行业中,人脸识别声名显赫,在机场刷脸安检和值机,高铁站刷脸进站及防卫,银行人脸认证业务和刷脸取款,以及各类重大活动会议安保项目执勤中,人脸识别不仅实现了人证识别,还在实战中抓获了各类*分子,成为公安执法行动中的有力助手。
经过几十年的孕育和发展,如今的人脸识别在世界范围内已然成为一种行之有效的身份识别手段。在国内,无数以生物识别为主的新兴、初创企业如雨后春笋般创立,并入局此间。诚然,这些公司代表着我国在生物识别技术上取得的高度成就,也是我国在人工智能、深度学习乃至工业4.0等方向上再次屹立于世界民族之林的希望。但仅仅凭借现有硕果并不足以支撑起整个未来框架,并且,现存亟待解决的问题也仍然不胜枚举。以“大数据+安防+生物识别”的未来发展方向急需一个实实在在的落地点。为此,特地拜访了在生物识别技术方面的清华大学电子工程系教授苏光大先生,针对如今人脸识别存在的问题以及初创型公司的发展前景,进行了深入地探讨。
苏光大,清华大学电子工程系教授,全国安防标委会人体生物特征识别应用分技术委员会顾问、多维身份认证与可信认证技术国家工程实验室技术委员会委员、中安协专家委员会专家。主要研究领域为“图像识别与高速图像处理技术”。在清华大学执教40余年。苏教授先后发布了160余篇学术论文,著有“微机图像处理系统”和“并行图像处理技术”等专著,提出了1:1采样理论,发展了采样定理;提出了二维流计算理论,在一定程度上克服了冯•诺依曼瓶颈。发明了低分辨率人脸图像重建方法,发明了基于人脸部件的人脸识别方法。除此之外,苏教授也参与了周克华系列案、2010年内蒙古准格尔旗沙圪堵镇凶案、1999年郑州317凶案等重大案件的侦破,并发挥了重要作用。几十年来,苏教授与公安部门进行了多次合作,其科研成果为公共安全事业做出了杰出的贡献。
走进苏教授办公室时,苏教授正端坐在办公桌前,专注地在电脑上敲着什么。九月末的北京已经渐生寒意,苏教授却仍是一身夏衫。他精神矍铄,神采奕奕,眼中满是长者的智慧;但与你相谈时,他又像一位邻右棋翁,面带微笑,让人倍感亲切。
关于创业公司的未来发展:“硬件与算法这些硬核需求才是竞争核心,缺一不可”
就目前人脸识别公司的现状,我们向苏教授请教了有关创业公司的发展问题,苏教授给出了他的看法和建议:
“人脸识别现在还面临着一些非常有挑战性的问题。” “在一些人脸识别的案例中,很多人的面部是机器识别不出来的。这是因为现有技术还不能识别像素过低的面部。当眼间距小于10像素时,人脸识别就很困难了。除此之外,另一个是年龄跨度的问题。随着年龄增长,人类面部在计算机中的成像也是不断改变的。如果年龄跨度在十年以上,识别率将会受到影响。”
“目前我国业内水平还是很不错的,同原来相比也有了长足的长进。但是长进归长进,不能因此而固步自封。我们还有很多问题,像冯•诺依曼瓶颈,二维计算问题等等。这些问题都如大山一般横在我们面前,想要跨越,就必须深入其中。”
“纵观各大企业,他们还在不断更新自己的算法和硬件。像谷歌公司,硬件也好,算法也罢,更新速度都很快。还有华为公司,近搞的麒麟970,在世界上也是的。”
“我主张软硬结合,既要开发人工智能的软件,也要研制人工智能的硬件。人工智能软硬件并举,将会领引人工智能时代。”
以下是访谈对话实录:
Q:苏老师,我了解到人脸识别应该分为“一对一识别技术”、“一对多识别技术”以及“多对多识别技术”,能否请您简单谈一下这几个技术的应用场景?
A:我们先来说这个一对一识别技术。1:1识别技术是什么呢,以我们现在使用的二代*举例,由于现在办很多事情都是要求实名制的,当需要证明你的身份时,就可以用你的*照片和你进行比对,这样别人就很难冒充你了。所以1:1也可以说是一种认证和确认的手段。
那么一对多,也可以说是1:N人脸识别技术,这是做什么的呢?就好比我们建了一个大的数据库,这个库中都是二代证的人像,然后用目标人的照片和这个库里的人像进行逐一比对,看看目标人在不在这个库中、相似程度位于第几名等。
另一种一对多的人脸识别——关注名单型人脸识别。名单也分白名单和黑名单:比如你是一个小区的居民,小区管控很严,不允许外人随意进出,当你只有在白名单中的时候,才有权利出入,这就是一个白名单的应用;那么黑名单就正相反,当这个小区坚决拒绝你进入的时候,你就是一个黑名单用户。我们把这两种功能统称为关注名单,也就是刚刚提到的1:N人脸识别技术的应用。
至于多对多——M:N人脸识别技术,这是一个新提出的识别方式。我用很多人的数据资料,去数据库中碰撞查询,比如在诸如车站、地铁等人流量较大的地方搜寻目标,同时抓取很多人脸,并和库中数据进行比对。这种技术多用于确定目标人的运动轨迹。
Q:目前市面上多见的还是以1:1识别技术为主的产品,但让我站在一个用户的立场来讲,扫脸就能解锁手机、支付现金让人觉得很不安全,甚至有些别扭,我自身觉得这种技术的好处无非就是让用户觉得“高大上”一些。现有的功能已经可以做到安全保障了,为什么还要用人脸识别呢?
A:便捷。人脸识别的便捷性要高于现有的其他识别手段。类似密码的传统手段,输入麻烦,容易遗忘,被盗取的可能性也比较高。至于你提到的安全性,这点是不需担心的。现在我们提倡的是“人脸识别+”,人脸识别技术不作为单独的识别手段,也会和其他方式配合,进行多重认证。而且使用人脸识别的时候,也需要用户配合着眨眨眼,摇摇头,安全性又提高了很多。
至于你说的“别扭”,我大概能了解一些你的心情。其实如今的人脸识别技术已经很成熟了,完全可以运用于实践中。实践是一个过程,每一个技术都不可能是高度成熟了、达到了才应用。就好比windows系统,开始我用过的windows3.1,那也是有很多bug的,但是现在的windows操作系统使用起来,相比从前体验要好太多太多。任何事情都是这样的,从无到有,从缺失到完善。而人脸识别技术现阶段正是在不断完善的阶段中,所以大可不必担心。
Q:我查阅了一些相关资料,现在的“大数据+人脸识别”是一个发展方向,且是一个可以实际落地于安防行业的、前景极好的方向,但是在实际应用中,我们却很难见到把这个做到极为出色的公司,可见其难度不小。那么您能否谈一下,现如今大数据与人脸识别相结合的难点究竟在什么地方呢?
A:如今的人工智能在高速发展,甚至有人说人类马上就要进入人工智能时代了。其实现阶段在大数据的实际应用下,不论是人脸识别,还是语音识别,都取得了许多优异的成果。
大数据给了人工智能很多素材,比如用深度学习训练人脸识别,我们用、甚至亿级的人脸数据库来训练它,使它的识别率达到了极高的水平。而早先我们用传统方法发展人脸识别,其识别率上升的幅度是有限的。是深度学习给了人脸识别技术质的飞跃。
但是现在的发展确实面临了一个问题,那就是计算模式的问题。现在计算模式的主流是“CPU+GPU”,大数据的深度学习需要用到大量的二维计算,CPU、GPU并不擅长二维计算,所以我们能看到,像香港中文大学的汤晓鸥团队,利用上千片GPU搞DeepID。中国的天河一号,集成了7168个GPU;再说谷歌,在拥有15个仓库级的服务器阵列。这么大的规模,不仅计算设备昂贵,耗电量也是惊人的。据我所知,中国的超算中心一年的电费就要6000万元人民币。而像贵阳的大数据服务器阵列,放到了山洞里,就是为了散热好一些,降低损耗和费用。
那么问题出在哪儿呢?经过调研和思考,我认为如今的计算方式存在两大问题。点,就是的冯•诺依曼瓶颈(注:冯•诺依曼瓶颈,意为以冯•诺依曼结构构成的计算机,当CPU需要在巨大的资料上执行一些简单指令时,资料流量就成了整体效率非常严重的限制,CPU将会在资料输入或输出内存时闲置),这是个非常糟糕的问题。如今的摩尔定律已经不再发挥神奇功效(注:摩尔定律是由英特尔(Intel)创始人之一戈登•摩尔(GordonMoore)提出来的,其内容为:当价格不变时,集成电路上可容纳的元器件的数目,约每隔18-24个月便会增加一倍,性能也将提升一倍。该定律在1965年4月19日发表于《电子学》杂志),计算模式面临着智能监控数据分析遇到大数据“跑不动”的问题。第二点,大量的二维卷积计算。因为GPU本身是更专精于一维计算的,在进行二维计算时,GPU的性能和计算能力都会大大降低。这些问题使业界深深地陷入了加大计算规模的困境。
据谷歌公司推算,如果世界上每一台安卓手机,每日进行三分钟的语音搜索,那么谷歌的仓库级数据中心就要从15个翻倍到30个。但堵不如疏,这种无节制扩张服务器规模的办法并不能从根本上解决问题。
面对当下困境,业界也做出了相应的反应。谷歌推出张量处理芯片,即TPU;而老牌芯片公司英特尔,则发布了人工智能加速器;微软启动了人工智能芯片的研发工程;一些具有*背景的机构也开始支持研发非冯•诺依曼结构计算机。
目前清华大学也研究出了一套改善冯•诺依曼结构的处理方法,这是一种二维流计算模式,其数据结构具有同一性和并行性。简单来说,如果数据库是一个砖瓦厂,处理器是盖房子的工人,而冯•诺依曼问题在于运砖车每次只能运输一块砖,导致工人大量时间处于无事可做的闲置状态,那么我们的处理办法就是让运砖车每次能多取砖,这也能在一定程度上改善计算机的工作效率。
Q:像您刚刚所说,现如今人工智能的形式一片大好,有人已经提出了“AI时代降临”的说法。但是据我所知,现在很多技术和应用仍然处于初级阶段,比方说刚刚我们提到的大数据+人脸识别,再比方说,我曾有幸参与过的一些人工智能初创公司的实测活动,他们普遍存在一些问题,即在地铁、车站、商场这些人流量较大的地方,人们一窝蜂地出现在镜头中,有些人脸是不能被抓取到的。而且人流量大使设备处于高并发状态时,它们的处理就变得非常“卡顿”,这样的技术如果运用到公共安全、安防事业中,是形同鸡肋的,更是无法落地的。身处安防行业,我迫切希望这种情况能够得到改善。苏老师能否给有此类问题的公司一些建议呢?
A:现在这些问题主要集中在户外视频监控上。姿态不同、光照不同、分辨率不同,有遮挡物等等,识别效果要差一些。但是,应用深度学习,户外人脸识别的性能已有大幅度的提升。2017年新的测试表明,在错误接受率为万分之一的条件下,正确识别率达到76%。可以想到,随着深度学习的强化训练,正确识别率还会提高。其关键是,提高训练数据的多样性和有效性。
虽然现如今的技术背靠大数据和深度学习,已经有了很大的长进,也取得了很好的成绩。但是我们不能因此停下脚步。关于未来的发展模式,我还是主张“软硬结合”。像谷歌这种走在前列的公司,就是既做人工智能算法,又做人工智能硬件,这种方式是极好的,这种方式在今后也会有非常好的发展。
其实目前我国的发展前景还是极为不错的,而且现如今有一个很好的机会,这个机会在哪里呢?那就是安防事业。如今海康、大华都跻身前列,销售额度已经非常可观。接下来,就是要看我们的计算模式能不能有所突破了。现如今,我们的微电子技术已经跻身到了世界前列,这就是很好的硬件基础。如果再把计算模式发展好,中国在这方面就会有更大的发展,这是我长久以来一直非常期望的。
现在很多人开始做这样一件事,那就是把人脸识别放入摄像机,也就是所谓的前端识别设备。但很多机构还在千篇一律地使用GPU架构的道路。在我看来,这是一种没有办法的办法,并不是解决问题的长久之计。因为摩尔定律已经不再适用,使用GPU架构的这条路,上升空间已经极小。如果想要在这个领域立足,长远发展,那就一定要用更新的技术,更新的硬件。想要有所突破,就要把自己的东西搞起来。
编者总结:
现如今,生物识别技术大量被运用,身边处处可见的指纹识别、人脸识别大大地方便了我们的生活。这与众多新老生物识别技术公司、各大研究机构的努力密不可分。人脸识别技术潜移默化地改变着人们的生活方式,在不久的未来,通过不懈发展,人脸识别技术也一定能够成功立足于安防行业。
但就现阶段来讲,目前大量的初创公司仍然局限于算法层面,对硬件涉猎较少,与公共安全事业相结合的业务不多,与现今的大型安防公司合作也几乎为零。如此规划显得有些后劲不足,长此以往,在未来的前进路途上恐怕会任重道远。没有更切合实际的落地方针,仅守着算法抱残守缺终归不是长久之计。
况且算法本身的难度并非有多高,而如今老牌安防公司也在跟进自己的算法,且老牌安防公司在数据上有着天然的优势,其硬件设备的更新迭代速度也是初创公司难以企及的。空有算法的薄弱优势,仅仅靠着一些营销手段是无法立足于安防事业的。想要在这场时代变革的战争中活下去,并走得更远,未来的路究竟如何前进,是他们需要谨慎思考的。
原标题 苏光大教授专访:打破僵化思维,创业公司需软硬件结合立足安防