图像识别之痛:技术升级隐私保护技两难全
- 来源:爱范儿
- 2016/9/15 10:34:5238199
图像识别之痛:技术升级隐私保护技两难全
据 Wired 网站的报道,德州大学和康奈尔科技学院的研究人员发现,通过一些训练,神经网络可以识别图像中隐藏的信息,无论是模糊的门牌号,还是像素化的人脸。而且,他们并不需要费力开发新的方法,只要使用主流的机器学习方法就行了。
“我们使用了非常标准的图像识别技术。这才是让人不安的地方。” 康奈尔科技的研究员 Vitaly Shmatikov 说。由于这些方法广为人知,解析图片隐藏信息只需要一些基础的技术 。
在训练神经网络的过程中,研究人员使用了几个大型的图像库。当神经网络看到的单词、脸部或者物品越多,它的识别准确率就会越高。在神经网络的识别准确率达到 90% 后,研究人员用三种隐私工具处理了图像,并且让神经网络继续解析这些图像。后,他们开始用新的模糊图像测试神经网络,看它是否能够辨识出面部、物品或者手写的数字。
结果是,在某些数据库和隐私技术上,神经网络的成功率达到 80%,甚至是 90%。在像素化图像方面,随着图片模糊程度增加,神经网络的成功率会降低,但是,它仍然能够达到 50% 到 75% 的成功率。
值得注意的是,神经网络并不能凭空恢复图像,或者把模糊的图片完全还原。它只能将其与自己见过的东西联系起来。比如,在火车站的监控图像里,如果每个过往人员的面部都是模糊的,神经网络不能识别每个人,但是,如果你怀疑某人在特定时间经过,那么,神经网络就能从众人中辨识出那个人。
通过此项研究,研究人员向隐私人士和安全人员提出了警告。在图像识别和数据收集上,机器学习已经成为不可忽视的工具。“我希望,经过了这项研究,当人们发布隐私技术并且宣称其安全之前,首先要经过神经网络的分析,” Shamatikov 说。