谷歌新型图像识别工具 六大特性实现突破
- 来源:极客公园
- 2015/12/9 16:00:0644158
谷歌新型图像识别工具 六大特性实现突破
周三,Google宣布,他们开发了一个名为Google Cloud VisionAPI的强大图像识别工具,对于们来说,这可能会是一个非常有用的工具,有了它,们就可以让自己的软件、机器人知道图像上的信息。
功能强大的图像检测工具
首先,作为一个机器学习领域的技术,这个工具搭载的是我们之前给大家介绍过的智能机器学习系统Tensor Flow,Google在上个月刚刚将这个系统免费开放给们。其次,它的主要功能是去学习并识别图片中的内容。这个工具的运行原理并不复杂,它能够迅速将图片分到数千种大的类别当中去,比如:船、狮子、埃菲尔铁塔等等;然后侦测脸部相关的情绪,并识别图片上相关的文字。在他们看来,Google Cloud Vision API有以下几个吸引人的特性:
检测实体:Google Cloud Vision API可以从数千种图片分类中检测出图片中的实体。除此之外,更吸引人的是,你还可以根据你自己的图片类别建立自己的元数据,这样,你就不必受制于Google为你设定的那数千个分类,而有了更符合你自己的图片分类。
字符识别:Google Cloud Vision API所带的光学字符识别技术可以识别图片上的文字内容。其中支持的语言有很多种。
安全检测:Google Cloud Vision API的安全检测功能可以识别出图片中不合适的内容,此功能搭载于Google Safe Search。它可以帮助用户避开那些令人不适的内容。
面部检测:Google Cloud Vision API的面部识别技术可以检测到图片中的人像,也能具体识别出眼睛、嘴等具体的器官,而更重要的是,它还能检测到包括开心、悲伤等在内的8中情绪。为了保护用户的隐私,Google还承诺不会在任何的Google服务器中储存有关面部的任何信息。
地标检测:Google Cloud Vision API的地标检测功能可以识别出世界上的一些自然和人文建筑与景观,同时还会为你标出该地点的经纬度。
Logo检测:Google Cloud Vision API的logo监测功能可以检测出图片中品牌的logo。
下面是一些范例:
Google的一次突破
有了这个工具,机器识别图片的能力会大大加强。之前,你不能让计算机自动为你筛选照片;但现在,只需输入相应的「类别」,计算机就可以为你挑选出相应的图片。
而们现在可以好好设计一下自己的软件和机器人等设备了。在不久的将来,也许当我们走进家门的时候,家中的机器人可以根据你脸上的表情选择它该说的问候语;而你在上网时也能够更地搜寻到想要的图片了。
当然,对Google来说,推出这个工具也很正常。在这个领域,亚马逊和微软都已经走了很远了。很多朋友可能还记得微软在之前推出的识别年龄和情绪的小工具,这些都出自于微软专注于人工智能领域的牛津计划。Google当然也不能落后。在之前,Google也推出过一些进行预测的API产品,但都功能有限,没有涉及到图像这方面,因此,这次的这个举动对Google来说也是一次大的突破。
这个API目前在Google云平台上提供一些有限的预览,不过在将来,Google将会把这个功能添加进Google云储存中。这样可以使它的使用范围更广。