视频内容审核 人工智能分析只是“轻量级”选手
- 来源:安全自动化
- 2017/4/27 9:36:0741369
【中国安防展览网 企业关注】移动互联网时代,视频传播有着碎片化、质量残差不齐、传播成本低、负面内容杀伤力大的特点。每天产生数千万小时的视频内容,其中有大量的不良视频,包括躲猫猫式的直播。在带有隐蔽性的海量数据面前,完全依靠人工是没办法解决内容审核难题,这给视频的内容管理带来了巨大的压力。因此,人工智能或许是视频内容管理的*。
视频传播碎片化时代 人工智能分析只是“轻量级”选手
在大数据基础上,在视频文件或直播中,人工智能可以进行智能化视频分析。快速识别视频中人脸、声音、文字、物品、行为、场景等信息,为决策提供参考。具体来说,内容审核可化繁为简,将视频、直播内容转化为人工智能可以判断的内容比如图片和文字,通过图片识别、语音语义识别等人工智能技术对特殊物体如人体、刀具、枪支等做判断。
搜索了一系列文章,才发现,在网络视频内容审核这件事上,如今已有多家平台商推出了人工智能技术的应用服务,百度即是其中之一。说视频内容审核可能大家感觉会比较严肃,直白点,大概就是原来人工鉴别(暴恐血腥、不良信息)现今已进化到了机器鉴别的阶段。至于审核效率提升了多少,引用下网易杭州研究院执行院长汪源的话:“现在依靠深度学习的算法能够做到99.8%的准确率。”
这样看来,人工智能技术在网络视频内容审核方面的作用可谓是一场“轻量级”的智能视频分析应用,“轻量级”则是相对于专业级的安防监控视频的规模而言。同样是视频内容检测、分析和搜索,网络视频和监控视频完全是两个级别。无论是分析的视频数据量还是视频内容的类型都有极大的差异。
量不同
首先从视频数据的量来看,网站视频主要集中在各平台播出的影视剧、PGC/工作室内容、网友上传的原创视频(UGC)以及这两年来走红的网络直播视频上,这其中,数据量大的要数网络直播视频,这类视频同属于网友原创视频的类型,也是各平台审查力度大的一类视频资源。
据2015年艾媒的视频直播市场调研数据来看,仅2015年,全国在线直播平台数量就接近200家,大型直播平台每日高峰时段同时在线人数接近400万,同时直播的房间数量超过3000个,这样算下来每日高峰阶段即有600000在线视频直播的内容输出,这还只是两年前仅网站直播视频这一项的数据量,如今这个数据恐怕早已翻出几倍。
不过尽管如此,相较于城市视频监控的数据规模,网站视频的数据量仍然只是很小的一部分比例。安防视频监控实行的是7*24*365的全时段运作,以一个摄像头密度为6000的小型城市为例,6000高清摄像头一小时的视频大小将有10800000MB,一天算下来,一个城市将有247TB的视频数据,一个月7416TB,而这仅仅是一个超小型城市的视频数据量。
内容类型不同
网络视频大致可分为娱乐、生活、新闻、体育、在线教育、游戏、电竞等类别,无论是影视剧还是网络直播,审核的目标主要是查看视频内容是否涉及黄反、暴恐血腥、政治敏感、虚假广告等,审核的项目除了视频画面本身之外,还包括图片、文字、弹幕、网友留言、恶意刷榜、活动反作弊等项目。其中鉴别不良信息是网站视频内容审核的大项目。
而安防监控视频的内容则来源于实时的社会场景画面,结合公安、交通等应用领域的实际业务,主要针对的是对视频画面中人、车、物三大元素的检测和分析,细化为对目标的类型、大小、颜色、方向、速度、运动轨迹等各项特征的识别和分析。
人工智能如何鉴别不良信息?
由于视频数据量和内容类型的大不相同,因此,采用的视频内容分析手段也有所针对性。更确切的说,网站视频的视频内容分析主要是为做内容审核,在此基础之上,视频平台商也会通过内容分析技术来优化用户体验,这些我们可以从百度、网易等互联网厂商的推出的相关服务内容中感受得到。
比如网易推出的网易易盾针对机器鉴别不良信息自主研发了一套图片特征提取算法,包括人体肤色识别、人体特征部位识别、人体姿势识别等技术。同时,基于深度学习的算法,易盾积累了大量的样本数据,用计算机模拟人脑神经网络的原理,使计算机训练后具备一定的识别能力,在没有具体特征样本库的情况下也可以对内容进行识别与分类。
百度在其云视频生态解决方案主打的视频内容分析VCA(Video Content Analysis),能够通过人工智能技术,对视频进行语音、文字、人脸、物体等多维度智能分析,它整合了百度的深度学习、自然语言处理等人工智能技术,支持视频分类、视频元素提取、关键字提取以及自定义模型,适用于黄反、暴恐、政治敏感、资质审核等内容审核场景,在提取了关键的内容信息之后,还可输出视频内容的泛标签(TAG),从而提高搜索准确度和用户推荐视频的曝光量,提升视频的个性化推荐和检索能力。
人工智能在网络视频内容审核方面的应用其实也 并非才兴起,除百度、网易外,也有不少技术提供商和视频平台商达成合作推出了相关服务项目。从健康和谐的视频运营环境的角度考虑,人工智能技术的应用,对人力、财力都是一种解放,并且顺应了当前用户对个性化视频内容的需求。
同样是进阶到人工智能技术应用的阶段,深度学习算法*,样本训练也同样重要,在安防智能视频分析已成为常态,并且更具规模化、智能化效应。安防监控视频分析主要是为视频关键信息的提取和结构化做前期的准备,将视频数据语义化。 由于安防视频监控的数据主要由社会实时画面构成,所以智能分析技术中常用的算法也以计算机视觉领域的算法为主,如前背景建模、目标检测、分类、识别、跟踪、特征点提取、匹配、运动估计等等。
在分析的类型上还细分为诊断类智能分析、识别类智能分析、行为类智能分析等,由于视频数据量巨大,因此,安防视频智能分析目前也广泛采用软硬结合、前后端结合的方式来实现智能分析性能的大化,这些都是网络视频分析不可比拟的应用规模,当然,这也是商业应用和专业领域应用差异所决定的。