依图夺得“大规模复杂场景人体视频解析”挑战赛行为识别

　　【安防展览网品牌专栏】近日，在由多媒体领域顶级学会ACM MM主办的“大规模复杂场景人体视频解析”挑战赛中，依图算法夺得第一，评价指标wf-mAP@avg达0.26，将以往学术界中的基准算法提升了近3倍，以优势夺得“行为识别”赛道。

　　行为识别是指以人为基础单位，只分析人的行为，关注单人的动作以及多人的动作。这项技术正在智能城市、安全生产、智能商业、智慧娱乐等社会生产生活的方方面面起到作用，比如实时检测工人是否遵循操作流程生产作业以防暴力分拣、针对短视频中人的行为进行摘要理解从而自动为用户推荐视频。

　　学术界以往常用f-mAP@avg来作为行为识别的评价指标，此次竞赛采用的评价指标wf-mAP@avg更注重对难度较大的拥挤场景的考察和少见动作的识别，同时对于人体框的定位精确性要求也更高。

　　由于挑战赛是*举办，参赛团队在赛前无法获取识别的类别、数据集的大小和识别的具体需求。在不到两个月里，依图将算法与场景进行深度结合，从视频中自动提取到了准确丰富的场景信息，并借助多年来的算法积淀和对行业场景的理解等“先验知识”，对特定的14类任务进行了深度算法优化。

　　在此基础上，依图团队在仅使用单模型的情况下，取得了优于其他团队使用复杂多模型融合策略取得的成绩。同时，这也意味着依图仍可以进一步通过融合多个模型提升算法性能。

　　目前，依图行为识别算法的性能仍在持续迭代，实际运用该技术落地实战的项目难度已远超比赛的数据集。未来，依托于高性能自研AI芯片，依图将加速AI技术落地、解锁更多城市生产生活场景。

　　关于 ACM MM Grand Challenge

　　ACM是大的计算机领域专业性学术组织，其评选的图灵奖(A.M.Turing Award)被公认为世界计算机领域的诺贝尔奖。而ACM MM是多媒体领域的顶级会议，属中国计算机学会(CCF)*的A类会议。

　　在此次比赛中，包括亚马逊、腾讯、大华科技、中山大学等上百支队伍参与了超过56000个复杂事件下的人体行为解析。该比赛也是行为识别方向接近真实场景的大规模挑战赛。

智慧城市网