“平淡的AI”又热闹了,多模态打开安防第二春?
- 来源:CPS中安网
- 2023/12/26 8:49:3239679
【智慧城市网 市场分析】不知道大家有没有发现,在2023年10月CPSE安博会的现场,9个展馆里的展商大谈安防+AI的热情并没有之前那样侃侃而谈,而是归于平淡。
比如针对智慧停车、楼宇对讲、智能家居、视频监控等领域,各大展商在述说自身产品的时候基本上对AI并没有过多描述,而是一带而过。最多也只是谈了人脸特征的抓取或者对车牌等元素的识别,并没有在行为、情绪等方面做延伸。
换言之,当前的市场对AI等新兴技术的探讨失去了激情,一种安防+AI应用已到了天花板的想法弥漫整个市场。
有业内人士评论,当前安防行业似乎失去了发展方向,AI在安防领域的前景有待商榷,是否就此一蹶不振成为业内人士日常关心的话题之一。
然而,前不久资本市场突然掀起一波多模态AI模型的行情,引发市场的广泛谈论。
有人说,多模态AI的出现让平淡的安防+AI不再平淡。
而且,本轮行情主要聚焦的点是在应用端和硬件上,与上一轮行情完全不同,因为随着AI业态的不断成熟和发展,应用是否能落地成为市场关注的重点。
事实上也确实如此,众所周知,AI在国内的发展已有40多年历程,每一次取得长足的进步或者被市场所熟知、接受,都是在应用端大放光彩。
比如,AI在安防领域的落地应用,在产品和方案中最为明显的表现形式就是视频的智能分析,不管是摄像机、门禁对讲、智能门锁等安防产品,AI的应用结果都表现在针对视频的智能分析以及针对分析结果联动的预警动作。
只不过安防+AI 1.0时代浪潮发酵一段时间之后,市场对AI关注度平淡了不少,如果不是年初的ChatGPT突然火爆引发大家对AI大模型的讨论以及本轮资本市场对多模态模型的角逐,或许AI会在历史的长河中“消失”。
所以,多模态AI的出现让安防人看到了希望,安防+AI 2.0时代新技术的全面落地指日可待。至于什么是多模态,看如下介绍!
什么是多模态?
多模态模型是一种能够处理多种类型数据(文本、图像、音频和视频)的人工智能模型,是生成式AI的升级方向。
这种模型的目标是通过结合不同类型的数据来提供更全面、更准确的信息。
例如,一个多模态模型可能不仅能够分析文本数据中的信息,还能够分析图像和音频数据中的信息。
在应用层面,多模态模型可以应用在自然语言处理(NLP)领域、计算机视觉领域和语音识别和生产领域。
其中,在自然语言处理领域,多模态模型可以用于机器翻译、情感分析、文本摘要等任务。
在计算机视觉领域,多模态模型可以用于图像分类、目标检测、人脸识别等任务。
在语音识别和生成领域,多模态模型可以用于语音转文本、语音合成、对话系统等任务。
通俗地讲,多模态AI应用领域涵盖教育、音乐、视频、校对、营销、游戏、影视、电商、医疗等各细分领域。
具体表现,拿智能家居产品来看,使用多模态技术可以将不同形式的感官信息整合起来进行智能化控制。
通过使用语音、触摸屏幕、手势等方式进行操作,人们可以轻松地控制灯光、电视、音响等家居设备,实现智能化管理。
例如,当你坐在沙发上打开电视时,语音助手可以自动调节亮度和音量,为你提供更舒适的观影体验。
另外,有多模态就有单模态,单模态很好区别,2023年年初爆火的ChatGPT就可以视为一个单模态模型,因为它主要处理的是文本数据。
虽然它在在处理文本时表现出了强大的能力,但它并不直接处理其他类型的数据,如图像或音频。因此,可以认为ChatGPT是一个单模态模型。而GPT-4可以认为是一个多模态模型。
从这个角度来看,倘若ChatGPT突然爆火引发安防人对安防+AI应用2.0时代的思考,那么多模态模型的出圈,无疑是再次加深了市场对安防+AI应用2.0时代的讨论,同时也折射出大家对AI这条赛道的关注度并没有因为时间的推移而退却,反而加速付之行动并取得初步成效,技术全面落地实施指日可待。
总而言之,随着海外市场Pika1.0、Gemini、Gen-2等多模态模型的快速出圈,开始争夺AI视频生成高地,全球大模型多模态化趋势将日益显著,未来一个统一的、跨场景、多任务的多模态基础模型也将会成为人工智能发展的主流趋势之一。
国内相关知名AI企业自然会得到资本的青睐,拭目以待。
打开安防第二春?
多模态作为生成式AI的升级方向,目前已成为AI赛道的新热点。
国内相关知名企业企业也将获得更多的关注。比如苏州科达、汉王科技、云从科技等。
据公开的资料显示,苏州科达于2023年7月正式推出了KD-GPT大模型,它包括多模态大模型、AIGC图像大模型和行业大模型三种。
其中科达的多模态大模型可以解决所有数据难问题,比如我们要检测一幅图片中是否有烟雾出现,我们只要输入提示语:“烟雾”和待检测的图片,大模型就可以直接输出检测结果,无需成千上万张的烟雾图片进行训练。
对此,有业内人士评论称,如果苏州科达的多模态AI能在安防行业成功落地,将会出现一款领先的安防领域商业产品。
而且,基于自身优势,未来将有望助力企业实现订单和收入质量的提升。
汉王科技于2023年10月推出天地大模型,据介绍,天地大模型具备多模态、语义理解、逻辑推理、数学计算、知识搜索、工具调用、内容生成、多语言和多轮对话等九大基础能力。
通过这些基础能力,能够使汉王天地大模型在向外开拓AI应用市场领域方面有着强大的优势。
云从科技于2023年8月正式发布一款多模态系统大模型--从容大模型。
该模型包含但不限于语言大模型、视觉大模型、语音大模型、代码生成大模型以及图像生成大模型等。
它通过实时学习并同步反馈结果,可以解决诸多AI应用的痛点,从而有利于快速普及个性化应用。同时,其具备上下文学习能力,能够以更好的交互性能,应用于金融、安防、政务、交通、能源、教育、医疗、文娱等行业领域。
从上述企业推出的多模态大模型的技术特点来看,多模态技术可以解决诸多安防+AI应用遇到的难点和痛点。
而且随着多模态大模型的开源,会对安防行业原有的市场结构造成冲击,重新洗牌不是不可能,从而打开安防第二春。
很简单,多模态开源后,能让许多有一定应用开发能力、有对甲方使用场景需求真正理解的集成商带来很好的机遇。
他们可以不用拘泥于厂家提供的产品实现的某些功能,而可以利用开放的技术体系进行更好体验产品的自我开发。
整体来看,随着多模态时代正式开始,大型科技公司一改传统AI解决方案的商业模式,向更前沿的多模态大模型深耕,将带动产业链各环节高速发展。