能说英语会讲方言,人工智能创造了大运会上最特别的“志愿者”
- 来源:华为
- 2023/8/11 9:38:0938638
如今,当现代科技再一次与人类智慧交汇,便碰撞出了绚烂的人工智能火光!
以数据为燃料,
让AI的星火照亮每个角落
在最近闭幕的第31届世界大学生夏季运动会上,出现了一位特别的志愿者,她是科大讯飞利用AI创造的虚拟志愿者“小芙”。小芙能用中文、英文、四川方言等多语种进行开放式的交互,让来自世界各地的运动员和观众都能和她进行无障碍的交流互动。
小芙是如何被创造的?她的诞生历程可并不简单。小芙搭载了讯飞星火认知大模型。该模型依靠海量数据持续进化,拥有跨领域的知识和语言理解能力,能够基于自然对话方式理解与执行任务。毋庸置疑,“数据”是人工智能发展的关键,正如小芙的诞生是基于大量的赛事信息和人体面部特征等数据。
进入AI大模型时代,数据的重要性尤为凸显。数据的质量直接影响了大模型的质量,更进一步说,数据的质量决定了AI智能的高度。作为数据的载体,数据存储则成为了AI大模型的关键基础设施,唯有存好“数据”这一关键燃料,才能让AI持续点亮各行各业,照亮世界的每个角落。
转动万花筒,
让数据之光折射在生活的每一面
如果把生活比作一个万花筒,那么数据就是一束光,日复一日地照在我们生活的不同切面上,旋即折射出美轮美奂的光辉,将世界变得更加缤纷绚烂,也悄然改变着世界的运行方式。
当通勤高峰水泄不通,而我们依靠导航巧妙地避开了拥堵路段,这是城市智慧交通系统每年产生的数百PB数据在为我们保驾护航;当金融业惊涛骇浪,而我们因拥有可靠的投资分析而平稳渡过,这是银行通过挖掘并分析海量交易数据,来帮助用户规避风浪。如今,当大模型风靡全球,这是数据在AI领域从量变到质变的爆发。
从1950年图灵发表了一篇题为《机器能思考吗?》的论文,第一次提出了“机器思维”的概念,到AlphaGo与世界围棋冠军在比赛中激烈交锋;从第一个聊天机器人Eliza能够和人类进行固定的对话,到智能机器人走入各行各业和寻常万家;从AI翻译根据指令生成固定文本,到AI应用能够洋洋洒洒写诗作画。人工智能的发展经历了从无到有、从稚嫩到成熟的过程。
在这个过程中,数据扮演着不可或缺的核心角色,而数据存储也自然成为了影响AI发展的关键因素。以讯飞星火认知大模型为例,它从诞生至今,经历了多个版本的迭代,其每一次的成长,都离不开数据的数量和质量的突破,也离不开数据存储的优化升级。
建设AI存力,
华为分布式存储点亮大模型的未来
当前,人工智能技术正从感知理解世界的专用领域,跨越式地迈向生成创造世界的通用领域,这让讯飞星火认知大模型的发展,面临着新的来自数据基础设施的挑战,例如多样化的数据接入、存储资源利用率低,以及数据安全风险等。为应对上述挑战,讯飞星火认知大模型基于华为OceanStor Pacific分布式存储,打造统一存力底座,开展存力和算力的协同体系等研究。
我们可以将AI大模型的全流程视为一个对海量数据进行加工的智能工厂,其工序涵盖数据的归集、清洗、萃取、提炼等。在华为OceanStor Pacific分布式存储的加持下,数据能在这家智能工厂中无缝流转,让数据的拷贝和迁移成为了过去式。
不仅如此,华为OceanStor Pacific分布式存储还让这家智能工厂能够做到自动识别热、温、冷数据,并将不同类型的数据调度至合适的位置,以让训练集数据始终能够享用最高性能的存储,极大地提升了模型的训练效率,加速大模型朝着更高阶的智能方向演进。
科大讯飞副总裁、AI工程院院长潘青华表示,国产AI大模型只有基于自主创新的存力和算力底座才有新的未来。当下,科大讯飞与华为数据存储正并肩推进AI存力底座的联合创新项目,共同打造面向AI大模型场景的最佳数据存储解决方案,在算力和存力协同体系、数据全生命周期管理等方向上寻求突破。
人类科技的发展如同大运会上一场激烈的接力赛,一棒接一棒,不断逼近科技与智能的巅峰。当时代将AI大模型这一棒递到我们手中,全行业便开启了又一段勇于突破的激情征程。华为将携手各行各业的伙伴,为实现智能世界的目标而共同努力,加速AI之光照进未来。