中国AIGC产业全景一览
- 来源:量子位
- 2023/4/6 15:53:1736218
【智慧城市网 企业关注】2023年,被称作ChatGPT元年,ChatGPT现世至今,AIGC这把火彻底点燃了全世界。
ChatGPT自身在推出2个月后,月活用户突破1亿,成为史上用户增长速度最快的消费级应用程序,必应也在接入GPT能力后日活突破1亿;行业大牛们则亲自下场,纷纷离职创业,激战AIGC。
发展到如今,AIGC的规模到底有多大?水有多深?里面能容纳多少玩家?谁能笑到最后?
近日,量子位在中国AIGC产业峰会上发布了《中国AIGC产业全景报告》。
市场有多大?
量子位智库预测,到2030年,AIGC市场规模将达到1.15万亿元规模。
报告指出,AIGC有狭义和广义概念之分。
狭义的AIGC与普通用户更为贴近,更关注图像、文本、音频、视频等内容生成,和Generative AI(生成式AI) 、Synthetic media(合成式媒体)等概念类似。
论广义概念,还包含策略生成(如Game AI中游戏策略生成)、代码生成(GitHub Copilot)、蛋白质结构生成等。
基于此,结合行业关键场景和玩家分布情况,目前,我国还处于AIGC发展的初期阶段,竞争趋势不明显,需要调整开发、资金等投入,寻求整体生态的快速搭建。
至2030年,AIGC产业发展共分三个阶段:
1、培育摸索期(2023-2025):整体均处于业务场景验证和变现探索期。
底层大模型发展加速,中间层尚未出现相关玩家,基于Stable Diffusion等开源模型的上层应用迅速出现,但受底层大模型接口限制,大部分技术尚未达到稳定进入实际生产环节的水平。
2、应用蓬勃期(2025-2027):基本价值创作路径和技术思路得到确认。
行业普遍尝试应用人机共创,且内容资讯、娱乐传媒等领域利用AIGC产生确定性价值。这一时期,底层大模型和中间层模型主要玩家基本确定,开放API增加,整体入局玩家增多,尤其是大量应用层玩家。
3、整体加速期(2028-2030):产业生态完善。
报告指出,2028年往后,AIGC在个性化、实时化、自主迭代等方向上的延展价值得到充分发挥,和其他业务系统进行紧密连接,会有相关初创公司产生完整解决方案。这一阶段AIGC成为内容领域基础设施,预计会催生出完全不同的新业态。
截至报告发布,国外AIGC赛道已有8家独角兽公司。
其中,推出了ChatGPT的OpenAI估值高达200亿美元,其次是Hugging Face 20亿美元。最新一家独角兽是成立16个月的Character.AI,估值10亿美元。此外,名单中还有Lightricks(18亿美元),Jasper(15亿美元),Glean和Stability AI(均为10亿美元),以及Anthropic(3亿美元)。
2022年以来,我国AIGC赛道出现了10余笔投资,其中融资体量最大的水上项目包括小冰公司(10亿元)、超参数科技、智谱AI、澜舟科技等。其余公司,包括数字力场、Tiamat、聆心智能、西湖心辰、深氧科技等,大多为数千万人民币级别融资。
然而,国内尚未看到与国外AIGC独角兽公司相匹配的收入产生。但经过对投资机构的广泛调研,多家机构已高度明确要将AIGC作为主投赛道,并推出了相应的孵化项目,预计本年度融资规模将有数倍增长。
伴随底层大模型生态的逐步开放,商业价值的落地验证,预计到2024年左右,融资规模将出现首次阶段性的指数级增加。
从融资现状来看,全球AIGC赛道持续走热,如何跑通商业模式产生实际营收,成为市场另一个关注焦点。
报告细分出5种不同的营收模式:
NO.1 MaaS(Model as Service)
适用于底层大模型和中间层进行变现,按照数据请求量和实际计算量计算。
到2027年,MaaS模式占市场规模比例将从5%增长至47%。
NO.2 按产出内容量收费
适用于应用层变现,如按图片张数、请求计算量、模型训练次数等收费。到2027年,该模式市场规模占比将从60%下降至32%。
该模式的关键在于如何从单次好奇驱动的行为切入,保证产品长期的复购率。
整个过程会受到具体属性影响,如版权授予(支持短期使用权、长期使用权、排他性使用权和所有权多种合作模式,拥有设计图案的版权)、是否支持商业用途(个人用途、企业使用、品牌使用等)、透明框架和分辨率等。
NO.3 软件订阅付费
第三种模式即ChatGPT Plus现有的盈利方式之一:每月向用户收取20美元费用。该模式在现有市场占有10%左右的比例。按照这种模式,Jasper等初创企业已经产生了营收。展开来说,Jasper以类SaaS服务的形式进行收费,分为初级、高级和订制三个模式,成立当年营收额就达到4500万美元,并收获了7万名用户。
这意味着AI正以越来越显性的方式产生商业模式。国内部分领先的AIGC公司,在用户规模、内容生成量上在2022年亦快速起步,2023年开始产生营收及盈利并非难事,但能否形成SaaS订阅模式尚待观察。
NO.4 模型训练费用
即最为传统的项目开发制度,如今占据市场营收份额的25%,到2027年,预计将有12%左右的下滑。
NO.5 其他模式
包括广告/流量模式,依靠产品获取用户点击,从中获得广告流量,这种营收模式的关键在于产品如何获得复购。
由于属于小型项目,在市场规模测算中暂不单独考虑。
玩家有几类?
报告按照基础设施层、模型层和应用层将它们分为三大类。
NO.1 基础设施层
这层玩家分别为行业提供数据、算力、计算平台、模型开发训练平台以及其他配套设施。
首先,数据方面,数据的数量、在行业/领域和颗粒度上的丰富性、以及和业务之间的反馈关系都有着极高的要求。
对于预训练大模型而言,多模态的数据集至关重要,以此才能让模型学习到更加完备的表示。
该层面的玩家包括数据提供方和服务方,前者可提供通用数据、垂类数据、特定任务下的标注数据、审核数据以及创作者生态;后者则主要负责数据分拆及标注等。
其次,算力方面。据微软统计,光是GPT-3.5在Azure AI超算基础设施上消耗的总算力就需7-8个耗资30亿美元投资规模的数据中心来支持运行。
因此算力玩家也是其中无比之重的一环,可分类为:以智算中心为代表的算力集群商、国产芯片商以及云服务商等。(计算平台和模型开发训练平台略。)
最后,其他配套设施方面的玩家扮演的主要是检测审核、交易撮合方、第三方确权及计价方以及创作配合工具(如渲染引擎)等方面的角色。
NO.2 模型层
这层主要分为底层通用大模型和中间层模型玩家。前者相对最容易形成壁垒,影响因素包括人才、时间、数据和资金等多个方面。
按开放模式可以分为:
(1)完全自有、不对外开放;
(2)开源,如2022年下半年起带来文生图领域蓬勃发展的CLIP及Stable Diffusion;
(3)API对外开放,这类模型的输出结果相对固定,但不同接口之间能够相互结合得到更优产出或是跨领域的产出;
(4)模型站,如Hugging Face、魔搭ModelScope。
中间层模型玩家则主打垂直化、行业化和细分化,分为:
(1)中间集成商,主要组合多个接口,形成新的大模型;
(2)行业大模型商,由底层模型持有者进行端到端提供;
(3)以及二次开发商,主要增加行业特色数据和行业认知。
根据行业/场景的理解和资源累计程度、资金成本支撑、上层数据支撑、上层应用生态、战略生态合作/投资、工程效果与技术成本以及AIGC技术能力的成熟这7个指标,报告给出了目前模型层的代表玩家名单:
NO.3 应用层
如果按照基于底层逻辑的应用,这层玩家涉及的业务分别包括:
1、生产可直接消费内容
其核心是AI在创意度和规模化中提供平衡点。对UGC而言,能够降低内容创作门槛;对PGC来说,能够代替人工完成声音录制、图像渲染等基础性创作工作。
需要注意的是,该场景的价值主要是降本增效。
报告指出,鉴于我国的内容供给市场相对饱和,相关公司需要关注对具体场景的供需情况进行谨慎分析,确定AI对内容供给速度的提升是否具有实际意义。
2、结合底层系统,生产含有附加价值的内容
例如超个性化、实时化、行业特色化。
注意由于需要和底层系统进行配合,相关提供方需要关注上下游业务接口的打通,以及相关领域知识的深化设计。
以内容营销领域为例,AIGC并不应当作为单独的服务对外提供,还是隶属于“创意供给—内容生产—内容管理(素材库与数据库)—内容分发—数据方案”中的内容生产部分。
由于品牌主最终是以整体的广告营销效果为标准,要使AIGC最终能够得到理想效果,基础素材、营销策略设定、技术生成、评估优化、数据回流等缺一不可。
3、提供内容生产辅助工具
模式包括:
由AI提供相关创作线索或基础草图,专业人员进行细致化调整或是补充特定素材;
由AI完成特定操作性工作,比如局部特效生成、低分辨率转高分辨率等。
该类玩家需要注意四点:
(1)国内对工具类产品的付费意愿有限,尤其是C端;
(2)需要关注场景本身的工具属性,据业内人士反馈,由于AIGC目前的生成可控性相对有限,创作工具在使用中的可介入程度会严重受到专业因素的影响;
(3)需关注相关业务平台的潜在跨界竞争,这主要是因为该赛道通常与内容分发及创作平台形成强绑定,大厂在垄断性方面也更强;
(4)人才结构的转移。
4、用于提供打包内容或解决方案
接下来,如果按照基于模态的应用分类,我们可以看到分别主营以下业务的玩家:
1、文本生成,包括:
(1)直接生成应用型文本,已发展较成熟,以客服类的聊天问答、新闻撰写等为核心场景。有相关行业人士预测,到2030年,90%以上的新闻将由机器人完成;
(2)直接生成创作型文本,适用于剧情续写、营销文本等细分场景,目前在语义层次的长文本通顺上还有较大的提升空间;
(3)生成交互型文本,典型场景为智能客服/聊天机器人/虚拟伴侣/游戏中的NPC个性化交互等;
(4)文本辅助生成,是目前国内工具落地最为广泛的场景,主要包括定向采集信息素材、文本素材预处理、自动聚类去重,并根据创作者的需求提供相关素材等功能,代表公司如写作猫。
2、音频生成,包含已经相当成熟的TTS场景和音乐创作。
该业务可提高歌曲乐曲、有声书、配音等内容的创作效率,实现有声内容的规模化生产。可实现声音IP化附属价值的语音克隆也算其中的一个应用。
3、图像生成,这一领域潜力巨大。据绘画生成网站6pen,未来5年全球10%-30%的图像有望由AI生成或辅助生成。
具体场景则可分为图像属性编辑、局部生成及更改以及端到端的图像生成。
4、视频生成,包括视频自动剪辑、属性编辑、视频到视频的自动生成等。
5、跨模态生成,包括文字生成图像(也分功能性和创意性)、文字生成视频(有更高的长序列建模要求,比文生图发展得要滞后两年左右)、图像/视频到文本(跨模态搜索、视觉问答系统、配字幕、标题生成)等。
6、策略生成,主要指AI基于特定问题和场景自主提出解决方案的过程,在游戏、自动驾驶、机器人控制等领域有极高的应用价值。
报告认为,总的来看,目前整体层级尚不够完整。由于资金量的需求,预计全栈全场景端到端的玩家数量相对有限。
其中模型层成为当前关键卡口,在一定程度上限制了上下层级的发展,应用层则是创业友好度最高的部分。
不过,若能在不同层级间形成良好的生态合作关系,整个行业的快速成长和成本分摊都能获得明显好处。