
经过两年前“百模大战”的大浪淘沙,中国“大模型六小虎”中两家已在上周相继上市,被视为中国人工智能(AI)企业迈入资本市场,开启与国际巨头同台竞争的新阶段。
受访分析师认为,中国大模型企业虽然抓住了上市最佳时机,但在算力和融资上与美国行业巨头的差距仍客观存在。在资本市场回归理性后,这些初创企业的增长持续性仍有待验证。
号称“全球大模型第一股”的智谱AI上周四(1月8日)率先在香港上市,两天内股价上涨超32%。一天后(9日),成立仅四年的中国大模型公司MiniMax也登陆港交所,当天便股价翻倍。
“大模型六小虎”是中国六家估值超过10亿美元的AI大模型创业公司,分别是智谱AI、MiniMax、百川智能、月之暗面、阶跃星辰和零一万物。
其中,智谱AI成立最早,由清华大学在2019年孵化设立,2022年8月就发布中国首个自研预训练大语言模型。MiniMax紧随其后,由商汤科技前副总裁闫俊杰于2021年创立,也是目前少数具备全模态(文本、语音、视频)能力的大模型企业之一。
“六小虎”中的另外四家,则集中诞生于OpenAI推出ChatGPT后、中国大模型创业热潮高涨的2023年“百模大战”时期,目前估值在10亿美元到33亿美元之间。
过去两年,中国大模型发展迅速,尤其是在DeepSeek2024年底横空出世后,业界普遍认为中国与美国大模型的差距显著缩小。斯坦福大学去年5月的一份报告指出,中美顶级AI大模型性能差距已从2024年的17.5%,大幅缩小至去年的0.3%。
随着“六小虎”通过上市进入融资快车道,中美大模型之间的差距会否继续缩小,是外界关注的焦点之一。
中国大模型企业 仍面临算力“卡脖子”
香颂资本董事沈萌接受《联合早报》采访时指出,中国大模型企业当前首先面临的仍是算力“卡脖子”的问题。
自美国在2023年限制英伟达高端晶片出口中国以来,中国AI企业一直面临算力不足的问题。相比之下,OpenAI、Anthropic等美国大模型公司单个训练集群的GPU用量已突破10万块。
沈萌说,中国企业目前更多是采用“堆量”的方式弥补算力不足,虽然在一定程度上有效,但这既推高能耗和硬件成本,也加重系统调度的复杂度,使得单位算力的边际效率递减。
从融资规模来看,中美大模型企业也存在不小差距。智谱AI本次上市募资总额约42亿港元,MiniMax募资6.19亿美元,而Open AI成立以来已累计融资超过100亿美元,目前正计划新一轮融资1000亿美元。
不过,沈萌指出,中国企业的优势在于应用场景更丰富,同时数据获取门槛相对较低,有助于加快模型迭代和落地速度。
学者:竞争来自国内
中国经济学者盘和林受访时则指出,中国现阶段大模型公司和美国竞争是“全方位的”,但双方在部分领域并不重叠。以文字类大模型为例,美国以英文训练,中国则以中文训练,双方思路和受众并不相同。
此外,盘和林指出,中美多模态训练所用的素材数据也存在显著差异,“因此,可能中国大模型公司的真正对手不是美国,而是国内企业”。
中国互联网巨头阿里巴巴、字节跳动、百度等过去两年均推出大模型产品。字节跳动旗下火山引擎2024年推出的豆包大模型,以低于行业均价99%的价格,掀起大模型“价格战”,阿里巴巴和百度随后也对通义千问、文心一言等大模型降价甚至免费。
沈萌受访时直言,大模型初创企业将面临的路“很艰辛”。虽然它们能将所有资源集中到大模型领域,但最终仍要转化成商业应用的场景,才有可能实现更加稳定的增长。
另外,沈萌也指出,中国企业服务端和互联网段已经被互联网大厂瓜分殆尽,初创大模型企业很难挑战这一市场格局,这意味着它们的增长持续性或相对有限。
他说:“可能在上市早期很热闹,但是能否保证长期稳定增长,或实现加速增长,这就不好说。”