上周一款强大的人工智能(AI)模型,以匿名形式出现在一个开发者平台,引发外界猜测中国AI初创公司深度求索(DeepSeek)可能正在悄然测试下一代系统,为正式发布做准备。

据路透社星期三(3月18日)报道,这款名为Hunter Alpha的免费模型3月11日出现在AI网关平台OpenRouter上,没有标注任何开发者信息,后来被该平台称为“隐身模型”(stealth model)。

在路透社的测试中,Hunter Alpha聊天机器人自称是“主要以中文训练的中国AI模型”,并称训练数据截至去年5月,这与DeepSeek自家聊天机器人报告的知识截止时间一致。

不过,当被问及开发者时,Hunter Alpha拒绝透露相关信息。

Hunter Alpha的资料页面将其描述为一个拥有1万亿参数的模型,这意味着它在训练过程中使用了大约1万亿个可调参数,用以决定系统如何处理语言并生成回应。一般而言,参数规模越大,模型运行所需的算力也越高。

Hunter Alpha还宣称,上下文窗口最大可达100万个词元(Token),即模型在单次交互中能处理或记忆的文本量。一个词元大致对应一小段文本,例如单词的一部分。

这些规格与中国媒体对DeepSeek下一代V4模型的预期相符,据报道,该模型最早可能在4月发布。

路透社报道认为,这些相似之处并不能证明两者存在直接关联,但已加剧开发者的猜测,即有关匿名系统可能是DeepSeek即将发布模型的早期测试版。

另据《每日经济新闻》星期一(3月16日)报道,OpenRouter最新数据显示,上周(3月9日至3月15日)上榜的AI大模型中,中国AI大模型的周调用量上升至4.69万亿Token,较此前一周上涨11.83%;美国AI大模型周调用量为3.294万亿Token,环比下滑9.33%。中国AI大模型周调用量连续两周超越美国。

您查看的内容可能不完整,部分内容和推荐被拦截!请对本站关闭广告拦截和阅读模式,或使用自带浏览器后恢复正常。