时隔一年多 DeepSeek发布新AI模型V4

深度求索(DeepSeek)星期五(4月24)发布新型人工智能模型V4的预览版。一年多前,这家中国初创公司曾凭借一款低成本的推理模型震惊世界,该模型的性能足以媲美美国竞争对手。

据法新社、路透社报道,深度求索在社交媒体上发表声明称,期待已久的DeepSeek-V4,有能力处理长达百万字的超长上下文,在智能体能力、世界知识和推理性能方面均处于国内和开源领域的领先地位。

该公司表示,V4目前已推出“预览版”。

新推出的DeepSeek-V4模型分为两个版本:DeepSeek-V4-Pro和DeepSeek-V4-Flash,将取代2024年12月推出的V3模型。其中,DeepSeek-V4-Flash因参数更少,效率更高,经济性也更强。

声明补充说,在世界知识基准测试中,DeepSeek-V4-Pro显著领先其他开源模型,仅略逊于顶级闭源模型、谷歌的Gemini-Pro-3.1。

中国科技巨头华为星期五表示,其基于昇腾950人工智能晶片的昇腾超级节点(Ascend supernode),将全面支持Deepseek的V4版本。

深度求索发布新模型前夕,美国白宫指责中国公司正在大规模窃取美国的人工智能(AI)技术,并誓言将采取行动,防止盗窃行为。

白宫官方X账号星期四(4月23日)发布白宫科技政策办公室的备忘录,指出美国政府已掌握信息,来自中国的实体正在开展蓄意的、工业级规模的行动,对美国前沿AI系统进行蒸馏。

蒸馏是人工智能开发中的常见做法,企业常用这一方法,为自家模型开发成本更低、体量更小的版本。今年2月,美国人工智能开发商Anthropic指控三家中国公司深度求索、月之暗面(Moonshot AI)和MiniMax非法提取其Claude聊天机器人的能力,并称这是知识产权盗窃。

您查看的内容可能不完整,部分内容和推荐被拦截!请对本站关闭广告拦截和阅读模式,或使用自带浏览器后恢复正常。