DeepSeekV4多模态模型即将发布国产AI生态再升级

2月28日，据金融时报报道，DeepSeek将于下周发布其最新的大型语言模型V4，这是一款具备图片、视频和文本生成功能的多模态模型。这将是DeepSeek自2025年1月发布R1推理模型以来推出的首个重要模型。

多模态能力全面升级

据两位知情人士透露，位于杭州的DeepSeek实验室计划发布V4模型，这是一款具备图片、视频和文本生成功能的多模态模型。DeepSeekV4定位为原生多模态大语言模型，核心突破集中在多模态交互、编程能力、长文本处理、底层架构及国产算力适配五大维度。

他们表示，DeepSeek已与中国人工智能芯片制造商华为和寒武纪合作，针对这两家公司的最新产品对V4模型进行优化。据一位直接了解相关计划的人士透露，DeepSeek预计将于下周发布V4版本的同时发布一份篇幅较短的技术说明，并在大约一个月后发布一份更全面的报告。

值得注意的是，DeepSeek并未与英伟达合作，为其产品优化模型。英伟达继续主导着训练芯片市场，尤其是在计算密集型的预训练阶段，模型需要在此阶段吸收海量数据。

DeepSeekV4多模态模型即将发布国产AI生态再升级新闻

去年发布的R1版本附带了一份详细的技术报告，阐述了DeepSeek如何更高效地利用Nvidia芯片来训练和运行其模型。DeepSeek因分享其开发推理模型的训练方法而备受赞誉，这使得其他实验室能够研究并应用他们的发现。

该公司声称，其构建的系统仅需极少的计算能力，即可媲美硅谷领先的人工智能模型。这一举动震动了美国科技股，一些专家将其描述为人造卫星时刻，标志着中国作为人工智能强国的迅速崛起。

此后，DeepSeek发布的都是渐进式更新，而不是全新的模型，这使得阿里巴巴和Moonshot等国内竞争对手能够抢占市场对低成本开源中国模型的需求。本周较早时，Anthropic指责DeepSeek和其他两家中国人工智能实验室对其模型进行蒸馏攻击。

与此同时，OpenAI推出的生成式人工智能聊天机器人ChatGPT，在全球的周活跃用户已经超过了9亿。OpenAI的CEO萨姆·奥尔特曼宣布获得了亚马逊、英伟达、软银1100亿美元的投资，并提到ChatGPT的周活跃用户已经超过9亿，订阅用户超过了5000万。