中国初创企业DeepSeek发布低成本AI模型,中美AI竞争加剧
中国杭州初创企业DeepSeek于2026年4月24日发布新一代人工智能模型DeepSeek-V4,宣称在计算与内存成本上大幅降低,具备百万词级超长上下文处理能力。该公司在微信平台发布声明称,新模型“在代理能力、世界知识和推理性能方面,实现了国内及开源领域的领先”。
DeepSeek-V4提供两个版本:DeepSeek-V4-Pro(1.6万亿参数)和DeepSeek-V4-Flash(2840亿参数),后者因参数更小而更具效率和经济性。模型已优化适配Claude Code、OpenClaw、OpenCode和CodeBuddy等主流AI代理产品。在世界知识基准测试中,V4-Pro表现优于其他开源模型,仅略逊于谷歌的Gemini-Pro-3.1。
该公司通过微信和X平台宣布,该模型的“超长上下文”能力标志着行业“真正的拐点”,将解决长上下文处理长期存在的性能慢、成本高的问题。iiMedia创始人张毅指出,这将使超长上下文支持成为标准功能,推动长文本处理从高端研究实验室进入主流商业应用。
DeepSeek-V4的发布正值中美AI竞争加剧之际。白宫于4月23日指控中国实体进行“工业规模的模型蒸馏行动”,以窃取美国AI技术。特朗普政府科技顾问迈克尔·克拉齐奥斯在X平台发文称,美国已掌握相关证据。模型蒸馏是AI开发中的常见技术,用于创建更小、更便宜的模型版本。
此前2025年1月,DeepSeek推出R1推理模型,以低成本实现与ChatGPT等美国顶尖模型相当的性能,引发“DeepSeek冲击”,导致AI相关股票抛售,并被媒体称为“AI领域的斯普特尼克时刻”。尽管其技术广受认可,但在敏感话题上常拒绝回答,引发数据隐私与审查争议。
在国内,DeepSeek的AI工具已被广泛应用于地方政府、医疗、金融等多个行业,其开源策略与OpenAI等西方企业的封闭模式形成鲜明对比。与此同时,Meta宣布将裁员10%,以提高生产力并加大AI投入;微软也被报道正在削减人员,显示科技巨头正重新调整AI战略布局。
编辑点评
DeepSeek-V4的发布标志着中国在大模型技术成本优化与性能平衡方面取得突破性进展,其超长上下文处理能力与低资源消耗的结合,可能重塑全球AI应用生态。这一进展不仅对开源社区产生深远影响,更直接挑战了美国在AI基础设施与商业应用领域的主导地位。白宫指控中国‘窃取’AI技术,实则反映出美国对技术优势流失的焦虑,尤其在特朗普与习近平即将举行北京峰会的敏感节点,此类言论或意在为技术保护主义政策铺路。从长远看,若中国持续推动开源与低成本AI模型普及,可能加速全球AI普惠化进程,但也可能加剧中美在技术标准、数据主权与供应链安全领域的博弈。未来,AI技术的‘去中心化’趋势或与地缘政治深度交织,成为全球科技治理的核心议题。