SheepNav
新上线今天0 投票

时隔一年再震美国AI界:DeepSeek发布新一代模型V4预览版,称代码能力大幅跃升

一年前,中国AI公司DeepSeek凭借模型R1以极低的训练成本震撼了美国AI行业。如今,这家公司再次出手,于4月24日发布了其下一代模型V4的预览版,并宣称该开源模型在多项能力上已能与Anthropic、Google和OpenAI等美国巨头的顶级闭源系统一较高下。

核心升级:代码能力成焦点

DeepSeek表示,V4相较前代模型实现了重大进步,尤其在 编程(coding) 领域。这一能力已成为当前AI Agent(智能体)的核心,并推动了ChatGPT Codex、Claude Code等工具的成功。通过强化代码生成与理解能力,V4有望在开发者工具链和自动化编程场景中发挥更大作用。

芯片自主化里程碑

值得注意的是,DeepSeek明确强调V4对 国产华为技术 的兼容性。这不仅是模型性能的突破,更标志着中国芯片产业在AI算力生态上迈出了关键一步——在面临美国芯片出口限制的背景下,能够与本土硬件深度适配的模型将具备更强的战略意义。

未解之谜:训练成本与硬件

尽管V4性能引人注目,DeepSeek尚未披露其训练成本或所使用的硬件细节。这与去年R1发布时的策略类似——当时该公司声称R1的训练成本仅为美国同行的几分之一,引发了对“低成本高性能”路线的广泛讨论。美国官员曾指控DeepSeek违规使用被禁的Nvidia芯片,而Anthropic则声称该公司滥用其模型Claude来改进自身产品。V4的训练是否依旧遵循低成本路线,以及是否采用了受管制硬件,仍有待观察。

行业影响与竞争格局

V4的发布恰逢全球AI竞赛白热化阶段。一方面,开源模型与闭源模型之间的性能差距正在缩小,DeepSeek V4若真能达到宣称水平,将进一步推动开源生态的繁荣。另一方面,中美在AI技术上的角力已延伸至芯片与供应链层面,DeepSeek对华为硬件的支持,可能加速国内AI基础设施的自主化进程。

对于开发者与企业用户而言,V4的代码能力提升意味着更高效的编程辅助、更可靠的代码生成,以及更低的部署门槛。然而,在DeepSeek公布更多技术细节与独立基准测试结果之前,市场仍需保持审慎。

延伸阅读

  1. Elon Musk and Sam Altman’s court showdown will dish the dirt
  2. 世界新闻摄影大赛给出答案:AI 生成的不是照片
  3. 你最喜欢的AI男色陷阱背后:那些虚拟男模和他们的创作者
查看原文