SheepNav
精选今天0 投票

DeepSeek V4 预览版发布:三大看点,以及世界模型的竞赛

本周五,中国 AI 公司 DeepSeek 发布了其备受期待的新旗舰模型 V4 预览版。这一版本带来了多项关键升级,可能重塑 AI 竞争格局。以下是 V4 的三大看点:

1. 超长上下文处理能力

V4 采用全新架构设计,能够更高效地处理大规模文本,支持比前代模型更长的提示词。这使得它在处理复杂文档、长对话或大型代码库时更具优势,为需要深度上下文理解的应用场景打开了新可能。

2. 开源性能比肩闭源巨头

尽管 DeepSeek 延续了开源路线,V4 的性能却足以与 Anthropic、OpenAI 和 Google 等公司的顶尖闭源模型相抗衡。这种“开源且高性能”的策略,可能进一步推动 AI 民主化,降低企业使用先进 AI 的门槛。

3. 首次适配华为昇腾芯片

V4 是 DeepSeek 首个针对华为 Ascend 芯片优化的模型。这不仅是技术适配,更是中国减少对英伟达依赖的关键测试。在中美芯片管制背景下,能否在国产芯片上实现同等性能,将直接影响中国 AI 产业的自主性。


与此同时,世界模型正成为 AI 研究的另一热点。与擅长数字世界的 LLM 不同,世界模型旨在理解物理世界的规律,让 AI 能完成叠衣服、导航等现实任务。斯坦福教授李飞飞、AMI Labs 创始人 Yann LeCun 等领军人物认为,世界模型能弥补 LLM 的固有局限,是通往通用机器人的关键。这一方向已被列入 MIT Technology Review 的“AI 领域 10 大要事” 榜单。


今日必读

  • 中国阻止 Meta 收购 AI 初创公司 Manus:监管机构以国家安全为由,否决了 Meta 价值 20 亿美元的收购案。此举凸显中国对 AI 技术外流的警惕,并可能加剧中美 AI 竞争。
  • Google 向 Anthropic 投资高达 400 亿美元:这笔交易将 Anthropic 估值推至 3500 亿美元,资金将用于支持其日益增长的算力需求。

DeepSeek V4 的发布与世界模型的崛起,共同指向一个趋势:AI 的竞争正从单纯的模型规模,转向效率、自主硬件适配和物理世界理解的多维度博弈。

延伸阅读

  1. 重塑AI数据栈:企业AI落地的真正瓶颈
  2. Replyless:每天把你的邮件摘要推送到Telegram的AI邮箱应用
  3. Orange Slice:用AI自动化你的每一项销售任务
查看原文