DeepSeek V4 预览版发布：三大看点，以及世界模型的竞赛

本周五，中国 AI 公司 DeepSeek 发布了其备受期待的新旗舰模型 V4 预览版。这一版本带来了多项关键升级，可能重塑 AI 竞争格局。以下是 V4 的三大看点：

1. 超长上下文处理能力

V4 采用全新架构设计，能够更高效地处理大规模文本，支持比前代模型更长的提示词。这使得它在处理复杂文档、长对话或大型代码库时更具优势，为需要深度上下文理解的应用场景打开了新可能。

2. 开源性能比肩闭源巨头

尽管 DeepSeek 延续了开源路线，V4 的性能却足以与 Anthropic、OpenAI 和 Google 等公司的顶尖闭源模型相抗衡。这种“开源且高性能”的策略，可能进一步推动 AI 民主化，降低企业使用先进 AI 的门槛。

3. 首次适配华为昇腾芯片

V4 是 DeepSeek 首个针对华为 Ascend 芯片优化的模型。这不仅是技术适配，更是中国减少对英伟达依赖的关键测试。在中美芯片管制背景下，能否在国产芯片上实现同等性能，将直接影响中国 AI 产业的自主性。

与此同时，世界模型正成为 AI 研究的另一热点。与擅长数字世界的 LLM 不同，世界模型旨在理解物理世界的规律，让 AI 能完成叠衣服、导航等现实任务。斯坦福教授李飞飞、AMI Labs 创始人 Yann LeCun 等领军人物认为，世界模型能弥补 LLM 的固有局限，是通往通用机器人的关键。这一方向已被列入 MIT Technology Review 的“AI 领域 10 大要事” 榜单。

今日必读

中国阻止 Meta 收购 AI 初创公司 Manus：监管机构以国家安全为由，否决了 Meta 价值 20 亿美元的收购案。此举凸显中国对 AI 技术外流的警惕，并可能加剧中美 AI 竞争。
Google 向 Anthropic 投资高达 400 亿美元：这笔交易将 Anthropic 估值推至 3500 亿美元，资金将用于支持其日益增长的算力需求。

DeepSeek V4 的发布与世界模型的崛起，共同指向一个趋势：AI 的竞争正从单纯的模型规模，转向效率、自主硬件适配和物理世界理解的多维度博弈。

DeepSeek V4 预览版发布：三大看点，以及世界模型的竞赛

1. 超长上下文处理能力

2. 开源性能比肩闭源巨头

3. 首次适配华为昇腾芯片

今日必读

延伸阅读

相关资讯