AI 资讯

每日聚合最新人工智能动态

661

特朗普政府解除对Anthropic的Mythos和Fable模型的出口限制

新上线

美国已解除对Anthropic出口其Mythos和Fable模型的许可要求，此前这一要求实质上切断了公众对这些被认为是迄今最先进AI模型的访问。Anthropic表示将于7月1日（周三）开始恢复模型访问。6月12日，美国政府将这些产品列入出口受限技术清单，意味着未经特别批准不得向外国公民提供。遵守该规定在规模上不可行，迫使Anthropic完全终止了模型的公开访问。经过数周谈判，商务部长霍华德·卢特尼克表示，Anthropic已同意主动检测并解决与模型相关的安全风险；与美国政府合作制定Mythos、Fable及未来模型的发布协议和标准；并向美国政府通报任何恶意活动。Anthropic此前已公开承诺自愿执行大部分措施，这早于出口规则的存在。网络安全专家最初对此限制持怀疑态度，认为这更像是一种施压手段，而非安全修复，旨在惩罚Anthropic高管对政府及总统政治对手可能使用该技术的公开批评。Mythos最初于4月向选定的组织开放，以缓解对其识别和利用软件漏洞能力的担忧，而名为Fable的版本于6月向公众发布，并附带了额外的安全护栏。然而，随着亚洲AI公司开始发布接近Mythos能力的模型——如Fugu和Tulongfeng——美国政府面临压力，需放松对Anthropic的限制，以确保美国AI能在全球竞争。上周，卢特尼克批准Mythos向白宫选定的客户发布。OpenAI的最新模型也发布给了特朗普团队批准的组织，而非公众。特朗普政府在AI政策制定上的反复无常导致整个行业的公司对未来模型发布的监管缺乏明确性。

TechCrunch17天前原文

662

Wayve 启动 8500 万美元员工要约收购，估值达 85 亿美元

新上线

英国自动驾驶初创公司 **Wayve** 近日宣布启动一项价值 **8500 万美元** 的员工要约收购，公司估值达到 **85 亿美元**。此举旨在为员工提供流动性，同时作为吸引和留住顶尖人才的战略工具。 Wayve 专注于基于端到端深度学习的自动驾驶技术，其方法不依赖传统的高清地图和规则驱动系统，而是通过大量驾驶数据训练神经网络，使车辆具备类似人类的驾驶能力。这一技术路线在行业内独树一帜，也吸引了包括微软、维珍等知名投资者的支持。员工要约收购在 AI 初创公司中正成为趋势，尤其是在市场尚未公开上市的情况下，通过允许员工出售部分股份，公司能够在不稀释现有股东权益的前提下，为员工提供变现机会，从而增强薪酬竞争力。对于 Wayve 而言，85 亿美元的估值反映了市场对其技术前景的认可，尤其是在自动驾驶领域竞争日益激烈的背景下。本次要约收购的规模相对公司整体估值较小，但信号意义重大。它表明 Wayve 的财务状况稳健，且管理层有意通过激励手段巩固团队稳定性。此外，这也可能为未来的 IPO 或新一轮融资铺平道路。从行业视角看，Wayve 的举措与 OpenAI、Anthropic 等 AI 明星公司的做法类似，后者此前也通过员工股份回购计划来维持人才优势。在 AI 人才争夺白热化的当下，灵活的股权管理策略正成为初创公司差异化竞争的关键。总体来看，Wayve 的这次要约收购既是内部治理的优化，也是一次对外信心展示。随着自动驾驶行业从概念验证走向商业化落地，如何平衡技术突破与商业可持续性，将是 Wayve 及其同行需要持续面对的课题。

TechCrunch17天前原文

663

Anthropic 的 Claude Fable 5 获准回归，此前因美国政府出口管制被长期搁置

新上线

经过数周与美国特朗普政府的谈判，Anthropic 终于获准重新上线其消费者级模型 **Claude Fable 5**。该公司在 X 平台发文称，计划于周三开始面向全球 Claude 平台用户恢复访问，并将在不久后重新启用 AWS、Google Cloud 和 Microsoft Foundry 上的访问权限，但未给出具体时间表。 Anthropic 在声明中表示：“我们已收到通知，商务部已解除对 Claude Fable 5 和 Mythos 5 的出口管制。我们将于明天开始恢复访问，并尽快分享后续更新。感谢用户的耐心，也感谢所有参与模型重新部署的人员。”该公司还于周二晚间发布博文，详细说明了事件经过、修订后的安全措施、正在推进的 AI 行业新流程，以及未来与政府共享信息的方式和即将推出的模型的预发布测试计划。今年 6 月初，在特朗普政府发出周五晚最后通牒后，Anthropic 暂时下线了 **Fable 5**——这款面向消费者的模型与 Anthropic 的 Mythos 5 基于相同底层技术，但拥有更多安全防护措施。由于担心技术可能被越狱利用，政府发布了出口管制指令，禁止任何外国公民（包括企业客户的非美籍成员，甚至 Anthropic 的许多员工）使用 Mythos 5 或 Fable 5。此次争议的导火索是亚马逊研究人员发现并报告的越狱问题，该问题在很大程度上导致了政府的强硬立场。此次事件反映了 AI 行业与政府监管之间的紧张关系，尤其是在模型安全与国家安全的交叉点上。Anthropic 通过加强安全措施和与政府合作，最终促成了模型的解禁，但未来类似争议可能仍会重演。

The Verge17天前原文

664

特朗普政府解禁Anthropic最强AI模型出口限制

新上线

特朗普政府近日解除了对Anthropic公司两款最先进AI模型——**Mythos 5**和**Fable 5**的出口管制。这一决定是在Anthropic与美国商务部达成协议后作出的，商务部长霍华德·卢特尼克在致Anthropic联合创始人汤姆·布朗的信中正式宣布了这一消息。此前，美国政府曾以国家安全为由，限制这些模型向外国公民或实体出口，仅允许少数经批准的美国公司和政府机构使用。Anthropic最初认为政府的担忧过度，强调完全杜绝“越狱”攻击是不可能的。但近几周，公司改变了策略，积极与商务部及白宫合作，承诺加强安全防护，包括主动检测和应对模型的安全风险，并与美国政府共同制定未来模型的发布标准。值得注意的是，Anthropic CEO达里奥·阿莫迪在近期会谈中被替换，由更受官员欢迎的布朗出面沟通，这被视为公司调整沟通方式的信号。最终，政府认为Anthropic在安全措施上的承诺足够可靠，因此解除了限制。这一事件反映了AI监管与产业发展的微妙平衡。一方面，美国政府持续关注先进AI模型的潜在风险，尤其是网络安全领域；另一方面，过度限制可能压制创新并削弱美国在AI领域的竞争优势。Anthropic的妥协表明，企业需要在技术理想与现实监管之间找到折中点。此次解禁不仅为Anthropic的商业拓展扫清了障碍，也可能影响其他AI公司与政府的互动模式。未来，模型的安全性与可出口性将成为AI行业的核心议题之一。

WIRED AI17天前原文

665

OpenClaw 正式登陆 Android 和 iOS，AI 智能体走进手机

新上线

曾于今年早些时候爆红网络的免费开源 AI 智能体项目 **OpenClaw**，如今终于正式推出移动端应用。开发者于周二在 X 平台宣布，OpenClaw 现已可在 **iOS 和 Android** 两大平台下载。用户可通过手机与 OpenClaw Gateway 配对——这是一个路由层，负责将请求连接至 AI 智能体及其调用的工具与技能。这意味着，你可以在口袋里运行 OpenClaw 智能体，只要设置得当，它们或许能帮你高效完成各种任务。从编程到膳食规划，用户已将 OpenClaw 应用于多种场景，不过也有部分反馈称效果未达预期。OpenClaw 的走红与其早期推出的 MoltBook 密切相关——一个号称完全由智能体运营的社交平台。今年 2 月，OpenClaw 的创造者 **Peter Steinberger** 宣布加入 OpenAI。随后有研究者指出，MoltBook 的“智能体”实为人类冒充，这场营销秀虽损害了部分可信度，却成功为 OpenClaw 造势，也预示了智能体时代的到来。如今，AI 智能体已嵌入整个 AI 生态，并日益渗透至各类设备，手机自然成为下一个关键阵地。OpenClaw 的移动化标志着这一趋势的进一步加速。

TechCrunch17天前原文

666

前DeepMind三人组：从扑克AI到量化对冲基金，身价已超5亿美元

新上线

三位前DeepMind研究员创办的布拉格AI实验室EquiLibre Technologies，凭借曾击败人类扑克高手的强化学习技术，如今在量化交易领域大放异彩。该公司在由Creandum领投的A轮融资后估值超过5亿美元，其算法已用于标普500和纳斯达克的每日数十亿美元交易，并保持自上线以来月收益从未为负的记录。 ## 从牌桌到交易桌：强化学习的跨界魔力 EquiLibre的CEO Martin Schmid指出，扑克和华尔街的共同点在于两者都适合**强化学习**——一种通过奖励激励模型自我学习的训练方法。在交易中，评分标准极其简单：模型赚了多少钱？这种清晰的反馈机制让AI能快速优化策略。 ## 零亏损月的完美记录与量化公司Tower Research Capital合作，EquiLibre的算法自2025年登陆加密货币市场，随后扩展到传统股票市场。据称，这些AI代理自上线以来**每月均实现正收益**，没有任何一个月亏损。这种稳定性在波动剧烈的金融市场中尤为引人注目。 ## 实验室优先，金融次之尽管EquiLibre的技术直接应用于盈利，但三位创始人——CEO Schmid、CTO Rudolf Kadlec和CSO Matej Moravcik——均无金融背景。Schmid强调：“我们首先是一个实验室，不是金融公司。我这么做不是因为对让市场更有效感兴趣，而是因为我们热爱建造前所未有的东西。”这种研究驱动的心态吸引了Creandum，其副总裁Cameron Sellers表示，金融市场是地球上最大的潜在市场之一，而EquiLibre的AI潜力巨大。 ## 行业背景：DeepMind校友的AI创业潮 EquiLibre并非孤例。前DeepMind研究员创办的AI公司正成为VC追捧的对象，例如近期融资11亿美元的Ineffable Intelligence。EquiLibre的成功进一步证明了强化学习在现实世界中的价值，尤其是在高回报的量化交易领域。 ## 小结从扑克AI到量化对冲基金，EquiLibre用技术证明了强化学习的跨界能力。其5亿美元估值和零亏损记录，不仅展示了AI在金融领域的落地潜力，也延续了DeepMind校友在AI创业中的影响力。

TechCrunch17天前原文

667

新攻击揭示AI浏览器为何是个坏主意：只需告诉大模型“2+2=5”就能让其执行违规指令

新上线

一项最新的安全研究再次为“AI浏览器”敲响警钟——研究人员发现，通过一种简单到令人不安的方式，就能让集成在浏览器中的大语言模型（LLM）无视安全限制，执行本应被禁止的指令。攻击者只需在网页中嵌入一句类似“2+2=5”的谬误前提，模型便会因逻辑混乱而“破防”，顺从地生成恶意内容或执行危险操作。 ## 攻击原理：逻辑谬误绕过安全护栏 AI浏览器将LLM直接嵌入用户浏览环境，使其能“阅读”网页并代为执行操作，如填写表单、总结内容或处理支付。然而，这项功能也打开了新的攻击面。安全团队发现，当模型在上下文中遇到一个明显错误但被呈现为“事实”的陈述时（例如“2+2=5”），其内部推理机制会优先接受这个错误前提，从而瓦解基于常识和伦理规则的安全对齐。这种攻击方式被称为“**前提注入**”（Premise Injection），它不需要复杂的编码或社会工程，只需攻击者控制一个网页（比如通过恶意广告或钓鱼网站），在其中插入看似无害的谬误语句。模型在“阅读”该页面后，会将其作为对话上下文的一部分，后续用户发出的任何指令（包括“帮我编写恶意软件”或“窃取你的密码”）都可能被错误地执行。 ## 为什么AI浏览器风险更高？与普通聊天机器人不同，AI浏览器拥有**更高的权限**：它能访问用户当前浏览的页面内容、表单字段，甚至可能调用浏览器API进行登录、支付等操作。一旦模型被“误导”，攻击者不仅能让它输出有害文本，还能诱导它**代表用户执行实际动作**，例如自动转账、修改账户设置或泄露私密信息。此前已有研究指出，LLM在面对矛盾信息时容易“迷失方向”，但本次攻击的特殊之处在于：它利用了模型对**显式上下文**的过度信任。即使模型在训练中知道“2+2=4”，但当网页中明确写着“2+2=5”时，它可能认为这是用户提供的“真实”环境，从而放弃自身知识。这种“上下文优先于训练”的漏洞，在AI浏览器这种长期保持上下文的应用中尤其危险。 ## 行业影响与防御方向目前，主流浏览器厂商（如微软Edge、Google Chrome）已开始试验AI助手功能，但尚未完全开放这类高风险权限。然而，一些初创公司推出的“AI原生浏览器”则直接赋予了模型读写网页的完整能力。此次攻击证明，**简单的逻辑矛盾就足以瓦解安全护栏**，而护栏本身正是AI安全的核心防线。防御措施方面，研究者建议： - 严格限制模型对网页内容的信任等级，区分“用户输入”和“网页输出”； - 在模型推理前对上下文进行**逻辑一致性检查**，识别明显谬误； - 为敏感操作（如金融交易）增加二次确认机制，而非完全依赖模型判断。 ## 小结 “2+2=5”式攻击虽然简单，却直指大模型安全对齐的深层缺陷：**模型更倾向于相信上下文，而非自身训练知识**。在AI浏览器这类高权限场景中，这一缺陷可能被放大为实际的安全灾难。对于普通用户而言，在浏览器权限安全方案成熟之前，谨慎使用AI浏览器功能，或许是最稳妥的选择。

Ars Technica17天前原文

668

Google NotebookLM 新增 TikTok 风格短视频，60 秒 AI 摘要你的研究笔记

新上线

Google 的 AI 笔记工具 NotebookLM 正在推出一项新功能：生成 TikTok 风格的竖屏短视频，帮助用户快速回顾研究资料。该功能面向 **Google AI Ultra** 和 **Pro** 订阅用户开放，能够根据用户上传至应用中的资料，自动生成一段 60 秒的 AI 视频。 ### 视频生成示例：澳大利亚与鸸鹋的战争 Google 展示的示例视频讲述了 **澳大利亚与鸸鹋之间未成功的战争**。视频采用剪纸风格的 AI 艺术绘制鸸鹋形象，并配以旁白解说。这并非 NotebookLM 首次提供多模态交互方式——此前它已能生成 **AI 播客**、**电影感视频** 和 **可视化讲解内容**。 ### 如何使用：三步生成短视频要生成一段 60 秒的短视频，用户只需在网页或应用端打开一个笔记本，从右侧 Studio 栏中选择 **“Video”**，再点击 **“Short”**，然后选择希望 NotebookLM 聚焦的主题（或自行输入），最后点击 **“Generate”** 按钮即可。目前该功能仅支持 **英文**，免费用户的支持将在“不久后”到来。 ### 行业背景与意义 NotebookLM 最初以“AI 笔记助手”形象亮相，主打长文档摘要与问答。然而随着 AI 视频生成能力（如 Veo 等模型）的成熟，Google 正将 NotebookLM 从“生产力工具”扩展为“内容生成器”。**TikTok 风格视频**的加入，意味着用户可以直接将研究报告、论文或项目文档转化为适合社交传播的短视频，这对于需要快速分享研究亮点或进行汇报的职场人士与学生而言，可能带来效率提升。不过，从示例来看，视频中的 AI 图像和旁白仍带有明显的“AI 生成感”，其叙事逻辑是否足够准确、能否避免“幻觉”问题，还有待更多用户实测。Google 选择先向付费用户开放，可能也是在收集反馈，优化生成质量。 ### 小结 NotebookLM 的这次更新，反映了 AI 工具从“辅助理解”向“辅助表达”的演进趋势。当 AI 不仅能帮你读懂资料，还能自动将其包装成适合短视频平台的内容时，信息消费的方式正在发生微妙变化。对于内容创作者、研究人员和知识工作者来说，这或许是一个值得关注的新能力。

The Verge17天前原文

669

谷歌推出 Nano Banana 2 Lite：更快、更便宜的图像生成器

新上线

谷歌于周二发布了其最新版 AI 图像与视频生成器 **Nano Banana 2 Lite**，主打速度与成本优势。据官方介绍，该模型延迟显著降低，生成单张图像仅需 **4 秒**，定价为每千张图像 **0.034 美元**，适合需要大规模快速迭代内容的创作者。 Nano Banana 2 Lite 是去年夏季发布的初代 Nano Banana（基于 Gemini 3.1 Flash）及今年 2 月推出的 Nano Banana 2 的后续版本。Nano Banana 2 已引入更逼真的图像生成能力，而 Lite 版本则针对高吞吐量工作流进行了优化，旨在成为“快速批量生产”的利器。谷歌同时提供更高性能的 Nano Banana Pro，面向高级用例。尽管消费者对所谓“AI 垃圾内容”存在抵触情绪，科技公司仍在大力投资图像与视频生成工具。谷歌常将其模型定位为广告创作的便捷助手。值得注意的是，好莱坞与 AI 公司的合作也在加深——谷歌刚与知名独立制片商 A24 达成 **7500 万美元** 协议，此举引发部分粉丝批评。 Nano Banana 2 Lite 现已通过 **Google AI Studio**、**Gemini API** 及 **Gemini Enterprise Agent Platform** 提供，并取代初代 Nano Banana 成为新的入门级模型。同日，谷歌还宣布了 **Gemini Omni Flash** 的更广泛发布（视频输出定价为每秒 0.10 美元），并展示了新演示应用 **Omni Product Studio**，可将静态图像转化为电影级电商视频。谷歌表示，借助这两款模型，开发者可构建端到端的多媒体体验。

TechCrunch17天前原文

670

Claude Sonnet 5 登陆 AWS：Anthropic 最强 Sonnet 模型登场

新上线

Anthropic 今日宣布，其新一代 Sonnet 模型 **Claude Sonnet 5** 已在 **Amazon Bedrock** 和 **Claude Platform on AWS** 上正式可用。这是 Anthropic 最新系列的首次 Sonnet 发布，在编码、智能体任务和专业工作方面带来显著提升，同时保持了 Sonnet 级别的定价与速度优势。 ## 性能飞跃：接近 Opus 的智能，Sonnet 的价格 Claude Sonnet 5 被定位为“最强大的 Sonnet 模型”，在推理、编码和智能体可靠性上接近旗舰模型 Opus 的水平，但成本远低于 Opus。这意味着团队可以在日常大规模任务中依赖 Sonnet，而将 Opus 留给最复杂、最需要顶级推理的场景。具体能力提升包括： - **多阶段规划**：模型能够跨阶段保持计划，跟踪已完成和待办事项，减少修正轮次。 - **编码能力增强**：针对真实代码库设计，支持多文件变更、长序列调试和重构，输出更干净、更易维护的代码。 - **智能体可靠性**：作为自主代理的骨干，能处理复杂依赖链和多步骤工具调用，适合客户服务与内部自动化场景。 - **专业工作**：可将长篇幅、复杂、非结构化信息合成结构化产出，如简报、分析和报告。 ## 在 AWS 上的部署优势通过 Amazon Bedrock 使用 Claude Sonnet 5，企业可以： - 在现有 AWS 环境中构建，维持企业级安全和区域数据驻留。 - 扩展推理规模，享受统一的账单和认证体系。 - 通过 Claude Platform on AWS 获得 Anthropic 原生平台体验，包括相同的 API、功能和控制台操作。 ## 开发者实操指南对于 AI 工程师而言，Sonnet 5 的部署重点在于将其集成到智能体系统和生产推理工作流中。官方建议： - 在需要强推理、编码和智能体可靠性的规模化场景中优先使用 Sonnet 5。 - 对于要求最高推理精度的任务，仍可选择 Claude Opus。 - 利用 Bedrock 的托管功能简化模型管理和监控。 ## 行业意义 Claude Sonnet 5 的发布标志着 Anthropic 在“性能-成本”平衡上的一次关键突破。此前，Sonnet 系列主要面向日常任务，而 Opus 则专攻高端推理。Sonnet 5 的“接近 Opus”表现，可能促使更多企业将核心工作负载迁移至 Sonnet 层级，从而降低整体 AI 部署成本。同时，其在编码和智能体领域的强化，直接呼应了当前企业对自动化开发和多步骤任务处理的迫切需求。随着 Claude Sonnet 5 在 AWS 上的落地，开发者可以更便捷地利用这一模型构建下一代 AI 应用。更多详情可参阅 AWS 官方文档。

AWS ML17天前原文

671

谷歌推出最快最便宜的图像模型 Nano Banana 2 Lite：4秒出图，成本减半

新上线

谷歌 DeepMind 近日发布了一款名为 **Nano Banana 2 Lite** 的全新图像生成模型，号称是其最快、最便宜的图像模型。该模型是 Gemini 3.1 系列的一部分，正式名称为 Gemini 3.1 Flash Lite Image，旨在以极低的成本实现快速图像生成，特别适合快速原型设计和创意探索场景。 ## 速度与成本的革命性提升 Nano Banana 2 Lite 最大的亮点在于**速度**。在默认的低思考模式下，从文本到图像仅需约 **4 秒**，而标准版 Nano Banana 则需要约 20 秒。这种速度的提升直接转化为**成本优势**：API 调用费用平均为 **每千张图像 0.034 美元**，输入 token 价格为每百万 0.25 美元，输出 token 为每百万 1.50 美元。相比之下，Nano Banana 2 的输出价格是其两倍，而旗舰版 Nano Banana Pro 的输出价格高达每百万 12 美元，是 Lite 版的八倍。 ## 质量与场景的取舍当然，速度与低价的背后是质量的妥协。谷歌坦言，Nano Banana 2 Lite 在处理**小文字**和**信息图表**时表现不佳，容易出现错误数据或不一致。人物和角色的**一致性**在多次迭代中也较差。但谷歌提供的 Arena.ai Elo 评分显示，用户对 Lite 版本输出质量的评价几乎与标准版持平，尽管这些基准测试可能忽略细节瑕疵。 ## 适用场景与潜在影响谷歌建议，对于需要高精度文本或逼真照片效果的任务，仍应使用 Flash 或 Pro 版本。但 Nano Banana 2 Lite 的**快速迭代**能力使其成为设计师和开发者探索创意、快速验证想法的理想工具。这种“快速射击”式生成也可能带来更多低质量 AI 内容（即“AI 垃圾”）的泛滥，这并非谷歌一家公司面临的问题。 ## 行业背景在 AI 图像生成市场，平衡质量、速度和成本一直是核心挑战。谷歌此举直接瞄准了那些对成本敏感、需要大量试错的应用场景，如早期概念设计、广告创意素材生成等。与此同时，开源模型和竞品（如 Midjourney、Stable Diffusion）也在持续优化效率，谷歌通过 Gemini 生态的整合与定价策略，试图在开发者市场中抢占份额。总体而言，Nano Banana 2 Lite 并非为追求极致画质的用户设计，而是为那些需要“足够好”且“足够快”的实用主义者提供了一个极具性价比的选择。

Ars Technica17天前原文

672

英伟达竞争对手Etched估值达50亿美元，AI芯片订单破10亿

新上线

英伟达（NVIDIA）在AI芯片领域的统治地位正面临新挑战。据TechCrunch报道，AI芯片初创公司Etched于本周二发布进展报告，宣布其芯片已由台积电（TSMC）成功制造，并已签订价值10亿美元的合同订单。这些订单来自其名为“前沿推理集群”（Frontier Inference Clusters）的完整系统——包含自研芯片、定制机架和软件，旨在加速AI推理过程，降低成本和能耗。 Etched成立于2022年，由两位哈佛辍学生Gavin Uberti（CEO）和Robert Wachen（总裁）创立，两人均为Thiel Fellowship获得者。公司至今已累计融资8亿美元，其中最近一笔5亿美元融资于去年12月秘密完成，投后估值达50亿美元。投资方阵容豪华，包括VentureTech Alliance、Jane Street、Hudson River Trading、Two Sigma、Ribbit Capital和Stripes（领投），以及AI界知名天使投资人Andrej Karpathy、Geoffrey Hinton、李飞飞、Arthur Mensch和Scott Wu。此外，亿万富翁Stanley Druckenmiller和Peter Thiel也位列股东。 Etched的核心产品是专为AI推理优化的专用芯片，区别于英伟达的通用GPU。公司声称，其系统可大幅提升前沿模型的推理速度、能效和成本效益——推理是当前AI公司规模化服务客户的最大瓶颈和成本中心，这也解释了为何投资者对这类解决方案趋之若鹜。然而，Etched的创业之路并非一帆风顺。据联合创始人在播客中透露，2023年时他们曾向主要投资者提交长达30页的备忘录，论证AI将需要专用芯片而非GPU，却屡遭拒绝，公司一度面临现金流断裂风险。如今，AI投资热潮彻底改变了局面。Etched目前正与客户进行首批产品的测试，计划通过其“前沿推理集群”抢占市场。 Etched的崛起反映了AI芯片行业的一个趋势：随着模型规模爆炸式增长，通用GPU的局限性日益显现，专用ASIC芯片（如Etched的产品）正成为解决推理效率问题的关键。英伟达的霸主地位虽未动摇，但类似Etched、Cerebras、Groq等初创公司的涌现，正在为该领域注入更多竞争与创新。

TechCrunch17天前原文

673

Anthropic 发布 Claude Sonnet 5：更便宜的智能体模型来了

新上线

Anthropic 正式推出 Claude Sonnet 5，这是其“中端”模型的最新升级版，主打更强的智能体（agent）能力、更低的价格以及更可靠的安全性。该模型在编程、推理和知识工作等任务上大幅超越前代 Sonnet 4.6，性能接近高端模型 Opus 4.8，但成本显著降低。 ## 智能体能力成为标配随着 OpenAI 的 GPT-5.6 Sol 和 Google 的 Gemini 3.5 Flash 相继推出具备智能体能力的模型，Anthropic 也迅速跟进。Sonnet 5 能够自主规划任务、使用浏览器和终端等工具，并长时间独立运行——这些能力在几个月前还需要更昂贵的大型模型才能实现。Anthropic 在官方博客中表示：“它可以在一个水平上制定计划、使用工具并自主运行，而就在几个月前，这还需要更大、更贵的模型。” 这标志着智能体能力已成为所有价位模型的“入场券”。行业竞争的关键不再是“谁能做智能体”，而是“谁做得更便宜、更可靠”。 ## 性能接近 Opus，价格大幅降低 Sonnet 5 在多项基准测试中表现亮眼。在智能体编码测试中，它取得 **63.2%** 的分数，高于 Sonnet 4.6 的 58.1%，接近 Opus 4.8 的 69.2%。在知识工作基准上，Sonnet 5 甚至**略微超过** Opus 4.8——后者素以解决高难度问题（如微妙判断和深度研究）著称。定价方面，Sonnet 5 初始价格为 **每百万输入 token 2 美元、每百万输出 token 10 美元**（促销价至 8 月 31 日），之后将调整为 3 美元和 15 美元。这使其低于 Opus 4.8、OpenAI 的 GPT-5.5 和 Google 的 Gemini 3.1 Pro，但比 Gemini 3.5 Flash 略贵。 ## 实用性与安全性并重即日起，Sonnet 5 将成为免费版和 Pro 版用户的默认模型，并适用于所有订阅计划。Anthropic 强调，Sonnet 5 在安全性方面也有提升，更适合在缺乏人类监督的场景下运行。总结来看，Sonnet 5 的推出进一步压缩了高端模型的价格空间，让更多开发者能够以较低成本获得接近顶级的智能体能力。对于预算有限但追求高性能的团队而言，这无疑是一个极具吸引力的选择。

TechCrunch17天前原文

674

Netflix 在《威利·旺卡》真人秀中使用 AI 生成的 Gene Wilder 声音

新上线

Netflix 在其即将推出的真人秀《旺卡的金色门票》中，使用 AI 技术重现了已故演员 Gene Wilder 的声音，引发了关于 AI 在娱乐行业应用的新讨论。该节目将于 **9 月 23 日** 在 Netflix 首播，延续了平台将虚构故事转化为现实竞赛的趋势，类似于之前的《鱿鱼游戏》真人秀。根据 Deadline 报道，Netflix 与 AI 音频公司 **ElevenLabs** 合作，并在 Wilder 家人的同意下生成了这段旁白。此前，Netflix 已使用类似技术重现了 Michael Caine 和 Stan Lee 的声音。这一做法既展示了 AI 在内容创作中的潜力，也引发了关于伦理和版权的新思考。节目本身被描述为一场“高风险的社交实验”，将有 12 名“幸运”的金色门票得主及其选中的伴侣参与竞争，最终胜者将在 **9 月 30 日** 的两部分大结局中揭晓。值得注意的是，虽然节目中使用的旁白是 AI 生成的，但所有布景均为实景搭建，并非 AI 伪造。这并非 Netflix 首次涉足 AI 声音领域。2021 年，该公司与 Roald Dahl 公司达成合作，并计划在 2027 年推出独立的动画电影《查理与巧克力工厂》。此次 AI 声音的使用，进一步巩固了 Netflix 在 AI 技术与娱乐融合方面的探索。然而，这一做法也引发了争议。批评者认为，使用 AI 重现已故演员的声音可能涉及伦理问题，尤其是在未明确告知观众的情况下。支持者则指出，在家人同意的前提下，AI 技术可以作为一种工具，延续经典角色的生命力。总的来说，Netflix 的这一尝试不仅展示了 AI 在娱乐行业的实际应用，也为未来类似技术如何与伦理、法律框架共存提供了新的案例。随着更多公司探索 AI 生成内容，行业标准和观众接受度将成为关键议题。

The Verge17天前原文

675

特朗普用AI重新设计所有政府网站的计划，一年后变成了“数字噩梦”

新上线

美国总统特朗普去年通过行政命令成立的“国家设计工作室”（NDS），原本雄心勃勃要利用AI在三年内重新设计所有.gov网站，但如今一年过去了，进展寥寥，反而引发诸多争议。 ### 计划与现实脱节 NDS被赋予的任务是更新美国网页设计系统（USWDS），并彻底改造约2.7万个政府网站。然而，这一任务从一开始就面临巨大挑战：DOGE（政府效率部门）大幅裁减了此前负责改进政府网站的团队，包括解散18F技术部门、重组美国数字服务局，导致相关专业人才流失。据NextGov报道，截至2023年中，仅有30%的政府网站采用了USWDS标准。而USWDS团队在特朗普上任后更是被削减至仅剩一名全职员工。 ### 成果寥寥，争议不断一年来，NDS最大的“成就”是现代化了联邦退休系统，但前政府工作人员指责这属于“虚假胜利”，因为该项目在NDS成立前就已启动。此外，NDS仅上线了数十个网站，且多为单页或重定向页面，设计专家批评其过度依赖AI，且未测试是否符合《美国残疾人法案》的无障碍要求。随着审查加剧，大多数机构现在拒绝与NDS合作采用新标准。 ### AI设计的隐忧 NDS大量使用AI生成设计方案，但缺乏人工审核和用户测试，导致网站可用性差、视觉混乱。专家指出，AI无法理解政府网站的复杂性和对无障碍的严格要求，盲目应用可能造成更大的数字鸿沟。 ### 行业视角这一案例凸显了在公共部门强行推广AI的潜在风险。与私营企业不同，政府网站必须兼顾公平性、可访问性和法律责任，而AI目前尚难以完全胜任。NDS的失败也为其他计划用AI快速改造公共服务的项目敲响了警钟：技术不能替代对用户需求的深入理解和专业设计团队的持续投入。

Ars Technica17天前原文

676

在 Amazon Bedrock AgentCore 上使用 AG-UI 协议为 AI 智能体构建生成式用户界面

新上线

AI 智能体早已不止于聊天。借助合适的协议，智能体可以在对话中直接渲染交互式图表、实时更新共享画布，或在执行中途暂停并请求用户批准。这些交互——生成式 UI、共享状态和人在回路——需要一种标准方式让智能体后端将动态事件传达给前端。 **AG-UI（Agent-User Interaction Protocol）** 正是为此而生的开放协议。它定义了这一标准，并与多种智能体框架（如 Strands Agents、LangGraph、CrewAI）及前端库（React、Angular、Vue）兼容。使用 AG-UI，你的智能体代码和前端代码保持解耦，你可以为后端选择最合适的框架，为前端选择最合适的库，AG-UI 则负责连接它们。 **Amazon Bedrock AgentCore** 是 Amazon Bedrock 系列服务的一部分，专为生成式 AI 打造。AgentCore 是一个智能体平台，用于安全地大规模构建、部署和运行 AI 智能体，支持任何框架和任何模型。本篇文章将详细说明 AG-UI 如何集成到 **Fullstack AgentCore Solution Template (FAST)** 中，从而在 Amazon Bedrock AgentCore 上构建交互式智能体前端。随后，我们将展示 **CopilotKit** 如何通过生成式 UI、共享状态和人在回路交互进一步扩展能力，所有这些都部署在 Amazon Bedrock AgentCore 上。 ## 解决方案概述 Amazon Bedrock AgentCore Runtime 提供了一个安全、无服务器且专为托管环境设计的环境，用于部署和运行 AI 智能体或工具。AgentCore Runtime 支持多种智能体协议： - **Model Context Protocol (MCP)**：连接智能体与工具 - **Agent2Agent (A2A)**：连接智能体与其他智能体 - **AG-UI**：连接智能体与用户当你使用 AG-UI 协议标志部署智能体容器时，AgentCore 充当透明代理。它处理身份验证（通过 SigV4 或 Amazon Cognito 的 OAuth 2.0）、会话隔离、扩展和可观测性。你的容器需在端口 8080 上暴露 `POST /invocations` 用于 AG-UI 请求，以及 `GET /ping` 用于健康检查。AgentCore 会将请求原封不动地传递。 FAST 是一个可直接部署的起始项目。它将 AgentCore Runtime、Gateway、Identity、Memory 和 Code Interpreter 与 React 前端及 Amazon Cognito 身份验证连接起来，所有资源均通过 AWS CDK 定义。 ## 实际意义与展望 AG-UI 协议的出现，为 AI 智能体与用户之间的交互提供了一种标准化的通信方式，打破了后端框架与前端库之间的耦合。结合 Amazon Bedrock AgentCore 的企业级托管能力，开发者可以更专注于业务逻辑和用户体验，而无需担心底层基础设施。CopilotKit 的加入则进一步丰富了交互形态，使得智能体不仅能“说”，还能“做”和“问”，从而显著提升复杂任务场景下的协作效率。对于希望构建下一代 AI 应用的团队而言，这套方案提供了从协议到部署的完整链路，有望加速生成式 UI 在企业级应用中的落地。

AWS ML17天前原文

677

Amazon Bedrock 托管授权：简化多账户模型访问的新方案

新上线

随着企业对 AI 模型的需求增长，跨多个 AWS 账户管理第三方模型（如 Anthropic Claude、Cohere）的访问权限成为一项挑战。传统做法要么为每个工作负载账户授予 AWS Marketplace 权限（增加治理风险），要么手动为每个账户订阅模型（操作繁琐）。针对这一痛点，AWS 推出了 **Amazon Bedrock 托管授权（Managed Entitlements）** 功能，允许组织从一个中央账户订阅模型，然后通过 AWS License Manager 将访问权限分发到整个组织的成员账户，而无需在工作负载账户中授予 AWS Marketplace 权限。 ## 为什么需要托管授权？要理解托管授权的价值，首先需要区分 Amazon Bedrock 上不同模型的获取方式。目前模型分为三类： - **Amazon 自研模型（如 Amazon Nova）**：可直接通过 Amazon Bedrock 权限调用，无需额外订阅。 - **Amazon 代销模型（如 Meta、Mistral、DeepSeek）**：同样可直接调用，无需额外步骤。 - **AWS Marketplace 第三方模型（如 Anthropic Claude、Cohere、Stability AI）**：每个账户需要单独订阅 AWS Marketplace 后才能调用。对于前两类模型，AWS 近期已简化访问流程，用户可立即使用。但对于第三方模型，多账户场景下，要么为每个账户开放 Marketplace 权限（带来安全风险），要么由管理员逐个手动启用（效率低下）。托管授权正是为解决这一矛盾而生。 ## 四步工作流托管授权的使用流程分为四个步骤： 1. **中央账户订阅**：在中央管理账户中，通过 AWS Marketplace 订阅所需的第三方模型。 2. **创建授权**：在 AWS License Manager 中创建托管授权，指定要分发的模型和接收账户。 3. **分配权限**：将授权分配给组织内的成员账户或 OU（组织单元）。 4. **成员账户使用**：成员账户无需任何 Marketplace 权限，即可直接通过 Bedrock 控制台或 API 调用已授权的模型。 ## 实际应用场景 - **大型企业**：拥有数百个 AWS 账户，需要集中管控 AI 模型订阅费用和访问权限，同时确保各团队能快速获取最新模型。 - **合规要求严格的组织**：不希望在工作负载账户中开放 Marketplace 权限，以减少攻击面和审计复杂度。 - **跨区域部署**：托管授权支持跨区域分发，但需注意不同区域的市场可用性差异。 ## 重要注意事项 - **私有产品（Private Offers）**：如果模型是通过私有协议购买的，托管授权的行为可能有所不同，建议先测试。 - **区域限制**：某些模型仅在特定区域可用，授权分发时需确认目标区域是否支持。 - **成本归属**：订阅费用仍由中央账户承担，但可通过成本标签进行内部分摊。 ## 与 Bedrock 其他能力的协同托管授权并非孤立功能，它与 Amazon Bedrock 的 **模型评估**、**护栏（Guardrails）** 等能力互补。通过集中授权，企业可以更高效地实施统一的模型治理策略——例如，在中央账户配置护栏规则后，所有通过授权访问模型的成员账户都会自动遵循这些规则。 ## 小结 Amazon Bedrock 托管授权为多账户环境下的第三方模型管理提供了优雅的解决方案。它平衡了安全性与效率，让组织既能保持中央治理，又能灵活赋能各业务团队。对于正在扩张 AI 应用规模的企业而言，这一功能值得优先评估。

AWS ML17天前原文

678

利用 Amazon Bedrock 与 LLM 网关实现弹性推理模式

新上线

随着生成式 AI 工作负载从实验阶段进入大规模生产，大语言模型推理的弹性设计变得至关重要。现有弹性最佳实践（如静态稳定性、退避重试）仍然适用，但生成式 AI 带来了新的挑战：模型可用性、快速变化的配额、跨提供商的 Token 限制，以及新发布模型的版本一致性。 **四个核心维度**指导推理架构决策：可用性、响应时间、成本、吞吐量。可用性指在模型、区域或提供商中断时维持推理；响应时间关注首 Token 延迟和末 Token 延迟；成本涉及每 Token 和每次请求开销；吞吐量衡量系统能支撑的并发请求和每秒 Token 数。这些维度相互关联——例如跨区域路由提升可用性和吞吐量，但可能增加响应时间。本文聚焦于**可用性**，介绍了五种实用模式，从原生 Amazon Bedrock 功能到基于 LLM 网关的多模型编排： 1. **原生 Bedrock 重试与退避**：利用 Bedrock SDK 内置的重试机制，配合指数退避处理临时配额耗尽。适用于单区域、单模型场景，实现成本最低。 2. **跨区域推理**：利用 Bedrock 的跨区域推理功能，将请求路由到多个区域。当主区域配额耗尽或服务中断时，自动故障转移到备用区域，提升整体可用性。 3. **多模型故障转移**：在 Bedrock 之上叠加 LLM 网关，配置主模型和备用模型。当主模型返回配额错误或超时时，网关自动切换到备用模型（如从 Claude 切换到 Llama），避免单点依赖。 4. **多提供商路由**：通过 LLM 网关同时接入 Bedrock、Anthropic、OpenAI 等多个提供商。根据实时可用性、成本或延迟将请求路由到最优提供商，实现最大弹性。 5. **租户隔离与配额管理**：在多租户环境中，为每个租户分配独立的配额池或模型实例，防止“吵闹邻居”问题。结合 LLM 网关实现基于租户的限流、优先级和成本归属。这些模式遵循“爬、走、跑”的渐进式策略：从简单重试开始，逐步引入跨区域、多模型、多提供商，最终实现精细化的租户隔离。实际部署时需根据应用成熟度、预算和延迟要求选择合适模式。未来文章将深入探讨响应时间优化和成本感知路由。

AWS ML17天前原文

679

Outpost VFX 借助 AWS 将 AI 模型训练速度提升 8 倍：视觉特效行业的技术突破

新上线

在视觉特效（VFX）制作中，AI 模型训练通常需要数周时间，成为生产流程的瓶颈。Outpost VFX 通过在 AWS 上实施多 GPU 训练架构，成功将人脸替换工作流的训练速度提升了 **8 倍**，大幅缩短了迭代周期。本文将解析其技术挑战、架构设计及实际成效。 ## 单 GPU 瓶颈：从 5 天到数周的等待传统 VFX 的人脸替换流程高度依赖人工合成或美容/去龄特效，单次初版制作需 **超过 5 天**，且后续迭代漫长。Outpost VFX 开发了基于 AI 的人脸替换模型，可在现场拍摄素材上训练，但受限于单 GPU 计算能力——模型只能利用一块 GPU，视频随机存取内存（VRAM）和处理容量严重不足，导致训练周期长达数周，无法满足客户交付时间。 ## 架构设计：安全与性能并重 Outpost VFX 提出三大关键需求： 1. **计算可扩展性**——必须将训练并行化到多 GPU，消除单 GPU 瓶颈。 2. **基础设施安全**——作为自 2022 年就全面虚拟化技术栈的 AWS 客户，需严格保护敏感的制作数据。 3. **性能优化**——支持更大数据集和更高分辨率图像，提升输出质量。最终方案基于 **Amazon EC2 P4d 实例**（配备 8 块 NVIDIA A100 GPU），结合 **Amazon FSx for Lustre** 高性能文件系统，实现数据快速加载。网络层面采用 **Elastic Fabric Adapter (EFA)** 降低延迟，确保多 GPU 间高效通信。 ## 实测结果：8 倍加速与质量提升通过将训练任务从单 GPU 迁移到多 GPU 集群，Outpost VFX 取得了显著成果： - **训练速度提升 8 倍**：原本需要数周的模型训练缩短至几天。 - **迭代周期从周级降至天级**：导演反馈循环大幅加速，项目交付更加灵活。 - **支持更高分辨率**：多 GPU 架构允许处理 4K 甚至更高分辨率的素材，输出细节更丰富。 ## 行业启示：AI 与云原生的融合 Outpost VFX 的案例展示了云原生基础设施如何释放 AI 在 VFX 领域的潜力。传统工作室往往受限于本地算力，而 AWS 提供的弹性 GPU 集群让中小型工作室也能获得顶级计算能力。随着生成式 AI 在影视制作中的渗透，类似的多 GPU 训练架构将成为标配。对于 VFX 从业者而言，这不仅是速度的提升，更是创作流程的变革——更快的训练意味着更多创意试错空间，最终推动视觉特效行业进入“AI 辅助创作”的新阶段。

AWS ML17天前原文

680

用 Amazon Bedrock 打造双语 NER，为货运物流提效 14 倍

新上线

## 当货运邮件遇上双语 NER：IBS Software 的实战经验在全球化货运物流中，每天有成千上万封夹杂着英语和日语的关键信息邮件需要处理。**IBS Software** 的货运系统正是面临这一挑战：需要从两种语言的邮件中准确提取 **23 种实体类型**，包括运单号、航班信息、重量、尺寸、特殊处理代码等。 ### 挑战：精度、成本与延迟的三重博弈最初，IBS Software 尝试了多种方案。手动处理效率低下，而直接调用大模型虽然精度高，但推理成本在规模化后难以承受。团队需要在保持高准确率的同时，将成本控制在可接受范围，并满足实时处理延迟要求。 ### 解法：基于 Amazon Bedrock 的知识蒸馏 IBS Software 最终采用了 **Amazon Bedrock 的托管蒸馏能力**。核心思路是：将 **Amazon Nova Pro**（教师模型）的知识“蒸馏”到更轻量的 **Amazon Nova Lite**（学生模型）中。具体技术路径是 **基于 token 的蒸馏**——教师模型在标注数据上生成软标签，学生模型学习这些分布，同时保留对关键实体的硬标签学习。这种方法让学生模型在参数量大幅缩减的情况下，依然能捕捉到双语间的语义差异和上下文依赖。 ### 成果：95% 精度 + 14 倍成本优化经过 9 位研究人员和工程师的协作，最终部署的模型取得了**95.085% 的 F1 分数**，同时**运营成本降低了 14 倍**。整个工作流在 AWS 上实现端到端自动化：邮件进入后，由 Amazon Bedrock 调用的蒸馏模型实时提取结构化信息，再写入下游系统。 ### 架构亮点 - **教师-学生蒸馏**：利用 Nova Pro 的高精度指导 Nova Lite 训练，平衡了精度与效率。 - **双语对齐**：针对英语和日语在词法、句法上的差异，蒸馏过程特别设计了跨语言 token 对齐策略。 - **实时处理**：轻量模型使得单条邮件处理延迟控制在毫秒级，满足生产环境要求。 ### 给类似场景的启示如果你也在构建双语或多语种 NER 系统，IBS Software 的经验值得参考： 1. **不要盲目追求大模型**：通过蒸馏，小模型可以在特定任务上达到接近大模型的精度。 2. **成本与精度可以兼得**：本案例中 14 倍的成本降低并未以牺牲核心指标为代价。 3. **托管服务降低工程门槛**：Amazon Bedrock 的蒸馏能力让团队无需自建复杂的训练流水线。 ## 小结 IBS Software 的成功落地证明，在垂直领域（如货运物流）中，结合知识蒸馏与托管 AI 服务，是构建高精度、低成本、低延迟 NLP 解决方案的有效路径。对于正在探索类似双语 NER 场景的团队，这无疑是一个值得参考的标杆。

AWS ML17天前原文