AI 资讯

每日聚合最新人工智能动态

2681

OpenAI 联合创始人 Andrej Karpathy 加入 Anthropic 预训练团队

新上线

著名 AI 研究员 Andrej Karpathy 已正式加入 Anthropic，负责预训练相关工作。Karpathy 在 X 平台上宣布了这一消息，称“未来几年 LLM 前沿将尤为关键”，并表示非常兴奋能重返研发一线。 Karpathy 本周已开始在 Anthropic 工作，在团队负责人 Nick Joseph 的带领下参与预训练任务。预训练是赋予 Claude 核心知识与能力的关键阶段，也是构建前沿模型中最昂贵、计算最密集的环节之一。Anthropic 发言人透露，Karpathy 将组建一支新团队，专门利用 Claude 来加速预训练研究。 Karpathy 是少数能够打通 LLM 理论与大规模训练实践的顶尖研究者。Anthropic 邀请他组建这样的团队，释放出明确信号：其认为 AI 辅助研究（而非纯算力堆砌）才是与 OpenAI、Google 竞争的关键。回顾 Karpathy 的职业生涯：他曾是 OpenAI 的创始成员之一，专注于深度学习和计算机视觉，2017 年离开加入特斯拉，领导了全自动驾驶（FSD）和 Autopilot 项目。2022 年离开特斯拉后，他重返 OpenAI 工作一年，2024 年再次离开并创立 Eureka Labs，致力于将 AI 助手应用于教育。虽然 Karpathy 表示仍对教育充满热情，并计划未来继续推进相关项目，但目前 Eureka Labs 进展不明。他还开设了在线课程《神经网络：从零到英雄》，并运营一个定期发布 LLM 和 AI 讲座的 YouTube 频道。与此同时，Anthropic 还聘请了网络安全资深专家 Chris Rohlf 加入其前沿红队。该团队负责对高级 AI 模型进行压力测试，以应对严重威胁。Rohlf 拥有超过 20 年网络安全经验，曾任职于雅虎著名的“偏执狂”安全团队，并在 Meta 工作六年。他还曾是乔治城大学安全与新兴技术中心的研究员，专注于 CyberAI 项目。 Karpathy 的加入无疑将强化 Anthropic 在预训练领域的技术实力，也预示着 AI 行业人才争夺战进一步升级。

TechCrunch1个月前原文

2682

使用 Amazon Nova Sonic 打造可扩展语音代理：多代理、工具与会话分割设计模式

新上线

在构建语音代理时，延迟、实时音频管理以及多代理协调是常见挑战。本文介绍了如何利用 **Amazon Nova Sonic**、**Amazon Bedrock AgentCore** 和 **Strands BidiAgent** 来设计可扩展且低延迟的语音代理系统。文章重点探讨了三种主流架构模式：**工具模式**、**代理即工具（子代理）模式** 和 **会话分割模式**，并分析了各自的权衡与最佳实践。 ## 关键组件概览 - **Amazon Nova Sonic**：一种基础模型，支持实时、自然的语音到语音对话，能理解语气并保持流畅交互。 - **Amazon Bedrock AgentCore Runtime**：无服务器托管环境，提供双向 WebSocket 流、微 VM 级会话隔离（避免“吵闹邻居”延迟尖峰）、基于 MCP 协议的共享工具托管以及持久化内存。 - **Strands BidiAgent**：开源框架中的集成类，负责管理双向流生命周期、路由工具调用和处理会话管理，简化与 Nova Sonic 的对接。 ## 三种架构模式详解 ### 1. 工具模式（Tool Pattern）将功能封装为独立工具，代理通过调用工具执行具体任务。这种模式适合功能明确、调用链简单的场景，易于维护和测试。 ### 2. 代理即工具模式（Agent-as-Tool / Sub-Agent）将子代理作为工具集成到主代理中。每个子代理拥有独立的提示词、记忆和权限，适合处理复杂子任务（如订单查询、退款处理）。主代理负责路由请求，子代理专注执行，从而降低单个代理的复杂度。 ### 3. 会话分割模式（Session Segmentation）通过隔离不同会话的提示词、内存和权限，避免上下文污染和权限泄露。AgentCore 的微 VM 隔离天然支持此模式，确保每个会话独立运行，提升安全性与并发性能。 ## 最佳实践：降低延迟 - **使用 WebSocket 流**：避免 HTTP 轮询，减少往返时间。 - **微 VM 隔离**：防止高负载代理影响其他会话。 - **工具预加载**：通过 AgentCore Gateway 共享工具实例，减少冷启动。 - **异步处理**：非关键操作（如日志记录）异步执行，不阻塞对话流。 ## 小结通过组合这三种模式，团队可以构建出既灵活又高性能的语音代理系统。Amazon Nova Sonic 提供实时语音能力，Bedrock AgentCore 解决托管和隔离问题，Strands BidiAgent 简化集成。对于需要处理复杂工作流的企业，这些设计模式是实现规模化语音交互的关键。

AWS ML1个月前原文

2683

在Kiro CLI中通过Amazon Bedrock AgentCore Memory扩展对话记忆能力

新上线

## 当终端遇上记忆：Kiro CLI如何借助Amazon Bedrock实现上下文感知对话在AI Agent快速迭代的当下，**对话记忆**已成为衡量智能助手成熟度的关键指标。近日，AWS发布了一项技术实践：通过自定义**模型上下文协议（MCP）** 服务器，将**Amazon Bedrock AgentCore Memory**与**Kiro CLI**深度集成，让终端内的AI对话不再“失忆”。 ### 痛点：终端里的“金鱼记忆” Kiro CLI作为一款命令行工具，允许开发者直接与Kiro的AI Agent交互。然而，传统CLI模式下的会话往往是“一次性”的——每次对话都被视为独立事件，无法保留上下文。例如，当用户询问“刚才提到的那个API端点是什么？”时，Agent可能一脸茫然。这种**无状态交互**严重限制了复杂任务链的构建，比如多轮调试、配置迭代或跨会话项目管理。 ### 解法：MCP服务器与托管记忆的联姻 Amazon Bedrock AgentCore Memory是AWS推出的**全托管记忆服务**，专为AI Agent设计。它能够自动存储、检索和更新来自历史对话的关键信息，使Agent具备“长期记忆”。而MCP则是一种标准化协议，用于定义Agent与外部工具或数据源之间的交互方式。在这套方案中，开发者需要做的是： 1. **构建一个自定义MCP服务器**，作为Kiro CLI与Bedrock AgentCore Memory之间的桥梁。 2. 在MCP服务器中实现**记忆读写接口**，将Kiro CLI生成的对话内容同步至Bedrock的托管记忆存储。 3. 当新对话开始时，Agent通过MCP服务器自动检索相关历史记忆，实现上下文延续。 ### 落地价值：从“单次问答”到“持续协作” 集成后，Kiro CLI的使用体验将发生本质变化： - **跨会话连贯性**：用户可以在不同时间点继续同一话题，Agent能准确引用之前的结论或代码片段。 - **任务断点续传**：若调试过程中终端意外关闭，重新启动后Agent仍能“记住”之前的错误日志和修复步骤。 - **个性化适应**：Agent能根据用户长期的使用习惯（如偏好某种代码风格、常用命令组合）给出更贴切的建议。 ### 行业视角：记忆是Agent走向“智能体”的必由之路当前，AI Agent正从“工具调用者”向“自主工作者”演进，而**持久化记忆**正是这一跃迁的核心基础设施。无论是OpenAI的Assistants API中的线程机制，还是LangChain的记忆模块，业界都在试图解决同一个问题：如何让AI在长时间跨度内保持一致的“人格”与知识状态。 AWS此次通过MCP协议将托管记忆能力开放给Kiro CLI，本质上是在**降低记忆功能的集成门槛**——开发者无需自建向量数据库或管理会话状态，即可为命令行工具赋予企业级的记忆能力。这对于运维自动化、DevOps流水线、以及需要长期上下文支持的开发辅助场景，具有显著的实际意义。 ### 总结 Kiro CLI + Amazon Bedrock AgentCore Memory的组合，展示了**托管服务+标准化协议**在AI工程化中的典型应用模式。对于追求高效与智能的开发者而言，让终端记住每一次对话，或许就是下一轮生产力提升的起点。

AWS ML1个月前原文

2684

Amazon SageMaker Feature Store 新能力加速机器学习特征管道

新上线

亚马逊云科技今日宣布，**SageMaker Python SDK v3.8.0** 为 SageMaker Feature Store 带来三项新能力，旨在帮助数据科学家和工程师更高效地构建、管理和使用机器学习特征管道。这些新功能聚焦于简化特征工程工作流、增强数据治理以及提升查询性能。 ### 新能力一：与 AWS Lake Formation 集成，强化数据治理第一项新能力是 **SageMaker Feature Store 与 AWS Lake Formation 的深度集成**。通过这一集成，用户可以在特征组（Feature Group）级别应用细粒度的访问控制策略。Lake Formation 提供基于属性的访问控制（ABAC）和行级安全，使得团队能够安全地共享特征数据，同时遵守合规要求。例如，数据管理员可以设定规则，仅允许特定用户或角色访问包含敏感信息的特征列，而其他列则对更广泛的团队开放。 ### 新能力二：支持 Apache Iceberg 表属性，优化存储与查询第二项能力是 **SageMaker Feature Store 现在支持 Apache Iceberg 表属性**。Iceberg 是一种开源表格式，专为大规模数据分析设计，支持 ACID 事务、快照和模式演进。通过在 Feature Store 中启用 Iceberg 表属性，用户可以享受以下好处： - **更快的查询性能**：Iceberg 的分区修剪和列式存储优化可显著减少扫描数据量。 - **时间旅行查询**：能够回溯到特定时间点的特征数据版本，便于模型调试和重现。 - **自动表维护**：Iceberg 的压缩和清理机制减少了存储成本并提高了查询效率。 ### 新能力三：增强的 Python SDK 功能，简化开发体验第三项新能力体现在 **SageMaker Python SDK v3.8.0 的更新**，包括更简洁的 API、更好的错误处理以及更丰富的文档。例如，现在可以通过更少的代码行创建和管理特征组，并直接与 Iceberg 表交互。此外，SDK 还支持将特征数据直接写入 S3 中的 Iceberg 格式，无需额外配置。 ### 实际应用场景与价值这些新能力对机器学习团队意味着什么？以金融风控场景为例，特征工程团队需要频繁更新欺诈检测模型的特征，同时确保敏感客户数据不被滥用。通过 Lake Formation 集成，可以轻松定义哪些分析师能访问哪些特征；而 Iceberg 支持则让历史特征回滚变得简单，便于模型审计。对于希望快速上手的用户，亚马逊云科技提供了 **完整的端到端示例笔记本**（位于 SageMaker Python SDK 仓库中），涵盖 Lake Formation 治理配置和 Iceberg 表属性设置。开发者可以直接克隆这些笔记本，在自己的 AWS 环境中进行测试。 ### 小结此次更新标志着 **SageMaker Feature Store 在数据治理和性能优化上迈出重要一步**。随着机器学习模型对特征质量和时效性的要求日益提高，这些工具能帮助团队减少基础设施管理负担，将更多精力投入到特征创新和模型迭代中。建议用户升级到最新 SDK，并参考官方笔记本探索新功能。

AWS ML1个月前原文

2685

在 Amazon Bedrock 上实现编程式工具调用

新上线

在 AI 应用开发中，让大语言模型（LLM）能够自主调用外部工具是释放其能力的关键。Amazon Bedrock 近期推出的编程式工具调用（Programmatic Tool Calling, PTC）功能，正为开发者提供了一条更灵活、可控的路径。本文将通过三种实现方式，展示如何利用 PTC 构建可执行代码的 AI 代理。 ## 什么是编程式工具调用？传统的工具调用中，模型仅返回工具名称和参数，由应用层负责执行。而 **PTC 允许模型直接生成可执行的代码片段（如 Python 脚本）**，并在安全沙箱中运行，从而实现更复杂的逻辑，比如数据处理、API 调用链或动态决策。 ## 三种实现路径对比 ### 1. 自托管 Docker 沙箱（ECS） - **适用场景**：需要完全控制执行环境、网络策略或使用自定义运行时。 - **实现方式**：在 Amazon ECS 上部署 Docker 容器作为沙箱，通过 Bedrock 的响应触发容器内的代码执行。 - **优势**：最大灵活性，可集成私有库、GPU 资源等。 - **代价**：需自行维护基础设施，处理安全隔离和扩缩容。 ### 2. 托管解决方案（Bedrock AgentCore Code Interpreter） - **适用场景**：希望快速集成，无需管理底层环境。 - **实现方式**：直接使用 Bedrock 内置的 **AgentCore Code Interpreter**，模型生成的代码在 AWS 托管的沙箱中自动执行。 - **优势**：零运维，自动安全隔离，支持 Python 标准库。 - **限制**：无法安装第三方包或访问外部网络（默认配置）。 ### 3. Anthropic SDK 兼容代理 - **适用场景**：团队已使用 Anthropic SDK（如 Claude API），希望迁移到 Bedrock 但保持开发体验一致。 - **实现方式**：通过一个轻量级代理层，将 Bedrock 的 PTC 响应转换为 Anthropic SDK 格式，使得现有代码无需大改即可接入。 - **优势**：降低迁移成本，复用已有工具链。 - **注意**：代理层需自行维护，可能引入额外延迟。 ## 实践建议与思考从行业趋势看，**PTC 正在模糊“模型”与“应用”的边界**。过去，LLM 仅作为推理引擎，现在它开始直接操控计算资源。这种转变对安全性和可观测性提出了更高要求： - **安全隔离**：无论采用哪种方式，代码执行环境必须与生产环境隔离。Docker 沙箱或托管解释器都应限制文件系统、网络和系统调用。 - **错误处理**：模型生成的代码可能出错，需设计重试、回退或人工审核机制。 - **成本控制**：代码执行消耗算力，尤其是长时间运行的任务，建议设置超时限制。对于大多数团队，**推荐从托管 Code Interpreter 开始**，快速验证 PTC 在业务场景中的价值。当需求超出托管环境的能力（如需要 GPU 或私有包）时，再迁移到自托管方案。而 Anthropic 兼容代理更适合已有深度绑定 Anthropic 生态的团队。 ## 小结 Amazon Bedrock 的 PTC 功能为 AI 代理的开发提供了更多选择。从自托管到托管，再到兼容代理，开发者可以根据安全、成本和运维偏好灵活设计架构。随着 LLM 编码能力的提升，这种“模型即执行者”的模式将成为构建智能应用的重要范式。

AWS ML1个月前原文

2686

AI 界重磅变动：Andrej Karpathy 官宣加入 Anthropic

精选

AI 社区迎来一则重磅消息：著名人工智能科学家、前 OpenAI 联合创始人及特斯拉 AI 高级总监 **Andrej Karpathy** 在 X（原 Twitter）上宣布，他已正式加入 AI 初创公司 **Anthropic**。这一动态迅速引发行业热议，被视为 Anthropic 在 AI 人才争夺战中取得的标志性胜利。 ## 从 OpenAI 到特斯拉再到 Anthropic：一位 AI 领袖的轨迹 Karpathy 在 AI 领域履历耀眼。他曾在 **OpenAI** 担任研究科学家，是 GPT-2 等早期大模型项目的核心贡献者；随后加入特斯拉，领导 **Autopilot 计算机视觉团队**，推动自动驾驶技术落地。2023 年，他短暂重返 OpenAI，但数月后再度离开，此次加入 Anthropic 意味着他将与 OpenAI 前同事兼竞争对手正面交锋。 ## Anthropic 的“人才磁铁”效应 Anthropic 由前 OpenAI 研究高管 **Dario Amodei** 和 **Daniela Amodei** 于 2021 年创立，以“安全 AI”为核心理念，致力于构建可靠、可解释的 AI 系统。公司旗下模型 **Claude** 系列在安全性和诚实性上独树一帜。Karpathy 的加入进一步强化了 Anthropic 的研究实力，尤其在 **深度学习、大规模模型训练** 及 **AI 对齐** 等方向。行业观察人士指出，Anthropic 正通过吸纳顶尖人才来缩小与 OpenAI 的差距。此前，公司已从谷歌、DeepMind 等机构挖来多位高级研究员，而 Karpathy 的加盟无疑将提升其在大模型竞赛中的话语权。 ## 对 AI 格局的潜在影响 Karpathy 的转会可能从三方面重塑行业： - **研究路线**：Karpathy 在计算机视觉和多模态学习上的经验，或将推动 Claude 模型向更丰富的感知能力扩展，挑战 GPT-4V 等竞品。 - **人才流动**：作为 AI 社区的“顶流”，Karpathy 的选择可能引发更多人才向 Anthropic 倾斜，改变硅谷 AI 人才分布。 - **安全 vs 效率**：Anthropic 强调 AI 安全优先，Karpathy 的加入可能促使业界更重视模型的可控性与伦理约束，而非单纯追求性能提升。 ## 结语 Karpathy 在声明中表示：“Anthropic 在构建安全、有益 AI 方面的承诺与我的价值观高度契合。” 这一表态暗示，未来 AI 行业的竞争不仅是技术之争，更是理念与安全标准之争。随着 Karpathy 的加入，Anthropic 与 OpenAI 之间的对抗将更加激烈，而整个 AI 社区或将迎来更注重安全与对齐的新阶段。

Hacker News1.4k1个月前原文

2687

前OpenAI员工警告：xAI的安全问题可能拖累SpaceX的IPO

新上线

两位前OpenAI员工与多家AI安全非营利组织联合致信投资者，警告称埃隆·马斯克的AI实验室xAI的安全记录不佳，可能成为SpaceX史上最大IPO的“未定价风险”。 ## 核心警告：xAI的安全隐患信中指出，xAI在安全实践方面“几乎全面落后”于OpenAI、Google DeepMind和Anthropic等前沿AI开发者。联合签署人、前OpenAI政策顾问Page Hedley在采访中直言，xAI的安全记录是行业最差的。这种状况可能导致SpaceX面临更高的监管和诉讼风险，从而影响其估值和IPO进程。 ## 要求披露关键信息信件要求SpaceX向投资者披露以下内容： - xAI是否计划继续开发前沿AI模型。 - 如果继续，必须发布公开的安全与治理计划。 - 近期SpaceX将大量GPU产能出售给Anthropic的交易，使得xAI在母公司内的定位变得模糊——它是否仍是前沿AI竞争者，还是沦为基础设施提供者？ ## 行业背景与影响 SpaceX以约**750亿美元**估值筹备IPO，此前以超**1万亿美元**的私有估值收购了xAI。马斯克曾宣称要将数据中心发射到太空为AI服务，但安全倡导者认为，这种激进策略可能掩盖了xAI在安全实践上的系统性缺陷。新的AI安全监管组织**Guidelight AI Standards**（由前OpenAI安全研究员Steven Adler和Hedley联合创立）是信件的主要签署方之一。该组织获得私人捐助者支持，旨在推动前沿AI公司的安全标准提升。其他签署方包括Legal Advocates for Safe Science and Technology、Encode AI和The Midas Project。 ## 结论这封信凸显了AI安全在资本市场的分量——当一家AI公司被并入即将IPO的实体时，其安全实践不再是内部技术问题，而是直接影响投资者信心的财务风险。SpaceX和xAI尚未回应置评请求，但投资者显然需要更多透明度。

WIRED AI1个月前原文

2688

美国危险而混乱的深度伪造打击行动正式启动

新上线

一项要求社交网络快速删除性深度伪造及其他非自愿色情内容的法律现已全面生效。但专家警告，该政策可能对受害者帮助甚微，最坏情况下甚至可能助长网络审查。去年5月，总统特朗普签署了《Take It Down Act》，旨在应对非自愿私密影像（NCII）。该法立即将传播NCII（无论是真实还是AI生成的内容）定为犯罪，许多州已至少部分实施。但其同名的移除条款更为广泛——自2026年5月19日起，要求在线平台在48小时内移除NCII，否则面临罚款。联邦贸易委员会主席Andrew Ferguson在截止日期前致函十几家科技公司，包括亚马逊、Alphabet、苹果、Meta、微软、TikTok等。FTC要求平台提供便捷的移除请求流程，并在48小时内删除违规内容及任何“已知的相同副本”。违规每次可能面临超过5.3万美元的民事罚款。Meta、微软、谷歌、TikTok和Snap等主要平台支持该法案，并表示有信心遵守。但专家指出，法律对“亲密影像”的定义可能过于宽泛，且缺乏对虚假举报的惩罚，可能被滥用于压制合法言论。此外，许多受害者面临举报流程复杂、二次伤害等问题。该法案的实际效果仍有待观察。

The Verge1个月前原文

2689

电力巨头合并背后：数据中心才是真正的主角

新上线

美国最大电力公司 NextEra Energy 与第六大公司 Dominion 的拟议合并，不仅是资本市场的重磅交易，更折射出数据中心需求激增如何重塑整个电力行业。这笔价值 **670亿美元** 的并购案，将缔造一个在发电总量、天然气发电和可再生能源领域均占据领先地位的超级企业。然而，消费者权益倡导者和分析师警告，合并后的巨无霸可能对消费者和环境产生负面影响。 ## 数据中心：合并的核心驱动力此次合并的关键在于 Dominion 的战略位置——它正是 **北弗吉尼亚** 的本地电力供应商，而该地区拥有全球最密集的数据中心集群。随着 AI 和云计算爆发，数据中心用电需求急剧攀升，NextEra 希望通过收购 Dominion 快速切入这一高增长赛道。Morningstar 股票分析师 Andrew Bischof 指出，这笔交易让 NextEra 能利用 Dominion 的专长和关系“加速其数据中心中心枢纽计划”，此前 NextEra 在监管同行中已落后。 ## 监管与消费者权益的隐忧哈佛法学院电力法倡议主任 Ari Peskoe 直言：“合并是为了股东，而非消费者。” Dominion 股东将以溢价出售股份，高管也将因促成交易获得巨额回报，而“费率支付者都是事后才想到的”。合并后的公司市值仅次于埃克森美孚和雪佛龙，其巨大的财务和政治影响力将使有效监管变得异常困难。 ## 交易细节与未来走向根据周一公布的提案，合并后的公司沿用 NextEra Energy 名称，由 NextEra CEO John W. Ketchum 领导。交易尚需州和联邦监管批准。对于普通家庭和企业而言，这意味着电价可能上涨：垄断性电力公司往往将数据中心基础设施成本转嫁给用户，而缺乏竞争的市场结构进一步削弱了消费者的议价能力。 ## 行业变局：AI 时代的能源博弈这笔交易标志着电力公用事业进入新阶段：数据中心的能源需求正从技术问题演变为战略资产。NextEra 与 Dominion 的联姻，本质上是对未来计算基础设施控制权的争夺。但正如批评者所担忧的，当一家公司同时掌握发电、电网和数据中心资源时，如何在效率与公平之间取得平衡，将成为监管机构面临的严峻考验。

Ars Technica1个月前原文

2690

实测 Surface Pro 5G 版：微软迄今最完善的企业级二合一设备

新上线

微软最新推出的第12代 Surface Pro 商用版，凭借 5G 连接、英特尔最新处理器和卓越屏幕，再次巩固了其在高端便携二合一设备领域的领先地位。本文基于实际测试，深入分析这款设备的升级亮点、行业定位及对企业用户的实际价值。 ## 核心升级：5G 与性能齐头并进第12代 Surface Pro 商用版最引人注目的变化是**首次加入 5G 蜂窝网络支持**。对于经常出差、需要在移动中保持高效工作的商务人士而言，这一升级意味着不再依赖不稳定的公共 Wi-Fi，随时随地获得高速网络连接。此外，设备搭载了**英特尔最新的 Series 3 处理器**，在性能与功耗之间取得了更好的平衡，足以应对日常办公、视频会议和多任务处理。屏幕方面，微软延续了 Surface 系列一贯的高标准。13英寸 PixelSense 显示屏不仅色彩精准、亮度充足，还**内置了隐私屏幕功能**，可限制侧面视角，有效防止在公共场合泄露敏感信息——这一点对企业用户尤其重要。 ## 使用体验：轻薄机身，全能表现在实际使用中，Surface Pro 商用版保持了系列标志性的轻薄设计，**重量仅约 900 克**，搭配可调节支架和键盘盖，可在笔记本和平板模式间无缝切换。5G 连接的实际体验令人满意，下载大文件、视频会议均无明显延迟。配合 Windows 11 的**高级触觉反馈**支持，触控笔书写和触控操作更加自然精准。续航方面，官方宣称可达 15 小时，实测在混合使用场景下（网页浏览、文档编辑、视频播放）约 12-13 小时，足以覆盖一个工作日。 ## 行业视角：企业移动办公的新标杆从 AI 行业趋势来看，**5G 与边缘计算的结合正在重塑企业办公模式**。Surface Pro 商用版凭借 5G 连接，可更高效地接入云端 AI 服务，例如实时语音转写、智能文档翻译等，而无需本地部署高功耗硬件。同时，英特尔 Series 3 处理器集成的 AI 加速单元，也能在本地运行轻量级 AI 模型，如背景虚化、智能降噪等，提升视频会议体验。与同类产品相比，Surface Pro 商用版在**安全性、可管理性和生态整合**上具有优势。它预装 Windows 11 Pro，支持 BitLocker 加密、Windows Hello 面部识别，并可通过 Microsoft Intune 进行集中管理，满足企业对数据安全和 IT 部署的严格要求。 ## 小结第12代 Surface Pro 商用版并非革命性产品，但它通过**5G 连接、隐私屏幕和最新处理器**等务实升级，补齐了此前企业用户最关心的短板。对于追求移动生产力、注重数据安全且预算充足的企业用户来说，这可能是目前最值得考虑的 Windows 二合一设备。

ZDNet AI1个月前原文

2691

现代网络犯罪格局深度解析：HPE 2025年威胁报告揭示黑客工业化运作

精选

## 现代网络犯罪：从散兵游勇到工业化军团 HPE 威胁实验室最新发布的《In the Wild 报告》指出，2025 年网络犯罪正经历一场深刻的工业化变革。攻击者不再是小作坊式的个体或松散团伙，而是采用**自动化工具、AI 技术以及企业级层级管理**，实现了规模化、快速化和结构化的攻击行动。 ### 五大因素塑造当今网络安全格局报告认为，当前动态的网络安全环境由五个关键因素驱动，它们相互交织，共同构成了企业面临的复杂挑战： 1. **日益增长的网络依赖与期望**：企业数字化转型深入，网络承载的设备、人员和业务量激增。用户期望网络随时可用、性能稳定，但往往缺乏足够的安全意识，成为攻击链中最薄弱的环节。 2. **漏洞利用的工业化**：攻击者普遍使用自动化脚本和 AI 辅助工具，针对那些长期存在、但未被修补的漏洞发起攻击。这种“规模化狩猎”方式大大降低了攻击成本，提高了成功率。 3. **攻击者的企业化组织**：许多犯罪团伙模仿合法公司，设立了 CEO、HR、研发等部门，分工明确，甚至实行 KPI 考核。这种结构提升了攻击效率，也使得追踪和打击更加困难。 4. **内部与外部威胁的交织**：内部威胁（如员工失误、恶意内部人员）与外部攻击（如勒索软件、供应链攻击）相互叠加，使得防御策略必须同时兼顾“人”和“技术”两个维度。 5. **监管与合规压力**：全球各地数据保护法规日趋严格，企业在满足合规要求的同时，还需应对不断演变的攻击手法，这对安全团队提出了更高要求。 ### 企业的应对之道面对这种“工业化”的对手，企业不能仅靠单点产品应对。HPE 建议采取**深度防御与主动威胁狩猎**相结合的策略： - **持续暴露管理**：定期扫描并修复已知漏洞，缩小攻击面。 - **AI 驱动的威胁检测**：利用机器学习识别异常行为，在攻击造成实质损害前进行拦截。 - **员工安全意识培训**：将“人”作为安全体系的关键一环，降低钓鱼攻击成功率。 - **分层安全架构**：在网络、端点、应用和数据层分别部署防护，形成纵深防御。 ### 小结网络犯罪的工业化是 2025 年最显著的趋势之一。企业必须认识到，传统的被动防御已经失效，只有采用同样具备“工业化”能力的智能安全体系，才能在这场不对等的对抗中占据主动。

MIT Tech1个月前原文

2692

未来15年摩尔定律走向，Imec给出路线图

新上线

摩尔定律是否已死？这是半导体行业多年来争论不休的话题。但比利时微电子研究中心（Imec）的最新预测给出了一个明确的答案：**摩尔定律将以新的形式继续演进，至少在未来15年内仍有路可走**。 ## 从FinFET到CFET：晶体管结构的革命 Imec认为，我们正处在晶体管技术的关键转折点。目前主流的FinFET结构将在未来几年内被**全环绕栅极（GAA）**技术取代，而更远期的目标是**互补场效应晶体管（CFET）**。CFET将n型和p型晶体管垂直堆叠，极大提升集成密度。根据Imec的路线图，**2028年**左右，3纳米节点之后，GAA将全面铺开；而到**2032年前后**，CFET有望进入量产。这意味着，从今天算起，我们离下一代晶体管架构的成熟还有大约7年时间。 ## 关键挑战：互连与功耗随着晶体管尺寸逼近原子尺度，互连延迟和功耗成为比晶体管开关速度更棘手的瓶颈。Imec指出，**背面供电网络（BSPD）**和**新型互连材料**（如钌或钴）将成为突破方向。此外，**高数值孔径（High-NA）极紫外光刻**技术被视作实现更小线宽的关键工具，ASML已开始交付首批High-NA EUV光刻机。 ## 摩尔定律的新定义：从“缩微”到“系统集成” 传统摩尔定律强调晶体管数量的翻倍，但Imec认为，未来摩尔定律的驱动力将更多来自**3D堆叠、异构集成和专用加速器**。例如，将逻辑芯片与存储芯片、传感器甚至光子器件垂直集成，可以在不依赖极端线宽的情况下提升性能。这种“超越摩尔”的思路，实际上是将系统级优化纳入摩尔定律的范畴。 ## 对AI与计算产业的启示对于AI芯片而言，这一路线图意义重大。当前大模型训练和推理对算力的需求呈指数级增长，而传统工艺微缩带来的性能增益正在放缓。Imec的预测表明，**未来AI芯片的竞争将更多体现在先进封装和架构创新上**，而非单纯依赖制程节点。台积电、三星和英特尔都在积极布局3D封装技术，这与Imec的路线图方向一致。 ## 小结 Imec的15年预测并非宣告摩尔定律的终结，而是描绘了一个更复杂、更多维的演进路径。从FinFET到CFET，从平面到3D，从单一缩微到系统集成，**半导体产业正进入一个“多重创新”时代**。对于从业者而言，关注晶体管结构变化的同时，更需留意互连、封装和材料领域的突破——这些才是决定未来15年算力增长的关键变量。

IEEE AI1个月前原文

2693

Show HN：Forge——通过护栏机制将8B模型在智能体任务中的准确率从53%提升至99%

精选

## 概述来自德州仪器（Texas Instruments）的AI总监Antoine Zambelli近日开源了**Forge**，这是一个专为自托管LLM工具调用设计的可靠性层。Forge通过一系列护栏机制（guardrails）和上下文管理策略，显著提升了小型本地模型在复杂智能体工作流中的表现。据项目介绍，结合Ministral-3 8B Instruct Q8模型和llama-server后端，Forge在26个场景的评估套件中取得了**86.5%**的平均成功率，在最高难度层级上也能达到**76%**——而未经优化的同模型基线仅为53%左右。 ## 核心能力 Forge的核心思路是**用工程手段弥补模型能力的不足**。它通过以下机制提升可靠性： - **救援解析（Rescue Parsing）**：当模型输出格式错误或无法解析时，自动尝试纠正或重试。 - **重试提示（Retry Nudges）**：在模型偏离轨道时给出温和的引导提示，帮助其回到正确路径。 - **步骤强制（Step Enforcement）**：确保智能体按预定顺序执行必要步骤，避免跳过关键操作。 - **错误恢复（Error Recovery）**：在工具调用失败或上下文溢出时，自动进行恢复处理。 - **VRAM感知上下文管理**：通过分层压缩（Tiered Compaction）和预算控制，在显存受限环境下维持长上下文能力。 ## 四种使用方式 Forge提供了灵活的使用模式，适应不同开发需求： 1. **WorkflowRunner**：定义工具集、选择后端，运行结构化智能体循环。Forge管理完整生命周期：系统提示、工具执行、上下文压缩和护栏机制。 2. **SlotWorker**：通过优先级队列实现共享推理槽的访问，支持自动抢占——适合多智能体架构中多个专业工作流共享GPU的场景。 3. **护栏中间件（Guardrails Middleware）**：将Forge的可靠性栈作为可组合中间件集成到自己的编排循环中。开发者控制循环，Forge负责验证响应、纠正格式错误的工具调用、强制必需步骤。 4. **代理服务器（Proxy Server）**：运行`python -m forge.proxy`启动一个兼容OpenAI API的代理服务器，透明地插入在客户端（如opencode、Continue、aider）和本地模型服务器之间。客户端会感觉模型“变聪明了”。 ## 技术亮点 Forge的设计充分考虑了**实际部署的痛点**。例如，在上下文管理方面，它采用VRAM感知的分层压缩策略：当上下文接近显存上限时，自动对早期对话进行压缩保留关键信息，同时丢弃冗余细节。这种机制使得8B模型也能处理需要多轮交互的复杂任务。评估方面，Forge构建了包含26个场景的测试套件，覆盖从简单工具调用到多步骤推理的各种难度。当前最佳配置（Ministral-3 8B Instruct Q8 + llama-server）得分86.5%，而未经护栏的基线模型仅为53%左右，改进幅度超过30个百分点。 ## 部署与兼容性 Forge要求**Python 3.12+**，支持多种后端： - **llama-server（推荐）**：在评估中表现最佳，建议使用Q8量化版本。 - **Ollama**：设置更简单，但高难度任务性能稍弱。 - **Anthropic API**：无需本地GPU，适合快速原型验证。安装方式：`pip install forge-guardrails`（核心版）或`pip install "forge-guardrails[anthropic]"`（含Anthropic支持）。 ## 行业意义 Forge的出现反映了AI工程领域的一个重要趋势：**在模型规模与部署成本之间寻找平衡点**。8B模型虽然能力有限，但通过精心的工程加固，可以在特定智能体任务中接近甚至媲美更大模型的表现。这对于资源受限的企业和开发者而言，意味着更低的硬件门槛和更可控的部署成本。同时，Forge的模块化设计（中间件、代理服务器等）也降低了集成门槛——开发者无需重写整个框架，即可将护栏能力嵌入现有系统。这种“增量式改进”的思路，或许比等待模型本身的飞跃更具现实可行性。 ## 小结 Forge是一个**务实且高效**的开源项目，它不追求模型能力的突破，而是通过系统化的工程手段解决小模型在智能体任务中的可靠性问题。对于正在构建或维护本地AI代理工作流的团队，Forge提供了一套立即可用的工具箱。

Hacker News6851个月前原文

2694

下载日报：马斯克诉OpenAI败诉、军用智能眼镜、Google I/O前瞻

精选

## 马斯克诉OpenAI案败诉：一场关于“非营利”的时间之战埃隆·马斯克对OpenAI的诉讼近日以败诉告终。**陪审团认定马斯克起诉过晚，其主张被诉讼时效限制所禁止**。核心争议在于OpenAI何时开始向营利结构转型：公司方称早在2017年已有迹象，马斯克则声称直到2022年才知晓。尽管此案未对OpenAI是否违反非营利使命做出实质裁决，但围绕其公司结构的法律攻防远未结束。 ## 战场上的智能眼镜：Anduril与Meta联手打造军用AR头显国防科技公司Anduril披露了与Meta合作开发的军用增强现实头显新细节。**该设备可通过眼动追踪和语音指令实现无人机打击调度**。项目负责人、前陆军特种作战司令部成员Quay Barnett表示，目标是优化“作为武器系统的人类”。这引发了对智能眼镜如何改变战争形态的深度思考。 ## Google I/O 2024：在不利格局中寻求突破 Google年度开发者大会I/O本周开幕，但**其在基础模型竞赛中已明显落后于Anthropic和OpenAI**。模型声誉如今主要取决于编码能力，而Google的编码工具数月来被Claude Code和Codex压制。不过，Google在AI for Science等前沿领域仍有优势。本次大会将有三大看点值得密切关注。 ## AI能否学会理解世界？随着大语言模型局限性的凸显，研究人员正探索新的方向，让AI真正理解物理世界。这或许是下一代AI突破的关键。

MIT Tech1个月前原文

2695

Marshall Milton ANC 耳机：便携与性能兼得的新选择

新上线

Marshall 近日发布了新款头戴式耳机 Milton ANC，定位为兼具便携性与高性能的 on-ear 耳机。作为 Major V 的升级版，Milton ANC 在佩戴舒适度、音质和降噪方面均有显著提升。 ## 设计：经典与实用并存 Milton ANC 延续了 Marshall 标志性的复古美学，采用方形 TPU 模塑耳罩、纹理皮革表面、黄铜金属 logo 和粉末涂层金属臂，质感出众。耳机重量约 **200 克**，虽比 Major V 的 186 克略重，但保留了可折叠设计，方便收纳携带。耳垫尺寸增大，内部填充更柔软的记忆海绵，有助于提升被动降噪效果和长时间佩戴的舒适性。 ## 音质与连接：全面升级 Marshall 为 Milton ANC 配备了全新的 **32mm 驱动单元**（Major V 为 40mm），官方称其优化了低音和高频延伸。支持的音频编解码器包括 SBC、AAC、LC3 和 **LDAC**，可满足高解析度无线音频需求。蓝牙升级至 **6.0 版本**，支持 LE Audio，并原生兼容 Apple Find My 和 Google Find Hub 定位服务，无论使用 iPhone 还是 Android 设备都能轻松追踪耳机位置。 ## 定价与市场定位 Milton ANC 售价 **229 美元**，定位中高端市场。在竞争激烈的无线耳机领域，它需要与索尼 WH-1000XM5、Bose QC 45 等产品抗衡。不过，Marshall 独特的品牌调性、便携折叠设计以及对 LDAC 和蓝牙 6.0 的支持，可能成为其差异化优势。 ## 小结 Marshall Milton ANC 在保留经典设计的同时，通过升级驱动单元、蓝牙规格和佩戴舒适度，试图在便携与性能之间找到平衡。对于追求音质、外观和便携性的用户来说，这款耳机值得关注。实际表现如何，还需等待后续评测验证。

ZDNet AI1个月前原文

2696

Colossal Biosciences 用 3D 打印人造蛋壳孵化小鸡

精选

一家致力于复活灭绝物种的生物技术公司 Colossal Biosciences 近日宣布，已成功开发出“全人造鸡蛋”，并利用它孵化出了小鸡。这一突破可能为拯救濒危鸟类和复活已灭绝的巨型鸟类（如渡渡鸟和巨型恐鸟）铺平道路。 ## 人造蛋壳如何工作？所谓的“全人造鸡蛋”更准确的描述是“人造蛋壳”。它是一个 3D 打印的椭圆形塑料网格结构，内部涂有一层特殊的硅基膜，能够像真实蛋壳一样允许氧气通过。研究人员将刚刚产下的鸡蛋内容物小心地倒入这个人造蛋壳中，小鸡胚胎得以继续发育，并通过顶部的透明窗口进行观察。 Colossal 的首席生物学官 Andrew Pask 表示：“看到它们在人工蛋中移动，简直令人难以置信。你真正感受到了在子宫外培育生命。” ## 从复活灭绝物种到保护濒危鸟类 Colossal 成立于 2021 年，最初的目标是利用基因编辑和生殖技术复活猛犸象等灭绝物种。公司目前已筹集超过 8 亿美元资金，致力于实现“可规模化、可控的”动物创造。根据 Pask 的说法，这项蛋壳技术可以帮助保护濒危鸟类。它还可以在复活巨型恐鸟的项目中发挥作用——恐鸟是一种不会飞的巨型鸟类，身高可达 12 英尺，曾生活在新西兰，产的蛋比任何现存鸟类的蛋都大（约 4 升）。Colossal 展示了一个巨大的 3D 打印蛋壳原型，员工们戏称其为“沙拉甩干机”。 ## 仍需克服的技术挑战需要明确的是，Colossal 距离真正复活恐鸟还很遥远。在此之前，科学家需要研究恐鸟骨骼中的 DNA 数据，并将数千个基因变化插入现存鸟类的基因组中——这在技术上仍然非常困难，无论是否使用人造蛋壳。一些科学家认为 Colossal 过于夸大了这项成就。该公司在 YouTube 上发布了一段视频，宣称“解决了蛋的问题”，但批评者指出，这只是一个初步的孵化容器，距离真正的基因复活还有很长的路要走。 ## 行业意义与前景尽管如此，这项技术仍具有重要的应用价值。对于鸟类保护而言，人造蛋壳可以用于体外孵化，避免野生环境中的捕食风险。对于 Colossal 的终极目标——复活灭绝物种——它提供了一种必要的工具，使得在实验室中培育基因编辑后的鸟类胚胎成为可能。未来，Colossal 计划将这项技术应用于更多鸟类物种，并进一步优化蛋壳的材质和结构，以提高孵化成功率。

MIT Tech1个月前原文

2697

家用机器人安全：关键在于人机关系

新上线

家用机器人正逐渐走入普通家庭，但随之而来的安全问题却远未解决。近期，国际标准化组织（ISO）正在修订一项与机器人安全相关的标准，然而有专家指出，这次修订忽略了用户输入这一关键因素，可能导致安全规范与真实使用场景脱节。 ## 安全标准为何重要？ ISO标准是全球机器人制造商设计产品时的重要参考。对于家用机器人而言，安全不仅涉及物理伤害的避免，还包括隐私保护、行为可预测性以及用户信任。然而，现行的安全评估方法往往侧重于机器人在理想环境下的表现，未能充分考虑用户与机器人之间复杂动态的互动。 ## 被忽视的用户输入在本次ISO标准修订中，一个关键争议点是：标准制定者主要依赖工程师和机器人厂商的视角，而**缺乏对普通用户使用习惯和行为的系统调研**。例如，用户可能出于好奇或操作失误，让机器人执行超出安全范围的任务；又或者用户对机器人的信任过度，导致放松警惕。这些“非理想”的用户行为，恰恰是现实中事故的主要诱因。 IEEE Spectrum科技政策编辑Lucas Laursen在报道中指出，安全标准若只关注机器人自身的硬件和软件可靠性，而不考虑用户与机器人之间的“关系”，无异于纸上谈兵。他强调：**“家用机器人安全，本质上是一个关系问题。”** ## 行业背景与影响随着扫地机器人、陪伴机器人、教育机器人等产品的普及，家用机器人市场正在快速增长。但与此同时，涉及机器人的意外事件也时有发生，如机器人撞倒老人、儿童误触危险部件等。如果新的ISO标准不能有效涵盖用户行为因素，制造商可能会依据不充分的规范生产产品，从而埋下安全隐患。目前，ISO标准修订工作组已经注意到了批评声音，但尚未明确是否会在最终版本中增加用户输入相关的测试要求。Laursen呼吁，标准制定者应当**引入人机交互研究者和用户代表参与讨论**，确保标准既具备技术严谨性，又贴合实际使用场景。 ## 小结家用机器人安全的未来，不仅取决于更坚固的外壳或更聪明的算法，更取决于我们如何设计人与机器之间的信任与协作关系。ISO标准的修订是一个契机，提醒整个行业：**安全，始于理解用户**。

IEEE AI1个月前原文

2698

Gemini 正滑向“Copilot 化”的深渊：谷歌的 AI 无处不在令人窒息

新上线

谷歌的 AI 助手 Gemini 正变得越来越“侵入性”，其无处不在的“闪光”图标让用户感到不堪其扰。本文作者作为 Gemini 的活跃用户，却对 Gemini 在 Google Docs 等应用中无孔不入的提示感到厌烦，并警告谷歌应吸取微软 Copilot 的教训，避免重蹈覆辙。

The Verge1个月前原文

2699

汤姆·斯泰尔：想对加州亿万富翁征税，又怕他们跑路

新上线

对冲基金亿万富翁、加州州长候选人汤姆·斯泰尔正走在一根细绳上：他既要推动对超级富豪增税，又要监管人工智能，还要让硅谷保持满意。这可能吗？ ## 亿万富翁的“阶级背叛” 斯泰尔靠创办全球最大对冲基金之一 **Farallon Capital Management** 积累财富，但在 2012 年退出后转向慈善、气候倡导和政治活动。如今，他加入加州州长角逐，以“不受企业影响”为卖点，甚至自掏腰包 **1.3 亿美元** 用于竞选。他被部分人称为“阶级背叛者”，因为他公开支持备受争议的 **《亿万富翁税法案》**——该法案已让谷歌联合创始人谢尔盖·布林、彼得·蒂尔等富豪威胁或实际搬离加州。 ## 税收与留人的两难斯泰尔在采访中展现出典型的政客式平衡术。他一方面强调要对超级富豪征税以解决加州可负担性危机，另一方面又担心过度逼迫会促使资本外流。这种矛盾在 **AI 监管** 上同样突出：他既承认需要防范 AI 风险，又害怕严格法规会扼杀创新，甚至“赶走建造它们的亿万富翁”。 ## 硅谷的“金主”与“敌人” 斯泰尔的处境折射出加州政治的深层悖论：该州经济高度依赖科技巨头和富豪阶层，但民众对财富不平等和科技垄断的愤怒日益高涨。作为一位靠金融起家的亿万富翁，斯泰尔试图扮演“人民代言人”，却难以摆脱自身阶级标签。他的竞选对手和批评者质疑：一个真正“免疫于企业影响”的候选人，为何需要投入如此巨额的私人资金？ ## 结语斯泰尔的竞选口号是“为加州人而战”，但现实是，他必须同时讨好两个相互冲突的群体：渴望税收公平的普通选民，以及掌握经济命脉的科技精英。这场豪赌的结果，将不仅决定加州未来数年的政策走向，也可能为全美其他科技州提供镜像——当财富与权力高度集中时，民主政治还能否找到平衡点？

WIRED AI1个月前原文

2700

这个隐秘交易让你以1美元获得Peacock或Paramount+一个月——你需要知道的事

新上线

流媒体服务越来越贵，你可能不愿为了一两部剧就订阅一个月或一年。但有一个隐藏优惠：通过**Walmart+**会员试用，你可以仅花**1美元**享受**Peacock**或**Paramount+**的30天服务，还能获得其他额外福利。 ## 如何操作？ Walmart+目前提供**30天试用**，价格仅为**1美元**（原价每月12.98美元）。订阅Walmart+后，你可以免费获得**Peacock Premium**（含广告）或**Paramount+ Essential**（含广告）的访问权限。这意味着你只需支付1美元，就能同时享受Walmart+的配送、燃油折扣等权益，以及一个月的流媒体内容。 ## 值得吗？对于只想短期追剧的用户来说，这比直接订阅Peacock（5.99美元/月）或Paramount+（5.99美元/月）划算得多。但要注意：试用期结束后，Walmart+会自动续费（12.98美元/月），除非你提前取消。另外，流媒体服务为含广告版本，且仅限新用户或符合条件的老用户。 ## 行业背景这类捆绑优惠反映了流媒体行业的竞争趋势：平台通过合作伙伴关系降低获客成本，同时提升用户粘性。Walmart+利用其会员体系作为入口，既推广了自身服务，也为Peacock和Paramount+带来了潜在订阅者。对于消费者，这是低成本试水多个平台的好机会。 ## 小结如果你正好想追《办公室》或《黄石》等剧集，这个1美元交易值得考虑。记得在30天内取消Walmart+，避免后续扣费。

ZDNet AI1个月前原文