AI 资讯

每日聚合最新人工智能动态

1441

因果推断中的模型选择关键作用：InferBERT框架下分类模型的药物警戒比较分析

新上线

在药物警戒领域，区分真实的药物不良反应（ADE）与虚假关联一直是个核心难题。InferBERT框架将Transformer模型与Do-calculus相结合，但其成功高度依赖于底层分类模型的选择。最新研究对InferBERT框架下的四种分类模型进行了系统性比较，揭示了领域预训练的重要性远超模型规模。 ## 研究背景与实验设计药物不良反应的因果推断面临两大挑战：一是混杂因素导致的虚假关联，二是传统信号检测方法（如PRR、ROR、EBGM）无法区分因果与非因果关联。InferBERT通过整合Transformer的上下文理解能力与因果推断的Do-calculus，为这一问题提供了新思路。但框架中的分类模型选择是否影响最终效果？研究者选取了**XGBoost**（基线模型）、**ALBERT**（原始InferBERT模型）、**BioBERT**（生物医学领域预训练Transformer）和**Med-LLaMA**（医学大语言模型）四种代表性模型，在两个基准数据集——**镇痛药诱导的急性肝衰竭（AILF）**和**曲马多相关死亡率（TRAM）**上进行了严格比较。实验采用**5折交叉验证重复20次**，评估指标包括准确率、校准误差（ECE，含等渗回归前后）以及因果术语与PRR、ROR、EBGM的一致性（Jaccard系数），并辅以配对t检验验证显著性。 ## 关键发现：领域预训练胜过规模扩展结果明确显示，**BioBERT在两个数据集上均取得了最高准确率**，而**Med-LLaMA尽管参数规模庞大且采用参数高效微调，表现却不尽如人意**。这一反直觉结果说明，对于药物警戒这一专业领域，**领域特定的预训练（如BioBERT在生物医学语料上的预训练）比单纯扩大模型规模更具优势**。校准技术虽能改善ECE，但对准确率和因果发现的影响参差不齐。在因果术语一致性方面，BioBERT同样表现最佳，与传统信号检测方法高度吻合。 ## 行业启示：小模型大智慧该研究为AI制药和药物安全监测提供了重要参考：在资源有限的实际部署场景中，**投资于可管理、领域感知的模型（如BioBERT）比追求大语言模型更高效**。这并非否定LLM的价值，而是强调在特定任务上，**领域适配性比通用能力更重要**。未来，研究者可进一步探索如何将领域预训练与因果推断框架更深度融合，或开发混合模型以兼顾规模与专业性。

HuggingFace1个月前原文

1442

探针、融合与可信度：面向多模态癌症分析的基模型表征系统评估

新上线

基模型（Foundation Models，FMs）在医学数据表征提取方面展现了强大潜力，但其在分布偏移数据集上的泛化能力尚未得到充分探索。近日，一篇发表于 arXiv 的研究论文系统评估了基于 FM 的表征在计算病理学任务中的表现，涉及两个真实世界商业队列——IH-BC 和 IH-NSCLC（来自授权内部肿瘤数据集）。该研究聚焦全切片图像与转录组图谱两种模态，首先在五个 FM 上对八项下游分类任务进行单模态探针性能基准测试，发现图像与组学表征携带互补的预测信号。随后，通过比较三种基于配对表征的图像-组学融合策略，探讨多模态融合能否带来额外增益。最后，利用共形预测评估所选单模态与多模态管线的可信度。结果显示，FM 表征在分布外数据上取得了具有竞争力的性能，且多模态融合仅在单一模态信号不占主导时发挥主要作用。共形预测揭示，在大多数点预测失败的案例中，真实诊断仍能在预测集中被找回，这强化了不确定性感知推理在临床支持中的价值。该研究为多模态癌症分析中基模型的表征质量、融合策略与可信度评估提供了系统性参考。

HuggingFace1个月前原文

1443

MODE：面向MoE多模态大模型的模态分解专家级混合精度量化方法

新上线

混合专家多模态大语言模型（MoE-MLLMs）在性能上表现出色，但巨大的GPU显存开销成为部署瓶颈。模型压缩因此变得至关重要。在已有的后训练量化（PTQ）方案中，专家级混合精度量化已被证明对MoE-LLMs有效，然而直接应用于MoE-MLLMs时却出现明显的性能退化。研究者发现，根本原因在于专家重要性估计中存在两种被忽视的偏差：**跨模态偏差**和**视觉内偏差**。 **偏差来源** - **跨模态偏差**：在MoE-MLLMs中，视觉token在数量上占据绝对优势，导致专家选择频率统计被视觉token主导，从而掩盖了对文本模态至关重要的专家。 - **视觉内偏差**：大量冗余的视觉token进一步扭曲了频率统计，使得对信息性视觉内容关键的专家被淹没。 **MODE框架** 为弥补上述偏差，来自中国科学院等机构的研究团队提出了**MODE（Modality-Decomposed Expert-Level Mixed-Precision Quantization）**，一个专门针对MoE-MLLMs的模态分解专家级混合精度量化框架。核心思路包括： 1. **按模态分解专家选择频率**：分别统计各模态（文本、视觉）下的频率，避免视觉token的数值优势掩盖文本专家的重要性。 2. **过滤冗余视觉token**：通过去噪处理得到更纯净的视觉频率，突出对有效视觉内容贡献大的专家。 3. **引入模态级量化敏感度**：将每个模态下的量化敏感度作为频率估计的补充信号，更全面地评估专家重要性。 4. **整数线性规划（ILP）**：将上述多维度信号整合到ILP优化问题中，在给定比特预算下为每个专家分配最优位宽。 **实验效果** 大量实验表明，MODE特别适配MoE-MLLMs。在**W3A16**（权重3比特，激活16比特）设置下，平均性能损失控制在**2.9%以内**；在极端的**2比特**设置下，性能提升更为显著。该方法有效解决了传统混合精度量化在多模态场景下的失效问题，为部署高容量MoE多模态模型提供了切实可行的压缩方案。

HuggingFace1个月前原文

1444

远程单次条纹投影轮廓测量中的形状先验捷径：诊断与修复

新上线

## 研究背景基于学习的单次条纹投影轮廓测量术（FPP）在近距离场景下已取得显著进展，但远程（>1米）应用仍面临挑战：强度随距离平方衰减导致信噪比下降，单次拍摄缺乏条纹阶次信息，且现有网络架构的机制尚未被深入理解。 ## 诊断：模型走“捷径”而非真正解码相位研究团队通过**机械可解释性（MI）**和**共形不确定性量化（UQ）**两种方法，对UNet基线模型进行诊断。在包含15,600张条纹图像、50个物体、距离1.5-2.1米的光照真实合成基准上，最佳UNet基线达到**14.54毫米**物体平均绝对误差（MAE）。三项探针实验（线性探针、Grad-CAM、平面外分布测试）一致表明：基线模型并非通过解码条纹相位来求解深度，而是依赖**物体边界的形状先验**——即通过物体轮廓直接猜测深度，这相当于“作弊”式的捷径学习。 ## 修复：从架构层面消除捷径研究者提出 **PhiCalNet**，其核心创新在于**不直接回归深度**，而是输出包裹相位，再通过一个固定的可微分标定层将相位映射为深度。这一架构设计从根本上移除了形状先验解存在的假设空间，而非通过损失函数惩罚来抑制。实验显示，物理信息损失函数（将相同物理约束作为软惩罚施加给深度回归网络）并未带来可测量的提升，证明**架构本身是决定性因素**。PhiCalNet将物体MAE降低了**3.3倍**，达到**4.46毫米**；残余误差主要来自±π包裹不连续处的**0.103%**像素。 ## 验证：不确定性量化确认诊断像素级共形UQ进一步验证了诊断结论：若按快照差异拒绝前5%的物体像素，PhiCalNet的均方根误差（RMSE）降低**64%**（从20.6毫米降至7.4毫米），而基线仅降低**3.5%**。MI与UQ两种方法共同指向同一失效模式。 ## 意义与展望本研究首次系统性地将MI和UQ应用于光学测量网络诊断，证明**架构设计比单纯添加物理损失更能引导模型学习正确物理规律**。PhiCalNet为远程单次FPP提供了一种有效方案，其“先输出中间物理量、再用固定变换层”的思路，或可推广至其他依赖物理先验的视觉任务。

HuggingFace1个月前原文

1445

噪声驱动亚稳态逃逸：深度学习“顿悟”现象背后的物理机制

新上线

深度神经网络（DNN）在训练中常出现一种令人困惑的现象：模型在长时间过拟合后突然泛化，仿佛“顿悟”。最新研究从统计物理视角揭示了这一机制——噪声驱动的亚稳态逃逸。 ## 核心发现来自波茨坦大学的研究者在论文中证明，DNN中的**泛化延迟（grokking）**本质上是**L2正则化强度变化**引发的一级相变中的**滞后效应**。当正则化强度低于临界值时，所有特征原则上都可学习，但网络会陷入由能量势垒分隔的**亚稳态**，导致收敛停滞。关键在于，**随机梯度下降（SGD）中的噪声**提供了逃离亚稳态所需的能量。研究者在线性DNN中观察到，模型从低精度亚稳态逃离的时间符合**阿伦尼乌斯标度**——即逃逸时间随势垒高度指数增长。通过刻意将模型困在亚稳态，他们成功复现了跨越两个数量级的延迟收敛现象，且测试误差最终逼近训练误差的经典曲线。 ## 亚稳态数量与特征维度论文进一步指出，亚稳态的数量恰好等于**可学习特征的数量**——每个数据协方差矩阵的奇异值对应一个特征。这意味着，任务越复杂（奇异值越多），潜在的滞后效应越强，模型越容易陷入局部最优。 ## 对深度学习实践的意义这一发现为加速训练提供了新思路： - **动态正则化**：通过调整L2强度或噪声水平，主动控制模型在相空间中的迁移路径。 - **初始化策略**：避免模型落入与目标任务无关的亚稳态。 - **理解泛化边界**：将泛化能力与相变理论中的阶参数（如奇异值分布）关联，可能量化模型的“学习容量”。尽管实验主要在线性模型上验证，作者提供了证据表明**非线性DNN**中同样存在类似机制。该工作不仅统一了“顿悟”现象的解释，更将深度学习与统计物理中的**成核理论**紧密联系起来。

HuggingFace1个月前原文

1446

KDE Plasma 6.7 虽是小版本更新，但新功能满满

新上线

KDE Plasma 6.7 作为 6.x 系列的一个小版本更新，却带来了不少值得关注的新功能和改进。本文为你梳理其中的亮点。 ## 全局麦克风静音快捷键新版本加入了**全局麦克风静音快捷键**，让你能一键快速关闭麦克风。无论是担心某个应用偷偷使用麦克风，还是在视频会议中需要紧急静音，这个功能都非常实用。你无需再打开设置或系统托盘，只需按下预配置的热键即可。 ## Plasma Bigscreen 模式全面落地 **Plasma Bigscreen 模式** 在本版本中正式全面推出。该模式允许你将桌面内容镜像到大屏电视上，且画面不会出现拉伸、模糊或变形，提供更佳的视觉体验。 ## 按屏幕设置虚拟桌面 KDE Plasma 6.7 还实现了**按屏幕设置虚拟桌面**的功能。如果你使用多显示器，现在可以为每个显示器独立配置不同的虚拟桌面，从而更高效地管理任务和工作区。 ## 其他改进除了上述亮点，6.7 版本还包含许多细节优化和 Bug 修复，整体稳定性和性能进一步提升。虽然是一个点版本，但 KDE 团队注入的“额外功能与打磨”使其体验更上一层楼。 ## 如何获取你可以等待 Plasma 6.7 进入你所用发行版的软件源，或者直接尝试 **KDE Neon** 来抢先体验。总的来说，KDE Plasma 6.7 延续了该桌面环境一贯的高品质，并通过这些新功能进一步提升了用户友好度和灵活性。对于已经使用 Plasma 的用户，这次更新值得升级。

ZDNet AI1个月前原文

1447

RakuOS 解决了不可变 Linux 发行版最让我头疼的一个问题

新上线

不可变 Linux 被认为是操作系统安全的未来，但现有发行版普遍存在一个限制：用户很难在系统之外安装和更新软件。RakuOS 通过一种创新的“分层”机制，巧妙解决了这一痛点。 ## 不可变系统的困境传统的 Linux 发行版（如 Ubuntu、Fedora）允许用户自由修改系统文件，这带来了灵活性，但也增加了被恶意软件破坏的风险。不可变操作系统（如 Fedora Silverblue、openSUSE MicroOS）通过将根文件系统设为只读来提升安全性，但代价是用户安装非官方软件包变得困难——通常需要依赖容器或 Flatpak，而这并非所有用户都习惯。 ## RakuOS 的突破：分层叠加 RakuOS 的核心创新在于“分层”概念。它允许用户在只读系统之上叠加一个可写层，用于安装软件、修改配置，而不会影响底层系统。当系统更新时，RakuOS 会智能合并这些变更，避免冲突。这意味着： - **轻松安装任意软件**：无需容器，直接通过包管理器安装，系统自动处理分层。 - **原子更新**：更新失败可回滚，因为底层镜像未被修改。 - **兼容性**：支持 Debian 软件包，降低迁移门槛。 ## 行业意义与未来 RakuOS 的出现填补了不可变系统在“用户自由度”上的短板。对于开发者、运维人员以及追求稳定性的普通用户而言，它可能成为不可变 Linux 的理想选择。随着容器化和云原生趋势的推进，类似 RakuOS 的分层设计有望被更多发行版采纳，推动 Linux 生态向更安全、更灵活的方向演进。

ZDNet AI1个月前原文

1448

亚马逊55英寸QLED电视降至300美元以下，强烈推荐

新上线

亚马逊的早期Prime Day促销将55英寸Fire TV Omni QLED系列电视价格降至**280美元**，相比原价500美元节省了**220美元**，折扣幅度达44%。这款电视以其出色的画质和智能功能受到好评，是家庭娱乐升级的绝佳选择。 ## 促销详情 - **产品**：Amazon Fire TV Omni QLED Series 55英寸 - **价格**：$280（原价$500） - **折扣**：$220（44% off） - **活动**：早期Prime Day促销 ## 为何推荐这款电视采用**QLED技术**，能够呈现更鲜艳的色彩和更高的对比度。它内置**Fire TV智能平台**，支持语音控制，并整合了流媒体服务。对于预算有限但追求画质的用户来说，280美元的价格极具竞争力。 ## 购买建议如果你正在寻找一款性价比高的55英寸电视，这款折扣产品值得考虑。促销可能限时，建议尽早下单。 **注意**：本文为编辑推荐，不含广告内容。

ZDNet AI1个月前原文

1449

如何阻止安卓手机键盘追踪你：两种方法对比

新上线

你的安卓手机键盘可能正在收集比你想象中更多的信息。以下是两种夺回隐私的方法，但我只信任其中一种。 ## 键盘追踪：隐形的数据收集器当你使用安卓手机打字时，键盘应用可能正在记录你的每一次按键——从日常聊天到密码输入。这些数据通常用于改进预测输入、个性化建议，但不少键盘应用（尤其是第三方键盘）会将数据发送到远程服务器，用于广告定向或用户画像分析。默认情况下，谷歌的 Gboard 和许多第三方键盘都具备“学习”功能，这意味着你的打字习惯、常用短语甚至敏感信息都可能被收集。 ## 两种保护隐私的方法 ### 方法一：关闭联网权限（我信任的方案）最直接且有效的方式是**限制键盘应用的网络访问权限**。在安卓系统中，你可以通过“设置 > 应用 > 键盘应用 > 移动数据”页面，关闭“后台数据”和“漫游时使用数据”选项。对于部分机型，还可以在“应用信息”中直接禁用“互联网”权限。 - **优点**：彻底切断数据外传路径，键盘仅在本机运行，隐私无忧。 - **缺点**：部分键盘的云同步功能（如词库同步）将无法使用。 ### 方法二：使用隐私保护键盘另一种选择是**更换为注重隐私的键盘应用**，例如 **OpenBoard**（开源）、**AnySoftKeyboard** 或 **FlorisBoard**。这些键盘默认不收集数据，且代码公开可审计。 - **优点**：无需手动配置，开箱即隐私友好。 - **缺点**：功能可能不如 Gboard 丰富，例如缺少滑动输入或表情搜索。 ## 为什么我只信任第一种尽管存在隐私键盘，但**绝大多数用户仍在使用 Gboard 或百度输入法等主流键盘**。这些应用的功能依赖云端数据，即便你关闭了“个性化建议”，它们仍可能通过统计收集基础使用数据。而切断联网权限是**零信任模型**——无论应用宣称什么，物理上阻止它联网就是最可靠的保障。 ## 操作步骤（以 Gboard 为例） 1. 打开“设置” > “应用” > “查看所有应用” > 找到 **Gboard**。 2. 点击“移动数据”或“网络访问”（不同安卓版本名称略有差异）。 3. 关闭“允许使用移动数据”和“允许使用 WLAN”。 4. 重启键盘应用（或直接开始使用）。 ## 小结键盘是隐私泄露的隐形入口。**关闭联网权限**是当前最彻底的控制手段，而选择开源键盘则是长期主义的解决方案。在隐私与便利的权衡中，根据你的需求选择即可。

ZDNet AI1个月前原文

1450

用 Amazon Bedrock Guardrails InvokeGuardrailChecks API 保障您的智能体 AI 应用安全

新上线

亚马逊云科技近日宣布推出 **Amazon Bedrock Guardrails** 的 **InvokeGuardrailChecks API**，为智能体 AI 应用提供更灵活的安全防护能力。该 API 允许开发者在不创建完整防护栏资源的前提下，在智能体应用的任意环节独立调用单项安全检查，从而实现对多轮对话、工具调用等复杂场景的精细化管控。 ## 核心能力：按需调用，灵活防护传统防护栏通常以整体资源形式部署，覆盖输入输出过滤、敏感信息屏蔽等多项规则。但智能体 AI 应用往往涉及多步推理、工具调用和上下文切换，不同环节的安全风险差异显著。InvokeGuardrailChecks API 的推出正是为了解决这一痛点——开发者可以**按需选择仅执行特定检查**，例如在用户输入阶段仅启用内容过滤，在工具返回结果阶段启用敏感信息检测，而无需为每个环节重复配置完整规则。 ## 典型应用场景 - **多轮对话中的阶段性防护**：在对话的不同节点，应用可能面临不同类型的风险。例如，在用户提交个人信息时，可单独调用“个人身份信息（PII）检测”检查；在模型生成回复后，再调用“有害内容过滤”检查。这种粒度控制避免了过度过滤或防护不足。 - **工具调用安全**：当智能体调用外部 API 或数据库时，可对工具返回的数据进行专项检查，确保不泄露敏感信息或包含恶意内容，而无需修改全局防护策略。 - **降低资源开销**：对于仅需部分防护能力的场景，InvokeGuardrailChecks API 无需创建完整的 guardrail 资源，减少了配置和维护成本。 ## 如何工作？ API 调用流程简洁：开发者通过 SDK 或 REST API 指定需要执行的检查类型（如内容过滤、主题阻断、敏感信息屏蔽等），并传入待检查的文本或上下文。Amazon Bedrock 实时返回检查结果，包括是否通过以及违规详情。结果可被用于触发后续逻辑，如重试、拦截或修改输出。 ## 行业意义随着智能体 AI（Agentic AI）从实验走向生产，安全可控成为落地关键。Gartner 预测，到 2026 年，**超过 80% 的企业 AI 应用将采用某种形式的护栏机制**。Amazon Bedrock Guardrails 的这次更新，降低了安全防护的集成门槛，让开发者能够以更细粒度、更低成本的方式构建可信 AI 系统。 ## 小结 InvokeGuardrailChecks API 是 Amazon Bedrock 在 AI 安全领域的重要补充。它打破了传统防护栏“一刀切”的模式，赋予开发者按需组合安全策略的能力。对于正在构建复杂智能体应用的团队来说，这无疑是一个值得关注的新工具。

AWS ML1个月前原文

1451

亚马逊73%折扣：联想IdeaPad 1i降至300美元，性价比之选

新上线

亚马逊上，联想 IdeaPad 1i 笔记本降至 **300 美元**，相比原价 1,100 美元，折扣高达 **73%**，创下历史最低价。这款设备在 Prime Day 前夕的促销中脱颖而出，被 ZDNET 编辑评为当前最值得考虑的笔记本交易之一。 ## 价格与配置此次降价使 IdeaPad 1i 成为入门级笔记本市场的强力竞争者。300 美元的价格通常只能买到 Chromebook 或低端 Windows 设备，而这款机型提供了更均衡的配置： - **处理器**：Intel Celeron N4020 或类似型号 - **内存**：4GB RAM - **存储**：128GB eMMC - **屏幕**：15.6 英寸 HD 防眩光显示屏 - **接口**：USB-C、USB-A、HDMI、耳机插孔虽然配置不算高端，但足以应对日常办公、网页浏览、视频流媒体等轻量任务。73% 的折扣使其性价比凸显，尤其适合预算有限的学生或家庭用户。 ## 购买建议 ZDNET 编辑指出，这是 Prime Day 前夕“最疯狂的折扣”之一，很可能持续到活动结束。如果你需要一台价格极低、性能够用的 Windows 笔记本，这款 IdeaPad 1i 是一个不错的选择。不过，请注意这款设备运行 Windows 11 可能会有些吃力，建议主要用于基础应用。 ## 总结联想 IdeaPad 1i 在亚马逊的 73% 折扣使其成为当前笔记本市场少有的“白菜价”选择。尽管性能有限，但 300 美元的价格几乎让所有缺点变得可以接受。对于追求极致预算的用户，这可能是 Prime Day 期间不容错过的机会。

ZDNet AI1个月前原文

1452

Anthropic 与特朗普政府的最新冲突，销售数据却显示可能助其一臂之力

新上线

Anthropic 正经历一个风云变幻的月份。这家 AI 实验室在 5 月底首次超越 OpenAI，在商业支出市场份额上拔得头筹（数据来自企业支出平台 Ramp）。随后，它以 **9650 亿美元估值** 融资 **650 亿美元**（再次领先 OpenAI），并在 6 月初秘密提交 IPO 文件——据称得益于史上首个盈利季度。然而，上周五特朗普政府再度发难，要求 Anthropic 禁止非美国公民（包括其员工）访问其最先进的模型：限量发布的 **Mythos 5** 和公开版 **Fable 5**。这实际上迫使 Anthropic 将这款强大模型全面撤出市场。白宫引用了一项模糊的出口管制指令，但确切原因不明——坊间传言黑客轻易绕过了 Fable 5 的安全护栏，该护栏原本用于防止用户获取 Mythos 级别的能力。Mythos 模型在软件代码安全漏洞查找方面能力极强，以至于 Anthropic 自己都将其标为“危险”并限制公开。此前，Anthropic 曾拒绝让政府将其模型用于大规模监控和全自主武器，导致特朗普政府在 3 月将其列为“供应链风险”。但这并未影响企业销售——Ramp 的数据显示，反而可能有所助益。Ramp 首席经济学家 Ara Kharazian 指出：“讽刺的是，这次冲突可能反而会助推 Anthropic。他们商业采用最好的月份，恰恰是美国国防部将其列为供应链风险的月份。你的模型被专门点名‘危险到不能使用’，这本身就带有极大的光环。”Ramp 的数据涵盖超过 7 万家企业，显示客户大量使用 Anthropic 的 Opus 模型，且商业采用持续增长。虽然撤下 Mythos 和 Fable 5 的具体财务影响尚不明确，但这次冲突验证了 Mythos 的强大能力，反而可能强化 Anthropic 在高端企业客户中的吸引力。

TechCrunch1个月前原文

1453

特朗普政府试图阻止NAACP针对xAI燃气轮机的《清洁空气法》诉讼

新上线

美国特朗普政府正介入一起由全国有色人种协进会（NAACP）提起的诉讼，该诉讼指控埃隆·马斯克的xAI公司未经许可运行燃气轮机，违反了《清洁空气法》。司法部律师在文件中辩称，这些涡轮机为驱动Grok聊天机器人的数据中心供电，而Grok已被军方用于关键行动，包括在“史诗之怒”行动中协助打击伊朗目标。NAACP则指控xAI在密西西比州南aven运营多达57台未获许可的燃气轮机，造成污染和健康问题。此案凸显了AI发展与环保法规之间的紧张关系。

Ars Technica1个月前原文

1454

Anthropic 暂停 Claude Agent SDK 的按 Token 计费计划

新上线

Anthropic 在最后一刻叫停了对 Claude Agent SDK 的计费改革，这一原本旨在将 SDK 使用与标准订阅分离的方案，曾引发重度用户的强烈担忧。 ## 改革原计划：按 API 费率计费今年 5 月 13 日，Anthropic 宣布自 6 月 15 日起，Claude Agent SDK（包括通过第三方应用和 `claude -p` 命令的使用）将不再享受订阅套餐内的统一限额，而是改为按 Anthropic 的 API 标准费率计费。订阅用户每月会获得一笔与订阅费等额的“使用额度”，超出部分需另行付费。这一变动与现行模式截然不同：目前，Agent SDK 的使用仅受订阅套餐的**每周用量上限**约束，重度用户可以在订阅费内获得远高于 API 同等花费的算力。有分析指出，**Claude Opus 用户每天仅发送 2-3 条消息就能“回本”**，订阅的实际价值可达月费的数倍。开发者 Matthew Diakonov 直言：“如果你用 Opus 作为主要编码助手，第一周就会用超。” ## 开发者与第三方应用强烈反弹消息一出，立即在开发者社区引发震荡。代码编辑器 Zed 的团队警告用户：“对于重度使用代理功能的用户，这将是巨大的成本增加。”许多依赖 Claude Agent SDK 构建自动化工作流的第三方应用开发者被迫重新评估定价策略。 ## 紧急“暂停”背后的考量就在新政即将生效的 6 月 15 日当天，Anthropic 悄然更新支持页面，宣布“暂停上述 Claude Agent SDK 计费变更”，并表示“目前一切照旧”，公司正在“优化方案以更好地支持用户通过订阅使用 Claude 构建应用”。部分用户确认收到了来自 Anthropic 的邮件通知。这一急转弯恰逢 GitHub Copilot 也在近期推行类似的 Token 制计费改革。业界普遍认为，Anthropic 的让步反映出**开发者对“订阅+额外计费”模式的敏感度极高**，尤其在 AI 辅助编程和自动化场景下，用量波动大，固定订阅制更具可预测性。 ## 行业启示：订阅制与按量计费的平衡难题 Anthropic 的这次“试水”与“撤回”凸显了 AI 平台在商业化道路上的典型困境：订阅制吸引用户，但重度用户会过度消耗资源；按量计费更公平，但可能劝退核心开发者。如何在保持用户粘性与实现可持续营收之间找到平衡，将是所有 AI 公司必须面对的课题。目前，Claude Agent SDK 用户仍可继续享受现有订阅内的使用上限，但 Anthropic 明确表示正在“制定新方案”，未来不排除推出更精细化的分层计费或混合模式。

Ars Technica1个月前原文

1455

Amazon SageMaker AI 推出容器缓存，模型扩展速度提升 2 倍

新上线

亚马逊云科技今日宣布，Amazon SageMaker AI 推理服务正式支持容器镜像缓存功能，这是其在“更快扩展”优化路线上的最新里程碑。该功能通过缓存推理容器镜像，可将生成式 AI 模型在横向扩展事件中的端到端延迟缩短高达 **2 倍**，显著提升模型部署的响应速度和资源利用率。 ## 为什么容器缓存如此重要？在生成式 AI 模型快速普及的当下，推理工作负载的弹性扩展能力成为关键瓶颈。传统模式下，当流量激增触发新实例启动时，系统需要从远程仓库拉取完整的容器镜像——尤其是大模型镜像（动辄数 GB）的下载解压过程，往往占据分钟级的启动时间，导致服务响应滞后。Amazon SageMaker AI 的容器缓存机制，通过在计算节点本地或就近存储常用镜像层，避免了重复拉取，从而将扩展延迟从“分钟级”压缩至“秒级”。 ## 技术实现与效果该功能适用于 SageMaker AI 推理端点（Inference Endpoints）的自动扩展场景。当新实例被调度时，系统会优先检查本地缓存中是否已有目标镜像的层数据：若命中缓存，则直接加载运行；若未命中，仍回退至远程拉取。对于频繁部署的模型，缓存命中率可达 90% 以上，实测端到端延迟优化达 **2 倍**。这意味着在流量突发时，模型可以更快地开始处理推理请求，用户几乎感受不到扩展带来的冷启动延迟。 ## 行业背景与价值当前，生成式 AI 应用正从实验阶段走向生产部署，企业对推理基础设施的弹性、成本和响应速度提出了更高要求。容器缓存直击了“扩展效率”这一核心痛点——它不改变模型本身，而是优化底层基础设施的调度逻辑。对于运行多个模型版本或频繁更新镜像的团队，该功能可显著减少因镜像拉取导致的资源闲置，降低 GPU 等昂贵计算资源的等待成本。 ## 如何启用？该功能现已面向所有 AWS 区域开放，用户无需额外配置即可自动受益。SageMaker AI 会在端点创建或更新时自动启用缓存，同时支持监控缓存命中率等指标。对于有特殊合规或网络隔离需求的场景，用户也可通过自定义配置控制缓存行为。 ## 总结 Amazon SageMaker AI 的容器缓存是“快”与“省”的又一次结合——它让模型扩展更快，同时降低了不必要的网络传输成本。在生成式 AI 推理需求持续增长的当下，这一优化无疑将帮助更多企业实现高性能、低延迟的 AI 服务部署。

AWS ML1个月前原文

1456

SpaceX市值飙升至2.6万亿美元，一度超越亚马逊

新上线

SpaceX在上市后市值激增，一度超越亚马逊成为全球第五大公司，但随后回落。这家由埃隆·马斯克领导的太空与AI公司自上周五上市以来，市值已增加约1万亿美元。周二，SpaceX宣布收购AI编程公司Cursor，同时其股票期权开始交易，推动股价飙升，市值一度触及2.9万亿美元，最终收于2.6万亿美元左右。尽管如此，SpaceX去年营收187亿美元，亏损49亿美元，而亚马逊同期盈利780亿美元。投资者似乎更看重其AI业务潜力：SpaceX已与Anthropic和Google达成算力租赁协议（虽不具约束力），并计划将Cursor收入纳入财报。IPO中SpaceX仅发行了约4%的股份，导致股价波动剧烈，当日交易量超过3亿股。

TechCrunch1个月前原文

1457

亚马逊Prime Day预热：三星、谷歌手机最高省466美元，早鸟折扣抢先看

新上线

虽然亚马逊Prime Day大促尚未正式开启，但手机品类的早鸟优惠已提前引爆。根据ZDNET的追踪，目前三星、谷歌和摩托罗拉的多款旗舰及折叠屏机型已出现显著价格下调，部分折扣幅度超过20%。 ### 谷歌Pixel 10系列：直降300美元谷歌最新旗舰**Pixel 10 Pro XL**目前售价**1,019美元**，较原价节省**300美元**；标准版**Pixel 10**则降至**599美元**，优惠**200美元**。这两款机型均搭载Tensor G5芯片，主打AI摄影与原生Android体验，是追求纯净系统用户的优先选择。 ### 三星旗舰与折叠屏：最高省466美元三星阵营的优惠更为密集： - **Galaxy S26 Ultra**：售价**1,100美元**，优惠**200美元**，配备S Pen和2亿像素主摄，适合商务与影像用户。 - **Galaxy Z Fold 7**：原价1,999美元，现价**1,533美元**，优惠力度高达**466美元**，是本次早鸟折扣中降价幅度最大的机型。该机展开后拥有7.6英寸内屏，支持多任务分屏，适合生产力场景。 - **Galaxy Z Flip7 FE**：售价**650美元**，优惠**350美元**，以翻盖折叠设计吸引时尚用户，性价比突出。 ### 选购建议与注意事项这些折扣来自ZDNET认证的可靠卖家，但消费者需注意： 1. 部分优惠可能为限时闪购，价格随时波动。 2. 建议对比各平台（如亚马逊、三星官网）的以旧换新或捆绑赠品政策。 3. 关注“Prime Day”期间是否会有更低价格，但早鸟价已接近历史低点。随着Prime Day正式日期临近，预计还将有更多机型加入促销。对于近期有换机需求的用户，当前折扣已具备较强吸引力，尤其是折叠屏产品降价幅度可观。

ZDNet AI1个月前原文

1458

五角大楼用AI写国会报告，称1.5万军人使用生成式AI工具

新上线

美国国防部（五角大楼）正在利用生成式AI工具撰写国会要求的年度报告，并声称已有**150万**军事人员使用生成式AI工具。 ## 背景：AI写报告，效率大幅提升五角大楼首席技术官Emil Michael在哈德逊研究所活动上透露，通过谷歌云的**Gemini for Government**和自研的**GenAI.mil**平台，原本需要**200小时**编写的国会报告，现在只需**5小时**就能完成。自2025年12月起，该平台已向所有六个军种开放。 ## 实际案例：团队反馈“五年来最佳报告” 国防部副助理部长Jacob Glassman在4月的Box联邦峰会上提到，他曾让一个人员不足的团队使用GenAI.mil撰写国会报告。一周后，团队称这是“五年来写得最好的报告”。不过，Glassman未透露具体是哪份报告。 ## 行业背景：国会报告数量激增根据美国政府问责局数据，国会要求提交的报告数量从2000年的**500多份**增至2020年的**1400多份**。立法事务官员需要逐条解读国防授权法案，寻找最新要求。AI工具被视为缓解人力压力的重要手段。 ## 质疑与展望尽管效率提升明显，但AI生成报告的准确性和深度仍存疑问。五角大楼强调，AI仅辅助起草，最终需人工审核。此举也引发了对AI在政府决策中角色的讨论。

Ars Technica1个月前原文

1459

Android 17 正式发布，六月 Pixel Drop 带来全新体验

新上线

Google 今日正式推送 Android 17，并同步带来 6 月 Pixel Drop 功能更新。本次更新聚焦生产力提升、AI 能力增强与安全防护升级，为 Pixel 设备用户带来多项实用新特性。 ### 生产力新工具：Bubbles 与快捷操作 Android 17 进一步优化了多任务处理体验。**Bubbles** 功能得到增强，现在支持更多应用的消息快速回复与悬浮窗口操作，用户无需切换界面即可处理聊天、日程提醒等事务。同时，系统新增了 **智能分屏建议**，当用户打开一个应用时，系统会基于使用习惯推荐另一个应用进行分屏协作，减少手动操作步骤。 ### AI 模型升级：更智能的本地处理本次更新引入了全新的 **Gemini Nano** 模型，这是 Google 专为移动设备优化的端侧 AI 模型。它支持更复杂的自然语言理解任务，例如在笔记应用中实现智能摘要、在信息应用中提供上下文回复建议。与云端 AI 不同，Gemini Nano 完全在本地运行，数据无需上传，兼顾了响应速度与隐私保护。此外，**Pixel Camera** 的 AI 场景识别能力也得到提升，低光环境下的拍摄效果更加清晰。 ### 安全防护增强：实时威胁检测 Android 17 强化了 **Google Play Protect** 的实时扫描能力，现在可以检测更多类型的恶意软件，包括利用 AI 生成的欺诈内容。系统还新增了 **敏感权限提醒**，当应用尝试访问位置、麦克风或摄像头时，状态栏会持续显示图标，并在通知栏中提供详细的使用记录。此外，**隐私沙盒** 功能进一步扩展，用户可更精细地控制广告追踪权限。 ### Pixel Drop 六月更新亮点 - **通话录音转文字**：支持将通话录音实时转为文字记录，并自动生成摘要。 - **健康监测升级**：Pixel Watch 新增睡眠呼吸暂停检测功能，数据与 Fitbit 平台同步。 - **快速分享优化**：Nearby Share 更名为 Quick Share，并支持与 Chromebook 和部分 Windows 设备无缝传输文件。 ### 小结 Android 17 的更新体现了 Google 在 **端侧 AI** 和 **隐私保护** 上的持续投入。Gemini Nano 的加入让手机在离线状态下也能完成复杂的 AI 任务，而安全功能的增强则回应了用户对数据控制的关切。对于 Pixel 用户而言，6 月 Pixel Drop 带来的通话转文字和健康监测功能尤为实用。目前更新已陆续推送至 Pixel 6 及以上机型，其他 Android 厂商预计将在未来几个月内跟进。

ZDNet AI1个月前原文

1460

Android 17正式发布：全新多任务工具与Gemini AI深度融合

新上线

Google 于周二正式发布了 **Android 17** 操作系统及其智能手表版本 **Wear OS 7**，并同步推出了 **Pixel Drop** 功能更新。此次发布不仅带来了多任务处理、家长控制和安全工具等系统级改进，更将 Google 最新的 AI 模型深度集成到设备体验中，凸显了其以 Pixel 和 Android 为窗口展示 AI 技术的战略意图。 ## 多任务与交互升级 Android 17 引入了一个名为 **气泡栏（Bubble Bar）** 的全新界面元素。它允许用户将常用应用以气泡形式整理并固定在屏幕底部，实现快速切换和多应用并行操作，显著提升工作效率。此外，系统新增了 **屏幕录制与自拍同步** 功能，用户可同时开启前置摄像头录制面部反应和屏幕内容，方便制作反应视频，并直接分享至 TikTok、YouTube 等平台。 ## AI 能力全面渗透本次更新的核心亮点在于 AI 模型的深度整合。**Gemini Omni** 支持用户通过对话式交互直接编辑视频；**Lyria 3** 模型则允许用户在 Gemini 应用中通过文字或图片提示生成音乐曲目，将 AI 创作能力下沉至消费级场景。Pixel 10a 设备还获得了基于 **AudioLM** 的增强型语音翻译工具，实现更流畅的实时语音互译。此外，**Quick Share** 功能开始兼容苹果 AirDrop（仅限 Pixel 8a 和 9a 旧机型），进一步打破生态壁垒。 ## 安全与亲子守护 Android 17 强化了安全防护体系：新增 **标记为丢失（Mark as Lost）** 功能，可在 Find Hub 中远程锁定设备；**实时威胁检测（Live Threat Detection）** 可主动识别恶意行为。家长控制方面，系统提供了更精细的屏幕时间限制和内容过滤工具。 ## 智能手表同步升级 Wear OS 7 为 Pixel Watch 带来了 **紧急检测功能**——当手表检测到车祸、摔倒或脉搏异常时，会自动联系紧急服务和预设联系人。这一功能将可穿戴设备从健康追踪升级为主动安全守护者。 ## 战略意义与苹果在 9 月为 iOS 27 和 Siri 注入 AI 的追赶策略不同，Google 选择在 Android 17 上直接展示其最前沿的 AI 成果（如 Gemini Omni、Lyria 3），意图通过系统级整合确立 AI 原生体验的标杆。此次更新不仅是功能迭代，更是 Google 将 AI 从云端延伸至终端、重塑人机交互方式的关键一步。

TechCrunch1个月前原文