AI 资讯

每日聚合最新人工智能动态

1121

基于领域知识的时空图卷积网络：提升心电图识别可解释性与罕见病诊断能力

新上线

## 概述在人工智能（AI）广泛应用的时代，模型可解释性仍是医疗等专业领域面临的核心挑战。近日，一项发表于ICONIP 2024的研究提出了一种**基于领域知识的时空图卷积网络（Domain Knowledge Based Temporal-Spatial Graph Convolution Network）**，用于心电图（ECG）识别，在提升性能的同时增强了模型的可解释性。 ## 方法创新：将医学知识融入图结构传统深度学习方法（如卷积神经网络）常被视为“黑盒”，难以解释其决策依据。该研究另辟蹊径，**引入PRQST关键点**——这些是ECG解读中至关重要的波形特征点（如P波、QRS波群、T波等），作为领域知识注入模型。具体而言，研究者构建了一个**双流有向图**来建模ECG信号： - **空间有向图**：捕捉每个心动周期内关键点之间的相对位置关系。 - **时间有向图**：刻画连续心动周期之间关键点的时间依赖关系。这种结构使模型不仅学习数据模式，还能利用医学先验知识，从而提升可解释性和对异常模式的识别能力。 ## 实验结果：罕见类别性能显著提升研究团队在**首届中国心电图智能竞赛数据集**上进行了验证，该数据集包含9类心电异常。结果显示： - **总体平均F1分数**达到**88.1%**，优于现有最优模型。 - **罕见类别平均F1分数**达到**76.3%**，同样领先。值得注意的是，引入领域知识后，模型对**罕见类别**的检测性能提升尤为明显。这在实际临床中具有重要意义——罕见心律失常往往更容易被漏诊，而该模型通过知识引导，有效缓解了数据不平衡带来的偏差。 ## 行业意义与展望该研究为AI在医疗诊断中的应用提供了新思路：**通过嵌入领域知识，模型不仅能“看”到数据，还能“理解”临床逻辑**。这种图网络架构可推广至其他生物信号（如脑电图、肌电图）分析中。未来，随着可解释AI（XAI）在医疗领域的合规要求日益严格，这类将**先验知识结构化**的方法有望成为主流。研究团队表示，下一步将探索更多类型的领域知识（如临床诊断规则）与图网络的融合，以进一步提升模型的泛化能力和临床适用性。

HuggingFace19天前原文

1122

高维近似最近邻搜索的网格方法迎来新突破：缩放定律揭示维度鲁棒性优势

新上线

近似最近邻（ANN）搜索是机器学习与信息检索领域的核心问题，尤其在大型语言模型和向量数据库应用中扮演关键角色。长期以来，图、树和基于分区的方法主导了ANN算法研究，而网格类方法因被认为在高维空间中效率低下，逐渐淡出主流视野。然而，一篇最新预印本论文《Scaling Laws for Grid-Based Approximate Nearest Neighbor Search in High Dimensions》重新审视了网格方法的潜力，揭示了其在维度缩放方面的独特优势。该研究由Matthew J. Liu等人完成，系统刻画了多探针网格算法在数据集规模 $N$ 和维度 $d$ 上的性能缩放规律。实验基于GloVe嵌入族进行，发现了一个此前未被报道的 **维度缩放交叉现象**：当维度增加时，图、树和分区方法的吞吐量显著下降，而多探针网格搜索的维度缩放指数几乎保持不变。这意味着网格方法在高维场景下展现出更强的 **维度鲁棒性**。除了维度优势，网格方法在查询时间上表现出近线性的 $N$ 缩放，同时索引成本远低于其他主流ANN方法。这一特性使其特别适合 **索引重建频繁** 或 **高维度** 的应用场景——例如在线学习、动态数据集或需要频繁更新索引的推荐系统。论文还指出，近期研究已将自注意力机制形式化为ANN操作。因此，ANN算法的 $N$ 和 $d$ 缩放特性可能为高效Transformer架构的成本分析提供指导。例如，若网格方法能在大规模序列上保持低查询复杂度，则有望被用于加速注意力计算。 **小结**：这项研究挑战了“网格方法不适合高维ANN”的传统认知，揭示了其在维度缩放上的独特竞争力。虽然网格方法在低维或极小数据集上可能不如图方法，但在高维、重建密集型场景中，它提供了一种平衡索引成本与查询精度的可行选择。未来，结合硬件加速（如GPU）和混合索引策略，网格方法或将在向量搜索领域重新占据一席之地。

HuggingFace19天前原文

1123

IonSense-QKG：面向锂离子电池数据集发现的量子就绪元数据框架

新上线

随着锂离子电池在电动汽车、储能系统等领域的广泛应用，电池健康状态估计、剩余寿命预测、异常检测等任务成为研究热点。公开的锂离子电池数据集日益增多，但这些数据集在化学体系、模态、规模、标签质量、序列结构、访问状态和预处理复杂度等方面差异显著，直接影响其是否适用于近期的混合量子-经典机器学习工作流。近日，来自印度的研究者提出了 **IonSense-QKG**，一个专为锂离子电池数据集发现设计的量子就绪元数据框架。该框架基于已有的 EV-Battery-IonSense 索引，为公开电池数据集记录添加了量子相关元数据，包括任务类型、传感模态、化学体系、标签可用性、序列类型、预处理要求、候选量子编码方案、估计量子比特范围以及 NISQ（含噪声中等规模量子）可行性。 ## 核心创新：量子就绪评分 IonSense-QKG 引入了一个透明的**量子就绪评分**，用于对数据集进行排序，作为未来混合量子-经典电池基准测试的候选资源。值得注意的是，该评分旨在作为数据集选择的启发式方法，而非量子优势的证据。框架通过基于丰富元数据的查询式发现，帮助识别适合紧凑量子特征映射、量子时间序列工作流、有限标签异常检测以及未来电池健康基准测试的数据集。 ## 框架组成与发布成果该框架的发布成果包括：元数据表、评分脚本、鲁棒性检查、链接检查工具以及 SQL 风格的查询示例。研究者将数据集选择定位为数据管理问题，并为数据驱动的量子电池分析提供了可复现的基础。 ## 行业背景与意义当前，量子机器学习仍处于早期探索阶段，但 NISQ 设备已展现出在特定任务上的潜力。电池领域的数据集通常具有高维度、时间序列特性，且标签获取成本高，这恰好为量子方法提供了可能的应用场景。IonSense-QKG 通过标准化数据集的量子相关属性，降低了研究者筛选合适数据集的门槛，有望加速量子计算在电池健康管理中的落地。 ## 局限与展望尽管框架提供了系统化的元数据增强方案，但量子就绪评分目前仍基于静态元数据，未考虑实际量子硬件的性能波动。此外，框架主要针对监督学习任务，对无监督或强化学习场景的适配尚需扩展。未来，研究者计划集成更多动态指标，并探索与真实量子硬件的联合验证。总体而言，IonSense-QKG 为电池数据集与量子计算之间搭建了一座桥梁，其数据管理视角为跨学科研究提供了新思路。随着量子硬件和算法的进步，这类框架的价值将进一步凸显。

HuggingFace19天前原文

1124

新型机器学习方法实现中枢神经系统肿瘤DNA甲基化分类突破

新上线

中枢神经系统（CNS）肿瘤的精准分类对临床治疗至关重要。近日，一项发表于 arXiv 的研究提出了一种基于 DNA 甲基化数据的机器学习新方法，在分类准确率上显著超越现有主流方案。 ## 研究背景 DNA 甲基化谱分析已成为 CNS 肿瘤分类的强大工具，但跨队列迁移性、方法学严谨性及多类别鲁棒评估仍是挑战。现有参考分类器在 91 个类别上达到 82% 的一致性，仍有提升空间。 ## 方法创新研究团队提出结合 **稀疏随机投影** 进行降维与 **多项逻辑回归** 进行分类的机器学习框架。该方法首先通过稀疏随机投影将高维甲基化特征映射到低维空间，保留关键信息的同时降低过拟合风险，再使用多项逻辑回归进行多类别分类。与传统的 t-SNE 或 PCA 不同，稀疏随机投影计算效率更高，且能保持样本间的距离结构。 ## 实验结果在 **2,801 个样本** 的参考队列上，该方法在分层 3 折交叉验证中达到 **96%** 的平均准确率。在独立的 **1,104 个样本** 临床评估队列中，91 类级别准确率为 **86%**，甲基化类家族级别准确率高达 **93%**。相比现有参考分类器的 82% 类级别和 88% 家族级别一致性，分别提升约 **4 个** 和 **5 个百分点**。 ## 临床意义这种改进具有直接临床价值：在诊断场景中，正确分类率提升 5 个百分点可能直接影响癌症亚型判定，进而改变治疗选择和后续决策。例如，髓母细胞瘤的不同亚型对放化疗敏感性差异显著，误分类可能导致无效治疗。 ## 行业视角当前 AI 在病理学中的应用正从辅助走向核心。该研究通过强化方法学严谨性——如使用交叉验证、独立测试集、多层级评估——为机器学习在医疗诊断中的可靠性树立了新标杆。未来，此类方法有望整合到临床工作流中，实现自动化的甲基化分类报告。 ## 小结这项研究展示了稀疏随机投影与逻辑回归组合在生物信息学中的潜力，不仅提升了 CNS 肿瘤分类精度，也为其他基于表观遗传标记的疾病分类提供了可复用的方法论框架。

HuggingFace19天前原文

1125

从近似到涌现：深度学习理论的新统一视角

新上线

arXiv 最新发布了一篇堪称“深度学习理论百科全书”的论文——《From Approximation to Emergence: A Theory of Deep Learning》（从近似到涌现：深度学习理论），作者为 Zhilin Zhao。该论文并非孤立地罗列结果，而是试图将现代深度学习理论构建成一个连贯的研究叙事，为研究者、研究生及数学背景的从业者提供一份严谨的理论地图。 ## 核心脉络：从经典三件套到当代前沿论文的叙事逻辑清晰：从深度学习的**经典基础**——近似理论、优化算法和泛化能力——出发，逐步过渡到**当代核心机制**，包括过参数化、鲁棒性、生成模型、Transformer、上下文学习、规模定律、可解释性、对齐和涌现现象。每一部分的理论都围绕三个维度展开：**控制的对象**（理论试图解释什么现象）、**成立的假设**（理论在什么条件下有效）、以及**未解释的盲区**（理论的局限性）。这种组织方式使得读者不仅能理解单个理论，还能看清各理论之间的关联与断层。 ## 为什么现在需要这样一篇论文？深度学习理论长期处于“各自为战”的状态：近似理论关注表达能力，优化理论关注训练动态，泛化理论关注测试误差，而涌现、对齐等更“玄学”的话题则往往依赖实验观察。Zhao 的工作正是**弥合这些鸿沟**，将分散的文献整合成一个统一的框架。论文特别强调了**涌现**——即模型在规模、数据、架构和训练的共同作用下，展现出训练目标中未明确编码的能力。这一方向已成为当前深度学习理论最核心、也最棘手的课题。Zhao 试图证明，涌现并非不可解释的“魔法”，而是可以从更基础的原理中推导出来的。 ## 论文的定位与意义这篇论文更像是一部**专著**而非常规的研究论文。它系统性地回顾了数以百计的文献，并给出了数学上严谨的证明导向分析。对于正在研究大模型、Transformer 或 AI 对齐的学者来说，这篇论文提供了一个宝贵的“导航图”，帮助他们理解自己的工作在更宏大理论版图中的位置。当然，论文也坦诚地指出当前理论的**不完整性**：许多现象仍缺乏严格的数学解释，尤其是涉及涌现、对齐等前沿话题。Zhao 将这种“不完整”视为推动未来研究的动力，而非缺陷。 ## 适合谁阅读？ - **AI 研究者**：希望从理论高度理解深度学习本质的学者。 - **研究生**：正在寻找论文选题或希望系统掌握理论框架的学生。 - **工程实践者**：虽然偏重理论，但其中关于过参数化、鲁棒性、规模定律的讨论对实际调优也有启发。 ## 小结《From Approximation to Emergence》是一篇雄心勃勃的论文，它试图为深度学习理论画出一张“完整的地图”——尽管地图上仍有很多空白区域。这种统一视角的尝试，对于推动领域走向更严谨、更可解释的理论基础，具有重要的学术价值。

HuggingFace19天前原文

1126

客服代理何时该“三思而后行”？难度路由控制架构提升自动化服务可靠性

精选

自主客服代理正从对话界面转向运营执行角色：它们检索企业记录、应用服务策略，并执行退款、取消、换货、订单修改和预订变更等后端写入操作。这种转变带来了一个服务控制问题：企业必须保持常规服务快速低摩擦，同时防止在客户指令、政策约束、企业记录和后端写入相互交织的请求上出现运营错误。来自 arXiv 的一篇新论文（arXiv:2607.01426）提出了**难度路由服务控制架构**，其核心问题是：客服代理在行动之前何时应该“三思”？该架构通过一个轻量级路由器，将常规会话保留在低成本基线路径上，而将操作耦合的会话路由至升级工作流。升级路径采用**冲突感知通信**和**写入触发重新考虑**机制，在关键后端写入前集中进行推理和安全检查，而不是对所有服务会话统一施加额外控制。研究团队在人类验证的零售和航空任务（来自 τ²-bench）上评估了该架构。在零售场景中，该方法在存在操作冲突的服务请求上持续提高了可靠性。路由证据表明，更强的控制被定向到冲突请求，而非广泛应用于常规请求。对话和工具使用分析显示，性能提升并非来自无差别的交互扩展或更宽的工具链；相反，增加的对话轮次和工具调用主要用于**证据收集、写入分离和写入前重新考虑**。案例级证据表明，升级工作流保留了备用计划，将检索到的记录绑定到正确操作，对写入进行排序，并分解多实体请求。航空实验结果将相同的服务控制逻辑扩展到了预订操作。 ### 核心创新点 - **难度路由**：通过轻量级路由器区分常规与复杂请求，避免“一刀切”的资源浪费。 - **写入触发重新考虑**：仅在关键写入操作前触发深度推理，而非全程监控。 - **冲突感知通信**：在升级路径中识别指令、政策与记录间的矛盾，并引导代理做出正确决策。 ### 行业意义随着 AI 代理越来越多地直接操作企业后端系统，可靠性成为关键瓶颈。该架构提供了一种**细粒度控制**方案，在保持高吞吐量的同时显著降低运营风险，尤其适用于零售、航空、金融等对操作准确性要求极高的行业。未来，类似方法可能成为企业级 AI 代理的标准配置。

Anthropic19天前原文

1127

编程示例学习中的固定集鲁棒性：示例破坏与语义分区恢复

新上线

编程示例学习（Programming by Example, PBE）系统通过少量输入-输出示例推断程序。传统鲁棒PBE方法通常将错误示例建模为随机噪声，并最小化期望或经验损失。然而，新研究指出一种不同的失效模式：对手在观察合成器后，故意选择破坏性最大的示例来损害返回程序。论文《Fixed-Set Robustness in Programming by Example: Example Corruption and Semantic Partition Recovery》来自Yuan Si和Jialu Zhang，发表于arXiv:2607.01280。作者形式化了有限PBE版本空间中的**固定集最坏情况破坏**，针对字符串转换领域特定语言（DSL）实现了精确（受限池内）和启发式破坏搜索，并提出**版本空间分区聚合（VPA）**防御：在不相交的示例组上分别合成，然后通过语义签名投票。核心发现是审慎且部分负面的：**低边际PBE任务存在对抗鲁棒性维度**，随机拼写错误和噪声PBE评估无法捕捉；而语义分区聚合仅在干净语义保持分区投票边际时有效，这在现实任务中常失败。实验证据来自多个基准：一个精心设计的编辑使所有8个尖峰任务失败，而200次随机拼写、DSL池和距离匹配随机控制的成功率分别为10.3%、11.0%和16.7%；生成的边际-1行在预算1下即被破坏，但VPA可恢复；在公共SyGuS上投票边际接近1，自适应攻击者将VPA准确率降至零；Playgol在141个接受行上显示出对随机控制的积极成对自助差距。此外，一个基于精确输出提示的小型实验（20个受控边际-1任务）显示，本地和API模型在干净到攻击模式下呈现相同的定性模式。该研究揭示了PBE系统在面对针对性示例破坏时的脆弱性，并指出VPA防御的局限性，为未来更鲁棒的PBE设计提供了方向。

HuggingFace19天前原文

1128

Anthropic Fable 5 创下 AI 自由职业工作表现新纪录，但距离取代人类仍有距离

新上线

Anthropic 的 Fable 5 模型在重新获得美国政府授权后，于 CAIS 的远程劳动指数（RLI）测试中创下 16.1% 的自动化率新纪录，是 Opus 4.8 的两倍多。尽管 AI 在特定任务上进步显著，但能力仍参差不齐，短期内无法完全取代人类。

ZDNet AI19天前原文

1129

Jersey Mike's IPO 文件里的 22 次“AI”，揭示了科技圈有多荒谬

新上线

当一家三明治连锁店也在 IPO 文件中大谈特谈 AI，我们或许该停下来想想：这波 AI 热潮是不是已经走火入魔了？ TechCrunch 资深编辑 Julie Bort 在最新评论中指出，**Jersey Mike's** 这家以 Danny DeVito 为代言人的快餐品牌，居然在其 IPO 文件中 22 次提及“人工智能”或“AI”。而与之形成鲜明对比的是，“天气”一词仅出现 5 次，“闪电”更是零提及。 ### 为什么一家三明治店需要谈 AI？答案很简单：**投资者饥渴**。在当下，任何与 AI 沾边的公司似乎都能获得更高估值。Bort 观察到，这种“AI 撒粉”现象不仅存在于科技初创公司，甚至蔓延到了实体餐饮行业。Jersey Mike's 的 AI 风险提示基本是套话模板：“我们开始在业务中使用 AI 技术”，但并未说明具体用途。 ### 真正的 AI 风险在哪？ Bort 认为，对于一家卖实体三明治的公司来说，AI 灾难的风险远低于**被闪电击中**（2021 年得克萨斯州一家门店确实遭过雷击）。她调侃道，真正该担心的可能是像 Starbucks 那样——其 AI 库存工具因无法正确计数而被迫废弃。 ### 深层反思这篇文章尖锐地指出了当前 AI 投资环境的非理性： - 非 AI 公司被迫“蹭 AI”以迎合资本偏好 - 风险提示沦为营销噱头 - 实体业务与 AI 概念之间的鸿沟被忽视 Bort 的结论是：**当一家三明治店在 IPO 文件中用 22 次 AI 来包装自己时，我们已经从“对技术的合理兴奋”滑向了“令人无奈的笑话”**。这份犀利的评论为当下狂热的 AI 投资提供了一个清醒的注脚。

TechCrunch19天前原文

1130

Meta 低调推出 AI 游戏应用 Pocket，用文本提示即可“即兴编码”生成小游戏

新上线

Meta 近日悄然发布了一款名为 **Pocket** 的实验性 AI 应用，用户只需输入文字提示，就能生成并分享互动式迷你游戏和应用。这款产品源于 Meta 今年初对“即兴编码”游戏平台 Gizmo 的收购，在 Google Play 上已可下载。 ## 从 Gizmo 到 Pocket：一次低调的整合 Pocket 的界面与 Gizmo 原版应用高度相似，核心功能都是通过 AI 将文字描述转化为可交互的“小玩意儿”（Gizmo）。用户不仅可以用提示词创建自己的游戏，还可以在可滚动的 feed 中体验他人制作的成果。这一模式降低了游戏开发的门槛，让没有编程经验的用户也能快速获得创作乐趣。应用情报公司 Appfigures 的数据显示，Pocket 最早于 2026 年 6 月 29 日（注：原文如此，疑为笔误，应为 2025 年 6 月 29 日）在 iOS 和 Google Play 上架。由于上架时间极短，目前尚无法统计下载量。而 Gizmo 原应用在生命周期内已累计获得 **63.5 万次安装**，用户好评率达 **98%**。 ## Meta 的 AI 创作矩阵 Pocket 是 Meta 在 AI 创作工具领域的最新布局。此前，Meta 已推出 **Meta AI** 应用支持 AI 图像生成，以及 **Vibes** 用于 AI 视频创作；此外，其社交平台和视频编辑应用 **Edits** 也集成了多种 AI 功能。Pocket 的加入，使 Meta 的 AI 创作版图从图像、视频延伸到了互动游戏。 ## 尚处实验阶段，前景待观察 Meta 官方尚未对 Pocket 的发布作出回应，这表明该应用很可能仍处于早期实验阶段。尽管拥有 Gizmo 的成熟技术和口碑基础，Pocket 能否在竞争激烈的 AI 应用市场中脱颖而出，还需看 Meta 后续的资源投入和社区运营策略。对于热爱尝鲜的玩家和创作者而言，这无疑是一个值得关注的新玩具。

TechCrunch19天前原文

1131

Anthropic 正与三星洽谈定制 AI 芯片，追赶 OpenAI 硬件自研步伐

新上线

继 OpenAI 宣布与博通合作开发定制 AI 芯片后，Anthropic 也被曝正与三星接触，探讨联合打造自研芯片的可能性。这一动向表明，头部 AI 公司正加速摆脱对英伟达的单一依赖，通过定制硬件提升算力效率与供应链自主性。 ## 从“考虑”到“行动”：Anthropic 芯片计划浮出水面今年 4 月，路透社曾报道 Anthropic 正在酝酿自研 AI 芯片以应对芯片短缺问题。如今，这一想法似乎正走向落地。据 The Information 报道，Anthropic 已与三星就潜在芯片合作展开沟通。不过，消息人士透露，Anthropic 尚未确定该芯片的具体用途、服务器集成方式以及性能规格。当被问及此事时，Anthropic 向 TechCrunch 表示，包括谷歌、亚马逊和英伟达芯片在内的多元化硬件栈仍将是其算力战略的核心。对于与三星的潜在合作，公司未予进一步评论。 ## 定制芯片：AI 公司的“去英伟达化”新战场多家 AI 公司正寻求开发定制芯片，一方面是为了针对特定计算任务优化硬件，另一方面也是为了减少对英伟达的依赖——后者在 AI 芯片市场占据绝对领导地位。 Anthropic 的动向很可能也是对竞争对手 OpenAI 的回应。上周，OpenAI 宣布与博通合作推出自研推理处理器 **Jalapeño**，声称该芯片在每瓦性能上优于竞品。此外，亚马逊和谷歌也早已在云服务中提供自研 TPU。 ## 三星的 AI 芯片布局：与英伟达、谷歌多线合作三星已深度嵌入 AI 产业链，不仅是英伟达的重要合作伙伴——为其生产训练和运行 AI 模型所需的芯片，同时也在韩国共建 AI 芯片工厂。此外，三星还与谷歌讨论过芯片制造合作。这种多重角色使三星成为 Anthropic 自研芯片计划的理想潜在伙伴。 ## 行业趋势：硬件自研成为 AI 竞争新高地从 OpenAI 到 Anthropic，再到科技巨头亚马逊和谷歌，AI 公司正纷纷投入定制芯片研发。这一趋势不仅关乎性能提升，更涉及供应链安全与成本控制。随着 AI 模型规模持续膨胀，通用芯片的能效瓶颈日益凸显，定制化硬件成为突破算力天花板的关键路径。对于 Anthropic 而言，与三星的合作若能落地，将有助于其在推理效率和模型部署上获得差异化优势，同时在与 OpenAI 的竞争中增添重要筹码。不过，芯片从设计到量产周期漫长，短期内 Anthropic 仍需依赖现有硬件生态。

TechCrunch19天前原文

1132

Cursor 被 SpaceX 收购后，还能继续用 OpenAI 和 Anthropic 的模型吗？

新上线

当 SpaceX 上月宣布以 600 亿美元收购 AI 编程初创公司 Cursor 时，投资者普遍认为这是一笔双赢交易：Cursor 能获得大型 AI 实验室的算力资源以训练自有模型，而 SpaceX 和埃隆·马斯克则拿下了市场上最受欢迎的 AI 开发者工具之一。然而，一个关键问题浮出水面：**收购完成后，Cursor 能否保持开放平台属性，继续提供来自 OpenAI、Anthropic 等竞争对手的第三方模型？** 第三方模型一直是 Cursor 业务的核心组成部分。尽管 Cursor 近年来已开始训练自有模型，但它始终允许用户从 Anthropic、OpenAI 等实验室的多种模型中选择，以驱动其代码助手。这一策略让 Cursor 能随时为用户提供最佳或最便宜的模型，同时也让 Anthropic 和 OpenAI 受益——两者均将 Cursor 列为最大客户之一，并在营销材料中重点展示该初创公司。据接近 Cursor 的消息人士透露，在 SpaceX 收购完成后（预计今年晚些时候），Cursor 希望继续以平台模式运营，在提供自有模型的同时，也接入 Anthropic、OpenAI 及其他实验室的模型。但这一愿景能否实现，已成为悬在 AI 行业上空的重大疑问。小型 AI 编程竞争对手 Factory 的联合创始人兼 CTO Eno Reyes 认为，SpaceX 的竞争对手不一定会直接切断与 Cursor 的合作。“我不确定这个决定是否非黑即白，”Reyes 表示，“对我们来说，情况其实非常不明确。” 这并非 Cursor 与 OpenAI、Anthropic 的关系首次面临考验。过去，Cursor 通过分发这些实验室的模型来补充其编程平台，但如今它已逐渐与它们形成直接竞争——OpenAI 的 Codex 和 Anthropic 的 Claude Code 已成为各自业务的重要支柱。收购后，这种竞争关系将更加复杂：Cursor 不仅是一个客户，更成为了竞争对手体系的一部分。对于 OpenAI 和 Anthropic 而言，继续向 SpaceX 旗下的 Cursor 提供模型，无异于资助一个潜在的劲敌。但若切断合作，它们将失去一个重要的分销渠道和收入来源。Cursor 能否在收购后维持“模型中立”地位，将深刻影响 AI 编程工具的市场格局，甚至可能重新定义大型 AI 实验室与下游应用之间的关系。

WIRED AI19天前原文

1133

Amazon Bedrock 如何拦截 AI 生成的钓鱼邮件

新上线

网络钓鱼依然是发动网络攻击最常用的手段之一，而 AI 生成的钓鱼邮件正给安全团队带来全新挑战。攻击者利用生成式 AI 和开源情报（OSINT）能够批量生成语法完美、语境恰当、高度个性化的邮件，传统基于语法错误、通用称呼等特征的过滤机制已难以招架。Amazon Bedrock 作为全托管服务，将领先的基础模型与安全、隐私和负责任的 AI 能力结合，为检测这类新型钓鱼攻击提供了新思路。本文深入分析 AI 钓鱼的演变、技术原理，并探讨 Amazon Bedrock 如何通过模型能力识别异常，帮助安全团队应对这一不断升级的威胁。

AWS ML19天前原文

1134

Amazon SageMaker AI 多轮强化学习最佳实践

新上线

在 Amazon SageMaker AI 中训练多轮智能体来处理工单或内容审核，意味着处理一系列相互依赖的步骤，而非单一响应。这些智能体读取指令、调用工具、读取结果、决定下一步行动，并在做出最终回答前从错误中恢复。这种灵活性也使得智能体强化学习（RL）充满挑战：行动方式越多，意味着在不完成任务的情况下满足奖励的方式也越多，而且训练环境可能会悄然污染训练信号。本文分享了可靠的多轮 RL 训练最佳实践，涵盖如何构建可信的训练环境、设置外部评估、设计与最终任务对齐的奖励、管理智能体运行多轮后的变化，以及监控指示迭代时机的指标。文中的示例来自 SOP-Bench 数据集（Amazon Science 基准测试），该基准评估智能体在 12 个业务领域基于复杂标准操作程序（SOP）完成任务的能力。 ## 构建可信的训练环境训练环境是 RL 的基石。一个不可靠的环境会导致智能体学到错误的行为。建议对环境的每次交互进行日志记录和验证，确保工具调用的输入输出格式正确，并引入外部评估器来检查中间步骤的合理性。例如，在工单处理场景中，可以验证智能体是否真的查询了正确的数据库，而不是通过捷径获得奖励。 ## 设计奖励函数奖励函数必须与最终任务目标紧密对齐。在多轮场景中，稀疏奖励（仅在任务完成时给予奖励）可能导致学习缓慢，而过于密集的奖励（每一步都给予奖励）可能引发奖励黑客行为。建议采用 **混合奖励**：对关键中间步骤（如成功调用工具）给予少量奖励，并在任务完成时给予大额奖励。同时，设置惩罚机制来抑制错误行为（如重复调用同一工具）。 ## 管理多轮变化智能体运行多轮时，其行为策略可能发生偏移。需要监控策略的稳定性，并定期进行外部评估。使用 **SageMaker AI MTRL** 提供的异步 rollout 和轨迹收集功能，可以在不显著偏离当前策略的情况下并行生成和梯度更新，从而加速训练。此外，原生算法库（如 PPO、CISPO、IS 损失函数）以及多种基于组的优势估计器（GRPO、RLOO 等）为不同场景提供了灵活选择。 ## 监控关键指标应重点关注以下指标： - **成功率**：任务完成的比例。 - **平均回合长度**：智能体完成任务所需的步骤数。 - **奖励趋势**：训练过程中奖励值的变化，判断是否收敛。 - **策略熵**：衡量策略的探索程度，避免过早陷入局部最优。通过这些最佳实践，你可以更高效地在 SageMaker AI 中训练出可靠的多轮 RL 智能体。

AWS ML19天前原文

1135

每次拿到新 iPhone，我必改的 16 个 iMessage 设置——以及为什么

新上线

每次拿到新 iPhone，我第一件事就是调整 iMessage 设置，让聊天体验更干净、更安全、更顺手。以下是 16 个我必改的设置，涵盖备份、存储、隐私、通知和界面美化，帮你把 Messages 打造成真正好用的沟通工具。 ## 备份与存储：别让聊天记录丢了 1. **开启 iCloud 信息同步**：进入「设置 > 你的名字 > iCloud > 显示全部 > iCloud 中的信息」，打开「在这台 iPhone 上使用」。这样聊天记录会在所有 Apple 设备间同步，换机也毫无压力。 2. **调整信息保留时长**：在「设置 > App > 信息 > 保留信息」中，可选 30 天、1 年或永久。我选永久，然后手动删除不再需要的对话，避免列表杂乱。 3. **启用高级数据保护**：这是 Apple 提供的端到端加密功能，能保护 iCloud 中的信息备份。开启后，只有你信任的设备能读取聊天内容，大幅提升隐私安全性。 ## 通知与提醒：减少无谓干扰 4. **关闭“发送已读回执”**：在「设置 > 信息 > 发送已读回执」中关闭，避免被对方知道你是否已读。 5. **管理通知分组**：在「设置 > 通知 > 信息」中，将通知分组设为「按 App」，避免几十条通知刷屏。 6. **开启“过滤未知发件人”**：在「设置 > 信息 > 过滤未知发件人」中开启，陌生人的信息会被归入单独列表，不再打扰你。 ## 界面与功能：让聊天更顺手 7. **启用 RCS 信息**：在「设置 > App > 信息 > RCS 信息」中打开，与 Android 用户聊天时能获得更好的媒体分享和已读回执体验。 8. **开启“提及”功能**：在群聊中，输入 @ 后跟联系人名字，对方会收到特别提醒。在「设置 > 信息 > 提及」中开启。 9. **自定义聊天背景**：在对话中点击「...」>「背景」，选择预设或自定义图片，让每个对话更有辨识度。 10. **关闭“低质量图像模式”**：在「设置 > 信息 > 低质量图像模式」中关闭，发送的照片和视频将保持原始画质。 11. **管理 iMessage 签名**：在「设置 > 信息 > 发送与接收」中，可以调整用于 iMessage 的邮箱和电话，避免用错账户。 12. **启用“保持对话”**：在「设置 > 信息 > 保持对话」中开启，即使退出对话，也会在后台保留最近 30 天的聊天记录。 ## 隐私与安全：锁住敏感信息 13. **关闭“显示预览”**：在「设置 > 通知 > 显示预览」中选择「从不」或「解锁时」，防止锁屏状态下他人看到消息内容。 14. **启用“自动删除验证码”**：在「设置 > 密码 > 密码选项」中开启「自动清理」，信息 App 中收到的验证码会在使用后自动删除。 15. **管理“共享焦点状态”**：在「设置 > 专注模式 > 共享专注状态」中关闭，避免对方看到你开启了勿扰模式。 16. **定期清理附件**：在「设置 > 通用 > iPhone 存储空间 > 信息」中，可以查看并删除大附件，释放存储空间。 ## 小结这些设置看似琐碎，但组合起来能极大提升信息体验：更安全、更干净、更个性化。每次拿到新 iPhone，花几分钟调整，就能让 Messages 从“能用”变成“好用”。

ZDNet AI19天前原文

1136

LG 买大送小：购法式对开门冰箱免费获赠单门冰箱

新上线

LG 正在推出一项限时促销活动：购买指定型号的法式对开门冰箱，即可免费获赠一台单门冰箱，非常适合车库或地下室使用。 **活动详情** - **主产品**：LG Counter-Depth Max French Door Refrigerator（法式对开门冰箱），原价 $3,900，促销价 **$2,300**，节省 **$1,600**。 - **赠品**：免费获赠一台单门冰箱（具体型号未明确，适合额外储存需求）。 - **适用场景**：正值美国独立日（7月4日）和世界杯淘汰赛期间，适合举办派对或大型聚会时增加冷藏空间。 **购买建议** 该促销由 ZDNET 编辑推荐，基于价格比较和用户评价。如果你正在升级厨房冰箱，并需要额外的冷藏存储空间，这无疑是一个高性价比选择。不过，赠品冰箱的容量和能效等级需在购买前向 LG 官方确认。 **注意事项** - 促销时间：截至 2026 年 7 月 2 日（文章发布日期）。 - 购买渠道：LG 官网。 - 赠品可能有限量或区域限制，建议尽快下单。

ZDNet AI19天前原文

1137

AI 驱动卓越运营：精益六西格玛与 BPM 的进化

精选

精益六西格玛和业务流程管理（BPM）曾为企业带来秩序与效率，如今它们正与 AI 深度融合。据预测，AI 驱动的流程优化市场将在十年内突破 1130 亿美元，88% 的企业领袖计划增加相关投资。但成功的关键在于：拥有成熟流程体系的企业，才能让 AI 真正落地。本文探讨传统方法论如何借助 AI 加速进化，以及企业如何避免“空中楼阁”式的技术投入。

MIT Tech20天前原文

1138

OpenAI提议将5%股权捐赠给美国主权财富基金

新上线

据《金融时报》报道，OpenAI CEO Sam Altman提议将公司5%的股权捐赠给一个美国主权财富基金，并建议其他AI公司也捐出类似份额，旨在改善与政府关系并缓解政治反弹。该讨论仍处于初步阶段，任何正式行动可能需要国会批准，这使事情变得复杂。Altman此前曾公开讨论过公共AI基金的想法，OpenAI在4月发布的政策文件《智能时代的产业政策》中提议设立公共财富基金，直接投资AI实验室和公司，并将收益分配给公民。参议员Bernie Sanders在6月提出了更激进的版本，要求对AI公司股票一次性征收50%税，存入公共财富基金。该法案尚未进入委员会审议。

TechCrunch20天前原文

1139

特朗普促成OpenAI向美国提供5%股权，远低于桑德斯目标

新上线

据知情人士透露，OpenAI CEO Sam Altman正与特朗普政府进行积极谈判，计划向美国提供公司5%的股权。这一比例远低于参议员伯尼·桑德斯此前提出的更高目标。 ## 谈判背景与股权细节此次谈判发生在AI行业面临日益严格的监管审查之际。OpenAI作为AI领域的领军企业，其股权分配方案备受关注。特朗普政府提出的5%股权方案，相较于桑德斯此前倡导的更高比例，显得更为温和。消息人士称，双方仍在就具体条款进行磋商，最终协议可能包括对国家安全和AI伦理的承诺。 ## 行业影响与政策走向这一举措可能为美国政府参与AI公司治理树立先例。分析人士认为，政府持股不仅能为OpenAI提供政策支持，还能确保AI技术发展符合国家利益。然而，较低的持股比例也引发了对政府控制力不足的担忧。未来，其他AI公司可能面临类似的股权谈判压力。 ## 后续关注点市场将密切关注谈判进展，尤其是股权分配是否会影响OpenAI的独立运营。同时，桑德斯等议员可能会继续推动更严格的监管法案。AI行业的政策环境正在快速演变，企业需在创新与合规之间寻求平衡。

Ars Technica20天前原文

1140

退役电动汽车电池在电网中迎来“第二春”

新上线

随着电动汽车的普及，如何处理退役电池成为行业关注的焦点。近日，回收公司 **Redwood Materials** 公布了一项创新计划：将约 **100 块** 来自通用汽车的旧电池组合起来，为密歇根州的一家工厂提供 **1.5 兆瓦** 的电力。这一举措不仅延长了电池的使用寿命，也为电网级储能提供了低成本方案。 ## 退役电池的潜力电动汽车电池在容量衰减至 **70-80%** 后，通常被认为不再适合车辆使用。然而，这些电池仍具备相当可观的储能能力。通过重新组合和优化管理，它们可以在电网调峰、备用电源等场景中发挥价值。 ## 项目细节 Redwood Materials 的方案是将不同老化程度的电池模块集成到一个系统中，利用智能控制算法平衡充放电，确保整体性能稳定。该项目预计于 **2024 年** 正式投运，届时将成为汽车制造商利用退役电池进行储能的重要示范。 ## 行业意义类似项目正在全球涌现。例如，**日产** 与 **伊顿** 合作在英国建设了储能设施，**宝马** 也在德国启动了相关项目。这些案例表明，退役电池的梯次利用不仅环保，还能创造经济价值，降低储能系统的初始成本。 ## 挑战与前景尽管前景广阔，但退役电池的 **一致性** 和 **安全性** 仍是主要挑战。不同电池的健康状态差异大，需要先进的电池管理系统（BMS）来监控和调节。此外，随着电池回收技术（如 **Redwood Materials** 自身的主业）的成熟，直接回收材料与梯次利用之间的成本权衡也将影响行业走向。总体而言，退役电池在电网中的二次利用正从概念走向现实，有望成为未来能源体系的重要一环。

IEEE AI20天前原文