AI 资讯

每日聚合最新人工智能动态

741

索尼 WH-1000XM6 对比森海塞尔 Momentum 5：我用了数月，这是最终推荐

新上线

索尼 WH-1000XM6 和森海塞尔 Momentum 5 都是旗舰级头戴式降噪耳机，在音质、续航和设计上各有千秋。经过数月深度使用，我发现选择哪款主要取决于你的使用场景。如果你追求最佳的主动降噪和智能功能，索尼是更稳妥的选择；而如果你对音质的纯粹性和声场表现有更高要求，森海塞尔会带来更沉浸的听觉体验。 ## 音质对比：细节与氛围的博弈森海塞尔 Momentum 5 在声音调校上延续了品牌一贯的均衡风格，中高频通透自然，人声还原度极高，尤其适合古典、爵士和原声乐器为主的曲目。低频量感适中，但下潜和弹性出色，不会掩盖其他频段。相比之下，索尼 WH-1000XM6 的低频更饱满有力，适合流行、电子和摇滚等节奏感强的音乐，但部分用户可能会觉得低频稍显过量。 ## 降噪与智能功能：索尼的杀手锏索尼在降噪领域的技术积累使其 WH-1000XM6 在主动降噪性能上依然领先。自适应声音控制功能可以根据环境自动调整降噪强度，而 Speak-to-Chat 功能在用户说话时自动暂停音乐并切换至环境音模式，非常实用。森海塞尔的降噪能力同样出色，但算法更保守，对高频噪音的抑制稍弱，不过其透明模式自然度更佳。 ## 佩戴舒适度与续航两款耳机在长时间佩戴舒适度上都表现优秀。索尼的耳罩更柔软，压力分布更均匀，适合长时间使用。森海塞尔则采用更轻量化设计，头梁包裹性更好。续航方面，索尼官方标称 40 小时（降噪开），森海塞尔为 60 小时，实际使用中两者差异不大。 ## 选购建议 - **优先降噪与智能体验**：选索尼 WH-1000XM6，它的降噪深度和自适应功能在通勤、办公等嘈杂环境中优势明显。 - **优先音质与声场**：选森海塞尔 Momentum 5，它的声音细节和分离度更胜一筹，适合安静环境下欣赏音乐。 - **预算与生态**：两者价格相近，但索尼与手机 App 的联动更丰富，森海塞尔则支持蓝牙 5.4 和更高规格的编解码器。最终选择没有绝对好坏，只有是否适合你的使用习惯。建议线下试听后再做决定。

ZDNet AI19天前原文

742

美国如何用工程思维塑造主权：自力更生是一场持久战

新上线

在全球化与技术竞争交织的当下，**主权**与**自力更生**再次成为美国政策与产业界的核心议题。近日，IEEE Spectrum发表了一篇来自系统工程师、**《棘手问题：如何工程化一个更美好的世界》**作者**Guru Madhavan**的观点文章，探讨了美国历史上如何通过工程手段构建主权，并指出这种自力更生并非一蹴而就，而是一项持续的任务。 ## 工程与主权的历史交织文章开篇即点明：**主权并非天然存在，而是被“工程化”出来的**。从19世纪的跨洲铁路到20世纪的州际公路系统，从曼哈顿计划到阿波罗登月，美国在关键基础设施与科技领域的自主能力，往往是通过大型工程项目的推动而逐步建立。这些项目不仅解决了物理连接与国防安全问题，更在制度、人才与产业链层面塑造了国家的独立韧性。Madhavan强调，工程思维——即系统性地定义问题、整合资源、迭代方案——是国家主权建设的重要工具。 ## 自力更生的现实挑战然而，历史上的成功并不意味着今日可以高枕无忧。文章指出，**当代的供应链脆弱性、技术依赖与人才短缺**正在考验美国的主权基础。半导体制造、稀土材料、人工智能算法等关键领域，美国对海外来源的依赖程度远超过去。Madhavan认为，真正的自力更生不是追求100%的自给自足，而是**在关键节点上具备替代能力与快速恢复能力**。这需要政府、产业与学术界的持续协作，以及长期的投资耐心。 ## 现状与应对当前，美国通过《芯片与科学法案》等政策试图重振本土制造业，但Madhavan提醒，**硬件之外，软件与系统层面的主权同样重要**。例如，在AI领域，训练大模型所需的算力与数据往往依赖跨国云服务，这构成了新的依赖关系。他建议，应当借鉴历史上**国防高级研究计划局（DARPA）** 的模式，设立跨领域的工程创新机构，聚焦“卡脖子”技术的突破，并建立从基础研究到产业化的快速转化通道。 ## 小结：主权是动态工程 Madhavan总结道，**主权不是一次性的成就，而是一个需要不断维护与更新的动态系统**。就像软件需要持续打补丁，国家的主权工程也需要根据技术环境的变化而调整。对于AI从业者而言，这意味着不仅要关注算法与模型的进步，更要思考如何在开源生态、数据主权与算力基础设施上构建自主可控的闭环。未来的竞争，将是“工程化主权”能力的竞争。

IEEE AI19天前原文

743

你家的插座严重被低估了：7款即插即用神器，轻松提升居家体验

新上线

家里的墙壁插座，除了给手机充电，还能做什么？其实，只需插入一个小小的设备，就能让普通插座变身智能家居的起点、安全防护的前哨，甚至收纳整理的好帮手。本文精选7款即插即用的小工具，它们价格亲民，却能显著提升日常生活的便利性与舒适度。 ## 1. 空间魔术师：Merkury Slim Wall Adapter **售价：$10** 传统插头又大又笨，经常挡住相邻插座。Merkury Slim Wall Adapter 采用超薄设计，插入后几乎与墙面齐平，不仅释放了空间，还能让插座面板更整洁。对于床头柜、书桌等插座紧张的区域，这个小配件堪称“空间救星”。 ## 2. 智能管家：Kasa Smart Plug Ultra Mini 15A 4-Pack **售价：$38（原价$45，节省$7）** 想体验智能家居，智能插座是最低门槛。Kasa 这款迷你智能插座支持15A大电流，可通过手机App远程控制开关、设置定时或倒计时。配合语音助手，还能实现“一句话关灯”的便捷体验。4件套覆盖客厅、卧室、厨房，轻松打造自动化场景。 ## 3. 快充专家：Anker 33W 2-Port Wall Charger **售价：$19** Anker 这款充电器提供33W总功率，双口（USB-C + USB-A）设计，可同时为手机和耳机快充。采用GaN技术，体积比传统充电器更小巧，旅行携带也方便。对于多设备用户，它让插座不再“打架”。 ## 4. 安全卫士：Ting Fire Sensor **售价：$99** 电气火灾隐患往往无声无息。Ting Fire Sensor 插入插座后，能持续监测电路中的电弧故障（可能由老化线路或破损电线引起），一旦检测到异常，立即通过手机App发出警报。它由UL认证，并附赠保险服务，为家庭安全增添一道智能防线。 ## 5. 桌面整理官：Anker Flat Surge Protector **售价：$28** 传统插线板线缆杂乱，Anker 这款扁平设计防浪涌插座可紧贴墙面或桌面，自带USB-C/A快充口，并配有可旋转插头，适应狭小空间。防浪涌功能保护贵重设备，同时保持桌面整洁。 ## 6. 宠物好帮手：Whisko LitterGuard Pro **售价：$40（原价$50，节省$10）** 养猫家庭常为猫砂盆异味烦恼。Whisko LitterGuard Pro 是一款插入式空气净化器，专为猫砂盆设计，采用活性炭过滤和离子技术，持续净化周围空气。它体积小巧，直接插在插座上，无需占用额外空间。 ## 小结从几美元的适配器到百元级别的安全传感器，这7款产品覆盖了空间优化、智能控制、快充、安全、整洁和宠物护理等多个生活场景。它们无需复杂安装，即插即用，却能让家中每个插座都发挥更大价值。如果你也想以低成本提升居家体验，不妨从其中一款开始。 *注：价格和优惠信息来自原文，实际购买时请以电商平台为准。*

ZDNet AI19天前原文

744

免费让你的 Linux 看起来像 macOS：Zorin OS 简单调整指南

新上线

如果你喜欢 macOS 的界面，但又想迁移到 Linux，Zorin OS 提供了一个免费的解决方案。本文介绍如何通过几个简单的调整，让 Zorin OS 看起来几乎和 macOS 一模一样，无需购买 Pro 版本。 ### 为什么选择 Zorin OS？ Zorin OS 是一款基于 Ubuntu 的 Linux 发行版，以其对 Windows 和 macOS 用户友好的设计而闻名。它的默认界面类似于 Windows，但内置了强大的自定义功能，可以让用户轻松切换到 macOS 风格。 ### 免费实现 macOS 外观的步骤 1. **安装 Zorin OS**：首先，你需要从官方网站下载并安装 Zorin OS 的免费版本（Core 或 Lite）。 2. **调整主题和图标**：Zorin OS 提供了“Appearance”设置，你可以在这里选择“MacOS”主题和图标包。如果默认选项不够，可以安装第三方主题。 3. **修改 Dock 和面板**：将底部的任务栏移动到屏幕底部或侧面，并调整其样式以模仿 macOS 的 Dock。Zorin OS 的“Extensions”工具可以帮助你实现这一点。 4. **添加全局菜单**：macOS 的全局菜单栏是一个标志性特征。通过安装“Global Menu”扩展，你可以让应用菜单显示在顶部面板中。 5. **调整窗口按钮**：将窗口控制按钮（关闭、最小化、最大化）从右侧移到左侧，并修改图标样式。 ### 注意事项 - 免费版本可能需要手动安装一些扩展和主题，而 Pro 版本（付费）提供了更简便的一键切换功能。 - 自定义过程中，建议备份系统设置，以免出错。 ### 总结通过以上调整，你可以在 Zorin OS 上获得接近 macOS 的体验，而且完全免费。这对于那些喜欢 macOS 美学但希望享受 Linux 自由和安全的用户来说，是一个绝佳的选择。

ZDNet AI19天前原文

745

这款人形机器人，成了办公室里的“恐怖实习生”

新上线

人形机器人能跑、能跳、偶尔还能踢人，但要真正像人一样工作，它们还得学会开门、爬楼梯、搬箱子这些琐事。由前英伟达（Nvidia）机器人研究员创立的瑞士初创公司 **Flexion Robotics** 声称找到了解决方案。 Flexion 的核心思路是：先在仿真环境中训练机器人掌握单个技能，再由一个主 AI 算法决定如何组合使用这些技能。大多数演示视频中，人形机器人经过专门训练（如叠衬衫、上货架），背后通常有远程操控（teleoperation）支持，但这种方法在陌生环境中并不可靠。Flexion 自称其系统不同且更高效，因为它依赖仿真训练和有限的人工指令。在一段展示视频中，一台改装的 Unitree 人形机器人接收指令后自主运行：“一份零食包裹已送达 Flexion。请使用楼梯取回，再乘电梯上来。然后拆包，将物品放入零食区空抽屉。” Flexion 的方法整合了多种 AI 系统：主 AI 模型通过消化人类执行不同任务的视频来规划工作；软件将仿真中学到的技能与视频中的动作匹配，并在现实世界中执行。例如，要到达办公室邮件室，模型可能需要学会开门和使用电梯。系统还控制机器人的电机，使其能够行走、移动四肢并保持平衡。据 Flexion 联合创始人兼 CEO、前英伟达机器人研究科学家 **Nikita Rudin** 介绍，软件的“秘密武器”是大量使用强化学习（reinforcement learning），通过试错让计算机掌握任务。从主 AI 模型到仿真再到电机控制，每一层都采用了这种技术。科技领袖如埃隆·马斯克和 Jensen Huang 认为，人形机器人将对经济产生巨大影响，因为它们可以替代人类从事重复性劳动。Flexion 的“实习生”虽仍显笨拙，但已展现出在真实办公环境中执行多步骤任务的潜力。

WIRED AI19天前原文

746

不可观测状态与受限决策时点下的马尔可夫赌博机学习

新上线

## 研究背景与问题定义在在线学习领域，**马尔可夫赌博机（Markovian bandits）** 是一类重要的模型，其特点是每个臂（arm）的状态按马尔可夫链演化。然而，现有工作通常假设状态可观测且决策时点无约束。本文《Learning in Markovian bandits with non-observable states and constrained decision epochs》首次系统研究了**状态不可观测**且**决策时点受限**的场景下的遗憾最小化问题。作者聚焦于**纯遗憾基准（pure regret benchmark）**，即比较学习算法的性能与最优**纯策略**（pure policy）——该策略类似经典随机赌博机的最优策略，从头到尾选择同一个最优臂，绝不切换。这一设定简化了分析，但已能揭示核心挑战。 ## 核心贡献：自退化马尔可夫赌博机与遗憾下界论文提出了**自退化马尔可夫赌博机（self-degrading Markovian bandits）** 这一新概念，它是经典休憩型（rested）马尔可夫赌博机的推广。在该模型中，纯策略总是渐近最优的，这为后续理论分析提供了基础。一个重要发现是：**若算法极少切换臂，则其遗憾必然超对数增长**，即 $\omega(\log(T))$（$T$ 为学习时域）。这意味着在状态不可观测且决策受限时，对数遗憾（如经典 UCB 算法）在无先验知识的情况下是不可达的。 ## 算法设计与遗憾上界面对这一下界，作者设计了 **UCB-NOM**（Upper Confidence Bound for Non-Observable Markovian bandits），一种基于乐观原则的算法。其遗憾接近对数形式，具体表现为： - **无先验知识时**：遗憾为 $O(\log(T) \cdot \text{某个因子})$，略高于对数但未达超对数下界。 - **给定先验知识时**：若已知臂的偏差函数（bias function）的界，则 UCB-NOM 可实现 **$O(\log(T))$ 的遗憾**，且最坏情况遗憾为 $O(\sqrt{T \log(T)})$。值得注意的是，**遗憾界不依赖于马尔可夫链的状态数**，这大大增强了算法的实用性。 ## 行业意义与展望该工作揭示了状态不可观测性在自退化马尔可夫赌博机中仅是“轻微不便”，而非根本性障碍。对于实际应用——如推荐系统、临床试验、通信网络中的资源分配——这意味着即使无法观测用户状态或系统内部状态，仍可通过精心设计的算法获得接近最优的性能。未来方向包括：扩展到更一般的纯策略不一定最优的模型，以及考虑有限切换次数下的遗憾分析。 > **一句话总结**：本文证明了在不可观测状态和受限决策时点的马尔可夫赌博机中，超对数遗憾下界不可避免，但 UCB-NOM 算法可达到近乎对数的遗憾，且不依赖状态数。

HuggingFace19天前原文

747

Prism Transformer：渐进式多头注意力机制，突破Transformer结构瓶颈

新上线

Transformer架构中的多头注意力机制通常在每个层均分隐藏维度，导致所有头共享相同的子空间维度（dh = dmodel/h）。这种均匀分配被视为一种结构性瓶颈：早期层的头因维度受限，难以捕捉复杂的高维上下文模式。为此，研究者提出了 **Prism Transformer**，一种新型架构，用渐进式头调度替代静态均匀配置。通过逐层单调增加头的数量，Prism Transformer 自然形成了从局部到全局的表征层次：早期层使用更少但更宽的“头”来捕捉复杂的局部组合模式，而深层则部署大量窄头，将这些模式分解为专门的语言特征。关键在于，这种结构变化是参数中性和计算中性的，不引入任何训练或推理开销，保持了与标准Transformer相同的权重矩阵和FLOP预算。在三种模型规模（124M、354M、757M参数）上，Prism Transformer 持续优于均匀基线，验证损失降低，并在多个零样本下游基准（包括PIQA、HellaSwag、ARC-Easy和WinoGrande）上取得增益。实验表明，非均匀子空间分配能够释放标准Transformer预算内的潜在容量，使模型能力得到更有效的利用。 ## 核心创新点 - **渐进式头调度**：头数随层数增加，早期层头少维度高，深层多头维度低，形成层次化表征。 - **零额外开销**：不增加参数或计算量，仅改变注意力头的分配方式。 - **一致性能提升**：在多种规模下验证，证明非均匀分配的有效性。 ## 行业意义这一工作挑战了Transformer中“均匀分配”的默认假设，为改进注意力机制提供了新思路。它不依赖额外数据或计算资源，即可提升模型性能，对资源受限场景尤为实用。未来，Prism Transformer 有望与稀疏注意力、混合专家模型等技术结合，进一步推动高效Transformer的发展。

HuggingFace19天前原文

748

几何感知傅里叶神经算子：破解周期域上三次非线性薛定谔方程的共振难题

新上线

近日，arXiv 上发布了一项新研究（arXiv:2606.27459），提出了一种**几何条件化的傅里叶神经算子**，用于求解二维平坦环面上的三次非线性薛定谔方程。该工作的核心创新在于：通过将环面的**纵横比参数**显式纳入算子学习框架，使得模型能够捕捉不同几何形状下截然不同的高频级联行为。 **问题背景** 在二维环面上，NLS 方程的动力学强烈依赖于环面的纵横比。当纵横比为有理数时，傅里叶共振结构丰富，能量可以高效地向高频模式传递，导致 Sobolev 范数快速增长；而当纵横比为无理数时，共振受限，能量传递受到抑制，解的行为更为温和。传统数值方法需要精细分辨这种几何效应，计算成本高昂。 **方法亮点** 研究者设计了一个**几何条件化 FNO**，其输入不仅包含解的实部和虚部，还额外拼接了纵横比参数 $\omega^2$。模型通过端到端训练学习一步时间推进算子，并在随机相位初始条件生成的未见轨迹上进行评估。训练数据采用傅里叶伪谱方法生成，保证了高频分辨率的准确性。 **实验结果** 数值实验表明，该学习算子成功复现了两种几何下的关键动力学特征： - **有理环面**：Sobolev $H^2$ 范数显著增长，反映强烈的能量级联； - **无理环面**：$H^2$ 范数增长受限，行为更接近平滑解。这一结果与理论分析（如 Hrabski 等人 2021 年的工作）高度一致。 **消融研究** 作者还进行了系统的消融实验，考察了保留傅里叶模态数、激活函数、傅里叶层深度以及显式几何条件的影响。关键发现包括： - **引入 $\omega^2$ 参数**显著提升了长期预测精度，尤其对有理几何效果更为明显； - 较深的傅里叶层有助于捕捉复杂的非线性相互作用，但存在过拟合风险； - 激活函数的选择对收敛速度和最终精度有一定影响，GELU 表现优于 ReLU。 **意义与展望** 这项工作展示了**几何感知的神经算子**在非线性色散偏微分方程中的潜力。它不仅为 NLS 方程的数值求解提供了新工具，也为更广泛的**谱传输现象**（如等离子体物理、光学中的湍流）的机器学习建模开辟了道路。未来可将该方法推广至三维情形或更复杂的非线性项，并探索与物理信息网络的结合。

HuggingFace19天前原文

749

多重中介者之咒：激活修补中隐藏的交互效应

新上线

## 激活修补的盲点：自然间接效应并非“纯粹” 在机械可解释性领域，**激活修补（Activation Patching）** 是归因模型行为至具体组件的核心工具。其通过估计**自然间接效应（NIE）** 来衡量单个组件对模型输出的因果贡献。然而，一篇来自 arXiv 的新论文指出：NIE 并非仅仅捕捉通过该组件的因果效应——它同时包含了**交互效应（INT）**，即该组件的因果效应本身如何依赖于模型中其他组件的状态。 ## 交互效应从何而来？论文重新从因果中介分析推导了激活修补的估计量，发现 NIE 实质上混合了“纯间接效应”和“交互效应”。INT 衡量的是：当其他组件处于“干净”或“修补”状态时，同一组件的因果影响可能截然不同。这种依赖关系意味着，单个组件的“重要性”并非固有属性，而是随上下文动态变化。 ## 为何无法简单消除？面对 INT，直觉上的补救措施——如调整估计器或改变分析单元——均存在可预见的失效模式。作者在 **GPT-2 的 IOI（间接对象识别）电路** 上进行了实证： - 某些组件的因果重要性在状态依赖下要么完全不可见（被低估），要么被人为放大（虚假归因）。 - **INT 的方差** 解释了此前文献中报告的**忠实度分数不稳定性**——当交互效应显著时，同一组件在不同 prompt 下的归因结果可能剧烈波动。 ## 理论根源与可预测性论文从数学上证明： - INT 的大小与**干净激活和修补激活之间的距离**成正比。即，当修补引入的扰动越大，交互效应越强。 - 当模型在局部满足**仿射（affine）性质**（如线性层）时，INT 可忽略；但在非线性激活函数（如 ReLU、LayerNorm）作用下，INT 必然存在。 - INT 可**组合分解**为两两交互、三阶交互乃至更高阶的组交互。这意味着，即使每个组件的单独效应看似稳定，组合后仍可能涌现出显著的非线性因果依赖。 ## 是噪声，还是信号？论文的核心观点是：INT 不应被视为需要消除的“噪声”，而应作为可解释性研究中的**诊断工具**。 - **个体及组级别的 INT 符号与大小** 可提示因果结论是否**依赖于特定 prompt**。如果 INT 显著，则说明该组件的作用仅在特定上下文中成立。 - 当研究采用**贪心的 NIE 排序**来寻找重要组件时，INT 的存在意味着**仅靠单次修补会遗漏那些只有通过组合搜索才能发现的机制**。例如，两个组件各自 NIE 很小，但它们的交互效应却共同驱动了模型行为。 ## 对可解释性研究的启示这项研究揭示了当前机械可解释性方法的一个根本性局限：**线性归因假设在非线性模型中可能失效**。未来的研究可能需要： 1. 将交互效应显式纳入因果归因框架，例如报告 NIE 与 INT 的分解结果。 2. 开发能够捕捉高阶交互的搜索算法，而非仅依赖逐组件修补。 3. 对 prompt 的选择更加谨慎——在单一 prompt 上得出的因果结论可能无法泛化。总之，论文提醒社区：**组件间的依赖关系不是需要规避的麻烦，而是理解模型内部协同机制的关键线索。**

HuggingFace19天前原文

750

OverFlowLight：实时预防城市交叉口拥堵并优化交通信号的新框架

新上线

## 引言城市交通拥堵中，**队列溢出**是一个严重问题——当车辆排队长度超过交叉口容量时，会阻塞上游交通，引发连锁式交通瘫痪。现有的交通信号控制（TSC）算法大多以优化通行效率为目标，在高峰时段往往无法有效应对溢出，反而加剧拥堵并带来安全隐患。 ## 方案：OverFlowLight 针对这一痛点，研究团队提出了 **OverFlowLight**，一个实时框架，旨在预防性地解决队列溢出并提升整体 TSC 性能。该框架首先利用摄像头和雷达的多模态感知，实时准确检测溢出状态。一旦检测到溢出，系统会动态生成并插入专用溢出相位到信号周期中，以清除阻塞队列。其核心是**混合控制设计**：快速基于规则的溢出干预与强化学习等控制器后端相结合，兼顾短期应急和长期效率。 ## 实际部署与效果研究团队在 **三个主要城市的 43 个交叉口** 进行了大规模真实部署。结果表明，与现有基线相比，OverFlowLight 将溢出事件减少了 **60.4%**，网络通行能力提升了 **18.2%**。同时，它大幅减少了专家调优信号方案所需的人工干预。 ## 行业意义这项工作首次提出了一个**实用、可扩展、数据驱动**的主动预防交通瘫痪框架，为构建韧性与高效的城市交通系统提供了关键组件。其模块化设计可无缝集成到现有基于强化学习的 TSC 系统中，具有良好的实际应用前景。

HuggingFace19天前原文

751

RANSAC评分新范式：无需预设内点尺度，精度与鲁棒性双双提升

新上线

计算机视觉领域广泛使用的RANSAC（随机采样一致性）算法，其核心步骤——模型评分——长期依赖一个关键参数：**内点尺度**（inlier scale）。该参数需要用户预先设定，或从被污染的数据中估计，而估计本身又容易受异常值干扰，形成“先有鸡还是先有蛋”的困境。近日，来自德国基尔大学等机构的研究者在arXiv上提交了一篇论文，提出了一种**真正摆脱内点尺度依赖**的新型RANSAC评分方法，为这一经典问题提供了优雅的数学解。 ## 核心创新：从“估计尺度”到“边缘化尺度” 传统RANSAC变体（如MSAC、MAGSAC）的评分函数，无论是简单的内点计数还是带饱和函数的逐点得分，都隐含或显式地依赖于一个阈值参数，该参数本质上是内点尺度的函数。新方法的关键思路是**反转推理顺序**：不再先估计尺度再用其评分，而是通过共轭先验（Inverse-Gamma分布）将内点尺度在闭合形式下解析地边缘化（marginalize），然后直接优化数据划分（即哪些点是内点）。这一数学处理带来了几个显著优势： - **单一公式覆盖多种先验**：从无信息的Jeffreys先验到有信息的经验贝叶斯先验，同一个评分函数可以自适应地切换，无需修改算法。 - **计算高效**：评分函数可通过排序扫描（sort-and-sweep）实现 **O(N log N)** 的复杂度，与经典方法相当。 - **参数真正“消失”**：这是第一个在评分公式中完全不出现内点尺度的RANSAC变体。 ## 实验验证：近7万图像对上的全面碾压研究团队在包含近7万对图像的基准测试上进行了评估，覆盖了多种双视图估计问题（如基础矩阵、本质矩阵、单应矩阵估计），并使用手工特征（SIFT）和深度学习特征（SuperPoint+SuperGlue）两种管线。结果令人印象深刻： 1. **阈值误标定下的鲁棒性**：当用户提供的阈值偏离真实值时，传统方法（RANSAC、MSAC、GaU、MAGSAC）的准确率急剧下降，而新方法的性能**几乎保持平坦**。 2. **极低数据量下的高效性**：在仅用**2对验证点**进行模型选择时，新方法即可达到接近最优的精度，而基线方法通常需要**约100倍**的验证数据。 3. **先验正则化的自适应收紧**：当验证数据稀缺时，评分函数会自动加强先验的正则化作用，防止过拟合。 ## 行业意义与未来展望 RANSAC自1981年提出以来，一直是计算机视觉中鲁棒估计的基石。其评分环节的尺度依赖问题虽被长期认知，但始终缺少一个既理论严谨又计算可行的解决方案。这项工作不仅从数学上填补了这一空白，更在实用层面展示了巨大的潜力： - **降低用户调参门槛**：对于非专业用户，无需再为不同场景手动调整内点阈值。 - **提升自动化管线稳定性**：在SLAM、三维重建、视觉定位等需要大量自动处理的系统中，一个对参数不敏感的评分函数能显著减少故障率。 - **适应数据稀缺场景**：在只有少量匹配对的极端条件下（如纹理匮乏或视角剧烈变化），新方法仍能可靠工作。当然，论文也指出该方法目前主要在双视图几何估计上验证，未来可以扩展到更复杂的多视图问题。此外，边缘化框架理论上也适用于其他需要阈值参数的任务，如点云配准中的RANSAC变体。总的来说，这项研究以简洁的数学形式解决了RANSAC领域一个存在四十余年的痛点，堪称“评分问题”的终极解法。对于计算机视觉从业者而言，这是一个值得密切关注并尝试集成到现有管线中的新工具。

HuggingFace19天前原文

752

统一零样本时间序列预测：Darts 基础模型

新上线

时间序列分析是机器学习的重要分支，广泛应用于金融、气象、物联网等领域。自 2020 年首次发布以来，**Darts** 已成为最受欢迎的开源 Python 时间序列库之一。然而，随着 Chronos-2、TimesFM 2.5、TiRex、PatchTST-FM 等基础模型相继涌现，零样本预测能力显著提升，却因接口碎片化、缺乏互操作性而难以集成。近日，Darts 团队在 arXiv 发布论文《Unified Zero-Shot Time Series Forecasting: A Darts Foundation》，提出统一 **FoundationModel** 类集合，将上述主流基础模型封装为标准化接口，实现“只需改个名字”即可在现有 Darts 流水线中调用。 ## 零样本预测的范式转移传统时间序列预测需要针对每个数据集训练定制模型，成本高、泛化差。基础模型通过海量数据预训练，可直接用于未见过的任务，无需微调即可取得竞争性结果。但问题在于：每个模型都有独立的 API、预处理逻辑和输出格式，用户被迫在多个代码库间切换。 ## Darts 的解决方案 Darts 的 FoundationModel 类提供了**全周期预测接口**，涵盖零样本推理、微调、不确定性估计和回测。用户只需将模型名称从 `ARIMA` 改为 `Chronos-2`，即可体验零样本能力。新流水线也能无缝集成数据处理与评估工具。论文以 Chronos-2、TimesFM 2.5、TiRex、PatchTST-FM 为例，展示了统一框架如何降低使用门槛。例如，在能源负荷预测任务中，零样本模型的表现已接近甚至超越领域专用模型，且无需重新训练。 ## 行业意义与未来这项工作的核心价值在于**生态整合**。Darts 作为已有庞大用户基础的库，其统一接口有望加速基础模型在工业界的落地。未来，更多模型（如 Lag-Llama、MOMENT）可能被纳入，推动时间序列预测向“预训练+零样本”范式全面转型。对于开发者而言，这意味着更少的代码、更高的复用性；对于业务方，则意味着更快地从数据中获取洞察。基础模型不再是孤立的“黑盒”，而是可组合、可评估的标准化组件。

HuggingFace19天前原文

753

PairSAE：破解蛋白质共折叠模型中成对表征的“黑箱”

新上线

蛋白质结构预测的基础模型（如AlphaFold、Boltz-2）在生物分子结构预测和设计方面展现了惊人能力，但模型内部特征如何驱动输出仍是一个难题。标准稀疏自编码器（SAE）在Transformer序列嵌入上表现良好，但无法直接应用于Pairformer架构——对成对表征进行朴素操作会导致特征数量二次爆炸，并掩盖跨序列和成对表征分布的概念。来自哈佛医学院、MIT等机构的研究人员提出了**PairSAE**，一种专门为Pairformer架构设计的机械可解释性方法。PairSAE通过**N模式奇异值分解（N-mode SVD）**将成对张量总结为“token级交互角色”，然后使用稀疏自编码器学习一组共享的token级特征，这些特征可以解码回序列和成对表征。在**Boltz-2**模型处理**PLINDER蛋白质-配体复合物数据集**的激活值上评估，PairSAE能够提取出与**UniProt注释**对齐的可解释特征，并预测Boltz-2的亲和力值。这表明PairSAE成功将结构生物学基础模型的潜在空间与可解释的结构概念联系起来，阐明了模型“知道什么”，同时避免了传统SAE在Pairformer架构中遇到的陷阱。该研究已被**机器学习结构生物学研讨会（MLSB 2025）**接收。 ## 核心挑战：为什么标准SAE在Pairformer上失效？蛋白质共折叠模型（如Boltz-2）使用**Pairformer架构**，其核心是处理成对表征——即描述每对残基（或原子）之间相互作用的张量。这种表征天然是二次的（N×N），并且与序列表征（1D）深度耦合。标准SAE假设特征可以独立地从单一模态嵌入中学习，但直接应用于成对表征时面临两个问题： 1. **二次爆炸**：如果对每个成对元素独立学习特征，特征数量会随序列长度平方增长，计算和存储开销巨大。 2. **概念割裂**：许多生物概念（如结合位点）同时涉及序列信息和成对交互信息，标准SAE无法联合建模这种分布式表征。 ## PairSAE：两步走，让成对表征“透明化” PairSAE的核心思想是将高维成对张量压缩为token级的低维“交互角色”，再通过SAE学习共享特征。具体分为两步： ### 1. N模式SVD降维将成对张量视为一个三维张量（token×token×特征通道），通过N模式SVD将其分解为三个因子矩阵。其中，token模式上的因子矩阵提供了每个token的“交互角色向量”，这些向量编码了该token与其他所有token的交互模式。通过保留前k个奇异值，实现了从O(N²)到O(Nk)的压缩（k远小于N）。 ### 2. 共享稀疏自编码器将token级角色向量与序列表征拼接，输入到一个稀疏自编码器中。该自编码器学习一组稀疏的、可解释的token级特征，这些特征同时解码回序列表征和成对表征。由于特征是在token级别学习的，它们自然地捕捉了跨模态的分布式概念（如“这是一个结合口袋残基”）。 ## 实验验证：特征对齐与亲和力预测研究者在**Boltz-2**模型（蛋白质-配体共折叠模型）上测试了PairSAE，使用**PLINDER数据集**（包含数千个蛋白质-配体复合物）。 - **特征可解释性**：PairSAE学习到的特征与**UniProt**数据库中的功能注释（如“活性位点”、“金属结合位点”）高度对齐。例如，某个特征在配体结合残基上激活强度显著高于其他残基。 - **亲和力预测**：将PairSAE的特征作为输入，训练一个线性模型预测Boltz-2输出的亲和力值，取得了较高的相关性（R²≈0.65），表明这些特征捕捉了与结合强度相关的关键信息。 ## 意义与展望 PairSAE为结构生物学基础模型的可解释性提供了新工具。它不仅帮助研究者理解模型预测的分子机制，还可能指导蛋白质设计：通过识别与特定功能相关的特征，可以更有针对性地优化序列。未来工作可以扩展到更复杂的多聚体系统，或与蛋白质设计方法结合。该研究也提示，针对特定架构设计可解释性方法至关重要——通用方法可能因架构差异而失效。 ## 小结 - PairSAE通过N-mode SVD和共享SAE，成功对Pairformer架构的成对表征进行可解释性分析。 - 在Boltz-2上提取的特征与生物注释对齐，并能预测亲和力。 - 方法避免了标准SAE在成对表征上的二次爆炸和概念割裂问题。

HuggingFace19天前原文

754

Prime Day虽已结束，但这5个优惠仍可捡漏（别错过）

新上线

亚马逊Prime Day刚刚落幕，但如果你以为所有好价都已消失，那可就错了。根据我的追踪，仍有几款热门产品维持着促销价格，涵盖厨房小家电、高端智能手表、会员服务等多个品类。如果你在Prime Day期间犹豫不决或错过了心仪商品，现在可能是最后的入手机会。 ### 🍦 厨房神器：Ninja Slushi 冰沙机这款**Ninja Slushi**是今年夏季的爆款单品，能将任何饮品在20分钟内转化为冰沙或雪泥。Prime Day期间它的价格一度降至**$199**（原价$299），目前部分渠道仍然维持这一价位。对于喜欢在家制作冷饮或举办派对的用户来说，这几乎是不可抗拒的优惠。 ### ⌚ 户外旗舰：Garmin Fenix 8 Pro 作为Garmin的旗舰级户外运动手表，**Fenix 8 Pro**在Prime Day期间直降**$200**，现价约**$899**。这款手表支持多频段GPS、太阳能充电和潜水级防水，专业跑者和户外探险者对其评价极高。如果你追求最精准的运动数据追踪和最耐用的设计，这可能是今年最值得入手的智能手表之一。 ### 🛒 会员福利：Walmart Plus 年度订阅 **Walmart Plus**在Prime Day期间推出了首次订阅享**50%折扣**的活动，年费仅需**$49**（原价$98）。该服务包含免费无限次配送、加油站折扣以及Scan & Go结账功能，非常适合经常在Walmart购物的家庭。目前这一折扣仍在部分推广渠道中有效。 ### 🎧 音频产品：Sony WH-1000XM5 耳机虽然Sony的头戴式降噪耳机**WH-1000XM5**在Prime Day期间最低曾达到**$298**，但现在仍有不少第三方卖家以**$328**左右的价格出售（原价$399）。考虑到这款耳机常年霸占降噪排行榜榜首，这个价格依然具备竞争力。 ### 💻 居家办公：Logitech MX Keys 键盘罗技的**MX Keys**键盘在Prime Day期间降至**$69**（原价$99），目前部分颜色版本仍可找到接近价位的库存。作为一款支持多设备无缝切换的办公键盘，它的手感和续航都备受好评，是提升工作效率的实用选择。 > 以上价格均来自美国亚马逊及主要零售商，部分优惠可能随时结束。建议在购买前确认最终价格和库存情况。如果你还在犹豫，不妨抓紧时间——毕竟这些折扣可能不会持续太久。

ZDNet AI19天前原文

755

花7美元买块ESP32-S3开发板，几分钟就能屏蔽电脑上的所有网页广告

新上线

树莓派（Raspberry Pi）的价格一路水涨船高，让不少DIY玩家和轻量级项目爱好者开始寻找更经济的替代方案。最近，一块仅售**7美元**的 **ESP32-S3** 开发板进入了视野，它不仅价格低廉，而且只需几分钟的简单编程，就能实现全网广告屏蔽功能。 ## 广告屏蔽的原理：Pi-hole 的廉价替代传统的广告屏蔽方案，例如在树莓派上部署 **Pi-hole**，是通过在局域网内架设一个DNS服务器，将广告域名解析到无效地址，从而在设备端拦截广告。然而，随着树莓派价格飙升，一块入门级板卡如今可能要花费30-50美元。ESP32-S3以其极低的成本和足够的性能，成为了Pi-hole的理想替代。 ## 如何实现？实现过程非常直接：将ESP32-S3连接到路由器，刷入一个专门定制的固件，该固件内置了广告域名黑名单。当网络中的任何设备请求访问被列入黑名单的域名时，ESP32-S3会返回一个空响应或本地地址，浏览器因此无法加载广告内容。整个过程无需修改电脑或手机的设置，所有广告拦截都在网络层面完成。 ## 性能与限制虽然ESP32-S3的处理器和内存远不及树莓派，但对于广告过滤这种轻量级任务来说绰绰有余。它能够处理常见的广告域名列表，并且支持动态更新黑名单。不过，需要注意的是，ESP32-S3的Wi-Fi性能和并发连接数有限，如果家庭网络中有大量设备同时在线，可能会对网络速度产生轻微影响。此外，该方案无法拦截HTTPS加密的广告内容，但对于大多数HTTP广告和追踪器，效果显著。 ## 成本与易用性 7美元的价格使得这块ESP32-S3开发板极具吸引力。相比树莓派，它不仅便宜，而且功耗更低（适合24小时运行）。编程过程也无需复杂的环境配置，使用Arduino IDE或MicroPython即可快速上手。对于有一定编程基础的爱好者，从购买到部署完成，可能只需要一个下午的时间。 ## 行业视角这一案例也反映了AI和物联网硬件领域的一个趋势：随着芯片算力的提升和成本的下降，越来越多的“边缘”设备开始承担原本需要更高性能硬件才能完成的任务。从智能家居到网络管理，低功耗、低成本解决方案正在不断涌现，让普通用户也能以极低的门槛享受到技术红利。总的来说，如果你正在寻找一个便宜、高效且易于实现的网络广告屏蔽方案，这块7美元的ESP32-S3开发板值得一试。

ZDNet AI19天前原文

756

中国智谱AI：GLM-5.2在网络安全领域可媲美Anthropic的Mythos

新上线

中国 AI 初创公司智谱 AI（Z.ai）近日发布了其开源权重模型 GLM-5.2，部分研究人员声称，该模型在漏洞发现和网络安全场景中的表现已可与 Anthropic 的 Mythos 模型相匹敌。尽管在通用任务上，GLM 仍落后于 Anthropic 和 OpenAI 的模型，但在特定安全领域，中国模型与美国顶尖模型之间的差距已显著缩小。这一进展尤其令美国政府担忧，后者一直试图限制中国获取 Anthropic 的 Mythos、Fable 等强大模型以及训练和运行这些模型所需的硬件。特朗普政府认为，Mythos 及其他能够识别漏洞的先进 AI 模型是严重的国家安全威胁。近期，OpenAI 发布的 GPT-5.6 也因其潜在滥用风险而受到关注，并限制了访问权限。由于 GLM-5.2 是开源权重模型，任何人都可以在现有硬件上下载并运行它。这赋予了模型极大的灵活性和深度访问能力，但同时也使其容易被恶意行为者滥用，因为他们可以在几乎没有监管的情况下运行该模型。

The Verge20天前原文

757

Suno 推出 Spark 孵化计划，用 AI 机器“喂养”独立音乐人

新上线

AI 音乐生成公司 Suno 正在试图摆脱“AI 垃圾制造机”的标签，向真正的流媒体平台和新人发掘机进化。其最新推出的 **Spark 孵化计划**，面向未签约的独立音乐人，提供资金、导师指导和营销支持，但苛刻的条款引发了社区争议。 ## 计划内容与条件 Spark 计划面向未签约的歌手、词曲作者或制作人，申请者需以个人名义发行音乐。入选者将获得： - **资金资助**（具体金额未披露） - **导师指导** - **营销推广支持** 但申请者必须同意一系列 **有争议的条款**： 1. **作品授权**：授权 Suno 对作品进行混音和创作衍生作品，且授权范围相当宽泛。 2. **放弃诉讼权**：放弃陪审团审判和参与集体诉讼的权利。 3. **有限独家权**：给予 Suno 对作品的有限独家使用权。 4. **“好心情”保密与不贬损条款**：参与者不得发表任何可能负面评价 Suno 或其产品、人员的言论，否则可能被踢出计划。 ## 行业背景与争议 Suno 目前正面临一起由独立音乐人发起的 **集体诉讼**，指控其未经授权使用受版权保护的音乐训练 AI 模型。Spark 计划中的“不贬损条款”和“放弃集体诉讼权”条款，被外界解读为 Suno 试图在诉讼压力下 **控制参与者言论并规避法律风险**。在 Suno 的 Reddit 社区中，许多用户对条款表示担忧，认为这实际上是“用独立音乐人的作品喂养 AI”，而音乐人获得的回报有限。 ## 战略意图 Suno 的野心不止于 AI 玩具。通过 Spark 计划，它希望： - **积累独家内容**，吸引用户留在其平台，而非仅生成音乐后导出。 - **打造“AI 艺人孵化器”**，将自身从工具升级为音乐生态的一部分。 - **应对版权质疑**，通过合同形式获得作品授权，为 AI 训练提供“合法”素材。然而，这种“先上车后买票”的做法能否赢得音乐人信任，仍是未知数。

The Verge20天前原文

758

福特重聘“灰胡子”老工程师，AI未能达到预期质量目标

新上线

福特汽车公司近期宣布，已重新聘用350名经验丰富的资深工程师——其中部分为前员工，另一些则来自供应商——原因是人工智能与自动化系统未能达到预期的质量水平。据彭博社报道，福特首席运营官Kumar Galhotra向媒体表示，公司此前“越来越依赖自动化质量系统”，但结果令人失望。因此，福特“请回了技术专家”，这些专家“在零部件进入工厂之前就查找故障点”。福特车辆硬件工程副总裁Charles Poon补充道：“我们错误地认为，只要引入人工智能并输入设计需求，就能生产出高质量的产品。” 需要明确的是，这并不意味着福特完全放弃AI计划。相反，公司正利用这些重新聘用的员工（被称为“灰胡子”工程师）来培训年轻员工并重新训练AI工具。这一举措似乎已见成效：福特预计今年将因此节省**10亿美元**成本。此外，该汽车制造商在本周发布的**JD Power初始质量调查**中，在主流品牌中拔得头筹。 ## 背景与启示福特的这一决策反映了AI在制造业中的现实局限性。尽管AI在数据分析和模式识别方面表现出色，但在复杂制造环境中，缺乏经验丰富的工程师对细微缺陷的直觉判断。福特的“灰胡子”工程师们不仅弥补了AI的不足，还通过知识传递提升了年轻团队的技能。这一案例也提醒业界，AI并非万能药。企业在推进自动化时，需平衡技术投入与人类经验的价值。福特的成功实践表明，将资深专家的隐性知识与AI的显性能力相结合，才能实现质量与成本的双重优化。 ## 小结福特通过重聘资深工程师，既解决了当前的质量问题，又为AI系统的持续改进奠定了基础。这一“人机协作”模式，或将成为制造业未来发展的关键方向。

TechCrunch20天前原文

759

华尔街为何认为美国存储芯片巨头美光可能是下一个英伟达

新上线

在 AI 热潮推动下，华尔街正急切寻找下一个“英伟达级”的投资标的，而存储芯片巨头美光（Micron）成为了最热门候选。这家总部位于爱达荷州博伊西的公司，凭借 AI 数据中心建设带来的存储芯片需求井喷，股价在过去一个月暴涨超过 236%，市值一度超越 Meta 和特斯拉，逼近 1.27 万亿美元。美光生产的 DRAM 和 NAND 芯片，尤其是高带宽存储器（HBM），是 AI 服务器不可或缺的核心部件。一台 AI 服务器所需的存储量远超普通笔记本电脑，而英伟达、微软、亚马逊 AWS、谷歌、Meta 和甲骨文等 AI 系统制造商正大量采购，导致整个行业陷入“内存荒”（RAMageddon）。这种供不应求的局面预计将持续到 2027 年，并已推高苹果产品和 Xbox 游戏机等消费电子产品的价格。美光最新财报印证了这一趋势：**第三季度营收同比增长四倍至 414.5 亿美元，净利润从 18.8 亿美元飙升至 282 亿美元**。公司还给出乐观指引，预计第四季度营收在 490 亿至 510 亿美元之间。然而，美光能否持续辉煌仍存变数。存储芯片行业历史上一直面临周期性波动，一旦需求回落或产能过剩，股价可能剧烈回调。美光承诺已通过长期供应协议巩固地位，但华尔街的追捧能否经得起周期考验，仍需时间验证。与英伟达类似，美光正从“幕后英雄”走向台前。过去消费者只记得它生产的小型存储卡，如今它已成为 AI 基础设施的关键供应商。但投资者需警惕：**存储芯片的供需平衡比 GPU 更为脆弱**，任何技术替代或产能扩张都可能改变游戏规则。

TechCrunch20天前原文

760

检察官用 ChatGPT 聊天记录作为帕利塞兹火灾案证据，陪审团不买账

新上线

在一起震惊全美的纵火案审判中，检察官首次大规模将 **ChatGPT 聊天日志** 作为关键证据提交法庭，但陪审团最终未能达成一致，案件以 **流审（mistrial）** 告终。 ## 案情回顾 2025 年元旦，加州洛杉矶地区发生严重山火，最终成为该市历史上伤亡最惨重的野火之一。嫌疑人 **Jonathan Rinderknecht** 被控纵火。为了证明其有罪，检方不仅调用了 iPhone 定位数据、监控录像和证人证词，还首次大规模援引了 **ChatGPT 的对话记录**。 ## 检方如何“用 AI 定罪”？根据检方提交的证据，Rinderknecht 在使用 ChatGPT 时曾： - 让模型生成火焰图像； - 询问“为什么我总是这么愤怒？”； - 向聊天机器人抱怨“富人正在毁灭世界”； - 在屏幕录制中提问：“如果烟头引发火灾，点烟的人是否要负责？” 检方认为，这些对话内容构成了 **动机与预谋的证据**，表明被告对火与愤怒存在执念，且对火灾责任有“提前了解”的意图。 ## 陪审团：我也和 ChatGPT 聊天，这能说明什么？然而，陪审团并未被说服。最终投票结果为 **10 比 2** 倾向被告，法官宣布 **流审**。一位陪审员在接受 CBS LA 采访时直言：“我每天都和 ChatGPT 聊天，这能证明什么？”她表示，检方将使用聊天机器人视为“性格缺陷”的论证方式让她感到 **愤怒**。 ## 行业解读：AI 日志作为证据的争议此案为法律界与科技界带来了新的思考： 1. **隐私边界**：用户在与 AI 对话时，往往处于“非公开”的心理预设中。将这类私密对话用于法庭指控，是否突破合理隐私期待？ 2. **证据可靠性**：聊天日志易被篡改或断章取义。目前并无统一标准验证 AI 对话记录的真实性与完整性。 3. **陪审团的“共情”问题**：随着 ChatGPT 等工具普及，普通公众对 AI 对话的“非正式性”有切身理解，反而可能削弱此类证据的威慑力。 ## 后续可能检方尚未决定是否重新起诉。如果再次开庭，此案可能成为 **美国司法体系中 AI 证据可采性** 的标志性判例。法律专家指出，未来类似案件可能需要更严谨的专家证词、对话背景还原以及明确的意图关联论证，而非简单将“和 AI 聊天”等同于“有罪”。 ## 小结 ChatGPT 聊天记录作为证据，在法理上并非不可行，但此案表明：**技术证据的有效性，最终仍取决于人类陪审团的常识与情感判断**。当 AI 深度嵌入日常生活，司法系统也需要重新校准“什么才是真正有说服力的数字证据”。

The Verge20天前原文