Transformer 推理过程中,键值(KV)缓存的大小随序列长度线性增长,成为长上下文部署的主要瓶颈。近日,一篇来自 arXiv 的论文提出了一种名为 **eOptShrinkQ** 的新型压缩方法,将随机矩阵理论引入 KV 缓存压缩,在近乎无损的前提下将缓存压缩至约 2.2 bits 每项,并在多项基准测试中超越现有方法。 ## 核心发现:KV 缓存的双重结构 研究人员发现,Transformer 注意力头中的 KV 缓存天然可分解为两部分:一个**低秩的“共享上下文”成分**和一个**满秩的“逐词残差”**。这一结构恰好可以用“尖峰随机矩阵模型”(spiked random matrix model)精确描述。共享上下文捕获了跨 token 的公共信息,而残差则包含每个 token 的独特细节,且其坐标具有“薄壳性质”(thin shell property)——即能量在各维度上均匀分布。 ## 两阶段压缩流水线 基于上述发现,eOptShrinkQ 设计了一个两阶段流程: 1. **最优奇异值收缩(eOptShrink)**:利用随机矩阵理论中的 BBP 相变(BBP phase transition),自动确定共享上下文的秩,并对奇异值进行最优收缩,从而干净地分离出低秩结构。这一步不仅提取了主要信息,还**恢复了残差的各向同性**——这是后续标量量化的关键前提。 2. **残余量化(TurboQuant)**:对去噪后的残差,使用近期提出的近最优逐向量标量量化器 TurboQuant 进行压缩。由于第一步恢复了各向同性,量化过程不再需要专门处理异常值或修正内积偏差,从而将节省的比特用于提升重建质量。 ## 理论保证与实验验证 论文从随机矩阵理论出发,提供了三个关键的理论保证: - **自动秩选择**:通过 BBP 相变阈值,无需手动调参即可确定低秩成分的维数。 - **近零内积偏差**:去噪后的残差在理论上保证内积偏差几乎为零。 - **坐标离域性**:残差的能量均匀分布,确保量化失真接近理论最优。 实验在 **Llama-3.1-8B** 和 **Ministral-8B** 两个模型上进行了全面验证: - **逐层指标**:在每头 MSE 和内积保真度上,eOptShrinkQ 在同等质量下比 TurboQuant 每项节省近 1 bit。 - **长文本基准**:在 LongBench(16 个任务)上,eOptShrinkQ 在约 **2.2 bits 每项**时性能优于 TurboQuant 在 3.0 bits 时的表现。 - **多针检索**:在需要精确回忆的检索任务中,2.2 bits 的 eOptShrinkQ 接近甚至超过未压缩的 FP16 基线,表明谱去噪本身可能对检索密集型任务起到有益的正则化作用。 ## 行业意义 这项工作的价值在于将严谨的数学理论与工程压缩需求结合。传统的 KV 缓存压缩方法往往依赖启发式异常值处理或逐层调参,而 eOptShrinkQ 提供了一套理论指导的自动化方案。随着大模型上下文窗口不断扩展,近乎无损的 2-bit 级别压缩有望大幅降低推理成本,使长序列应用(如文档分析、多轮对话)更加实用。
一篇来自 arXiv 的新论文(编号 2605.02907)对 Transformer 的核心——**Softmax 注意力机制**——进行了深入的结构分析,发现了其中隐藏的“不变性”规律。该研究由独立研究者 Wonsuk Lee 完成,定义了名为“**能量场**”的概念(行中心化的注意力 logit),并证明它在不同模型、架构和输入下都表现出两种不变性:**机制级不变性**和**模型级规律性**。 ### 机制级不变性:数学结构决定的约束 机制级不变性源于 Softmax 注意力的代数结构,包括: - **每行零和约束**:每个 query 对应的注意力 logit 在中心化后,其行内和为零。 - **秩界限**:能量场的秩受限于注意力头的维度(通常为 64 或 128),这意味着它只能在一个低维子空间中变化。 - **谱特征**:由前两者导出的矩阵谱性质。 这些约束是数学上必然成立的,不受模型训练或输入影响。 ### 模型级规律性:实验观察到的普遍现象 更令人惊讶的是,论文发现了一种并非机制强制、却在所有测试的自回归语言模型(涵盖多个架构家族)中普遍存在的规律:**能量场的方差在 key 位置上分布均匀,不会集中在少数几个位置上**。这种“**离域化**”现象源于一个被称为“**key 非相干性**”的特性——即 key 矩阵的列向量之间近似正交,互不相关。 ### 实用意义:从理论到实践 这些发现并非纯理论游戏。论文指出了几个实际应用: - **低维子空间**:秩界限意味着注意力计算可以在降维后的空间中进行,可能用于模型压缩或加速。 - **训练监控工具**:key 非相干性可以作为每个注意力头的训练健康指标——如果某个头的 key 非相干性偏离期望范围,可能意味着训练出现问题。 研究者在多个上下文长度和输入文本上验证了结果,确保其鲁棒性。 ### 行业背景与影响 注意力机制是 GPT-4、Claude、Llama 等所有主流大语言模型的基石。尽管其数学形式简单(Softmax 归一化),但内部动态一直被视为“黑箱”。这篇论文首次系统性地揭示了 Softmax 注意力的结构不变量,为理解模型行为、诊断训练问题、甚至设计更高效的架构提供了新视角。 值得注意的是,key 非相干性这一发现让人联想到词嵌入中的各向同性(isotropy)概念,但应用在注意力机制的 key 空间上。如果后续研究能证实这一性质与模型能力(如长上下文处理、幻觉抑制)的相关性,可能催生新的正则化方法或初始化策略。 论文目前以预印本形式发布,尚待同行评审。但其清晰的理论推导和跨模型验证,使其成为近期注意力机制研究中的一个有力贡献。
## 当大模型遇见网络优化:一种面向6G的Agentic AI框架 未来6G移动网络将部署大量高度专业化的优化专家,但如何根据高层意图和不确定性描述,灵活地选择、组合和编排这些专家,成为关键挑战。近日,一篇发表在arXiv上的论文提出了一种**基于Agentic AI的网络优化框架**,通过融合**混合专家(MoE)架构**与**大语言模型(LLM)**,实现了从人类可读意图到底层资源分配决策的端到端智能优化。 ### 核心思路:LLM作为“语义门”,动态调度专家 该框架的核心创新在于让LLM扮演一个**“语义门”**的角色。传统的MoE中,门控网络通常基于数值特征选择专家;而这里,LLM能够理解运营商用自然语言描述的目标(如“优先降低时延”或“保障公平性”),并据此动态组合出合适的优化专家集合。这种方式使得框架具备**模型无关性**,可适配不同的网络场景和优化目标。 ### 技术实现:从高层次意图到低层资源分配 论文以**联合通信与计算网络**为例,设计了一个包含多种优化专家的库,覆盖吞吐量、公平性、时延等目标,并同时支持常规和鲁棒(robust)条件下的优化。数值仿真表明,该**Agentic MoE框架**在性能上接近穷举所有专家组合的最优结果,并且在时延最小化、吞吐量最大化等不同目标上,均优于单一专家方案。 ### 行业意义:AI编排网络的新范式 这项研究为6G网络的自智化提供了新思路。传统网络优化往往依赖人工配置或固定算法,难以应对动态多变的需求。而该框架利用LLM的语义理解能力,将运营商的高层意图直接转化为可执行的优化策略,大幅降低了运维门槛。同时,MoE架构保证了计算效率——无需激活所有专家,仅需LLM选定的子集即可完成任务。 ### 局限与展望 目前该工作仍处于仿真验证阶段,实际部署还需考虑LLM的推理延迟、专家库的扩展性以及安全可靠性等问题。但不可否认,**Agentic AI + MoE + LLM** 的组合为未来通信网络与AI的深度融合提供了一个有潜力的技术方向。 > 论文由Robert-Jeron Reifert等人撰写,共16页,包含16张图和9张表,已提交至IEEE。
强化学习(RL)已成为提升大型语言模型(LLM)推理能力的核心后训练工具。然而,决定优化器学习数据的“推演”(rollout)——即从提示到终止的轨迹,包括中间推理步骤及可选的工具或环境交互——其设计往往被低估和报道不足。近日,一篇由Rohan Surana等22位作者联合撰写的综述论文《Generate, Filter, Control, Replay: A Comprehensive Survey of Rollout Strategies for LLM Reinforcement Learning》系统性地填补了这一空白。 ### 核心框架:GFCR生命周期 该论文提出了一个与优化器无关的视角,将推演流程形式化为统一的符号体系,并引入**Generate-Filter-Control-Replay(GFCR)**生命周期分类法,将推演管道分解为四个模块化阶段: - **Generate(生成)**:提出候选轨迹和拓扑结构。 - **Filter(过滤)**:通过验证器、评判者、批评者构建中间信号。 - **Control(控制)**:在预算约束下分配计算资源,并做出继续/分支/停止决策。 - **Replay(重放)**:在不更新权重的情况下,跨推演保留和重用工件,包括能够自主生成新训练任务的自演化课程。 ### 推演权衡准则 除了GFCR框架,论文还补充了一套**可靠性、覆盖率和成本敏感性**的准则分类,用于刻画推演中的关键权衡。这一准则帮助研究者和工程师在不同场景下选择最合适的推演策略。 ### 方法综合与案例研究 基于该框架,论文综合了多种方法,涵盖: - 基于可验证奖励的RL - 过程监督 - 基于评判者的门控机制 - 引导式推演与树/片段推演 - 自适应计算分配 - 提前退出与部分推演 - 吞吐量优化 - 用于自我改进的重放/重组 为了验证框架的实用性,论文在**数学、代码/SQL、多模态推理、工具使用代理以及代理技能基准**(评估技能归纳、重用和跨任务迁移)上进行了案例研究。 ### 诊断索引与实践意义 最后,论文提供了一个诊断索引,将常见的推演病理映射到GFCR模块,为实际开发中的问题定位和策略调整提供了直接指导。 ### 行业背景与展望 当前,LLM的后训练越来越依赖强化学习,从OpenAI的o1系列到DeepSeek-R1等模型,均通过RL显著提升了推理链的质量。然而,推演策略的细节往往是“黑盒”,这篇综述的公开恰好为社区提供了系统化的设计蓝图。GFCR框架不仅有助于理解现有方法,还能启发新的推演策略设计,尤其是在**计算效率与推理质量**的平衡上。 随着LLM向更长的推理链和更复杂的工具交互发展,推演策略的设计将成为影响模型能力上限的关键因素。这篇综述无疑为研究人员和工程师提供了宝贵的参考。
在软件运维领域,大语言模型(LLM)正受到越来越多的关注。然而,现有研究因数据质量低、知识碎片化和学习不充分,尚未实现高效、有效的端到端智能运维。为探索 LLM 在软件运维中的潜力,研究团队提出了 **OpsLLM**——一个支持基于知识的问答(QA)和根因分析(RCA)的专用大模型。 ## 构建流程:从数据到模型 OpsLLM 的构建遵循一套完整的端到端工作流: 1. **数据构建**:引入人机协同(Human-in-the-Loop)机制,从海量运维原始数据中筛选并构建高质量微调数据集。 2. **监督微调**:基于上述数据集进行监督式微调,获得基础模型。 3. **强化学习优化**:在强化学习阶段引入领域过程奖励模型(Domain Process Reward Model, DPRM),专门针对 RCA 任务优化模型的准确性和可靠性。 ## 性能表现:超越现有模型 实验在多种难度任务上进行,结果显示 OpsLLM 能够有效学习并对齐运维领域知识,在准确率上显著优于现有的开源和闭源 LLM: - **QA 任务**:提升 **0.2%~5.7%** - **RCA 任务**:提升 **2.7%~70.3%** 此外,OpsLLM 表现出强大的迁移能力。 ## 开源计划 研究团队将开源三个版本的 OpsLLM,参数量分别为 **7B、14B 和 32B**,同时附带一个 **15K 规模的微调数据集**,以推动该领域的进一步研究。
Bazzite 最新稳定版为 Linux 游戏玩家提供了开箱即用的卓越体验。登录系统后,我立刻意识到这是 Linux 游戏领域的重要一步。开发者致力于简化游戏流程,并取得了显著成功。 ## 现状与局限 尽管 Bazzite 表现出色,但尚未解决反作弊问题。需要内核级反作弊的多人游戏仍无法在 Linux/Steam 组合上运行,而独立游戏和单人游戏则流畅无阻。反作弊问题的根源在于 Linux 缺乏官方内核级支持,导致作弊者有机可乘,因此许多游戏开发商选择不支持 Linux。 ## 安装体验的革新 Bazzite 的安装过程本身就是一个亮点。作为资深 Linux 用户,我一天内安装了多个发行版,但 Bazzite 的安装流程依然令我印象深刻。它优化了每个步骤,让新手也能轻松上手。 ## 总结 Bazzite 是当前 Linux 游戏发行版中的佼佼者,尤其适合追求即开即玩体验的单机游戏玩家。尽管多人游戏支持仍是短板,但对于主要玩独立或单人游戏的用户来说,这几乎不是问题。如果你对 Linux 游戏感兴趣,Bazzite 值得一试。
加拿大电信巨头 Telus 近日被曝在其客服中心使用 AI 技术,实时修改海外客服人员的口音,以减少所谓的“口音摩擦”。该技术由一家名为 Tomato.ai 的公司提供,通过语音到语音的实时转换系统,调整客服人员的口音,使其听起来更接近当地口音。这一做法引发了劳工团体和公众的强烈批评,被认为具有欺骗性,并呼吁强制披露。与此同时,竞争对手 Rogers 和 Bell 表示无计划采用类似技术。 ## 技术原理与争议 该技术涉及语音到语音的实时转换,通常结合自动语音识别、说话人和口音转换模型以及神经声码器。在低延迟下实现可靠的口音转换,需要强大的前端语音识别和优化的推理性能。然而,在嘈杂的客服音频环境中,保持自然度和鲁棒性仍是技术挑战。 劳工和隐私倡导者指出,这种技术可能掩盖客服人员的身份,并在未经客户同意的情况下改变交流的自然状态。他们呼吁监管机构要求 Telus 向客户明确披露正在使用此类技术。 ## 行业反应与影响 Telus 的竞争对手 Rogers 和 Bell 已公开表示不打算部署类似技术。这起事件凸显了 AI 语音技术在客服行业应用中的伦理边界,尤其是在透明度、同意和工人权益方面。 随着实时语音转换技术的成熟,类似应用可能会在其他行业出现。但 Telus 的案例表明,企业在追求客户体验优化的同时,必须平衡技术能力与社会责任。
Fedora 44 正式版已发布,这次更新带来了大量细节打磨,使其成为史上最出色的版本之一。作为长期关注 Linux 发行版的用户,我体验了搭载 GNOME 50 桌面环境的旗舰版,发现它不仅在稳定性上登峰造极,更在易用性和美观度上实现了飞跃。 ## 稳定性与性能:前所未有的流畅 Fedora 44 最直观的感受就是“稳”。GNOME 50 桌面在测试中从未崩溃或卡顿,无论是多任务处理还是长时间运行,系统响应始终迅速。这种稳定性得益于 Fedora 项目对底层组件的精心调校,使得 GNOME 50 在 Fedora 44 上发挥出了最佳状态。 ## 桌面体验:GNOME 50 的华丽转身 坦白说,我之前对 GNOME 有些疏远,因为 COSMIC 和 KDE Plasma 在美学和易用性上已领先。但 Fedora 44 搭载的 GNOME 50 彻底改变了我的看法。它终于追平了竞争对手,在界面流畅度、动画细腻度和操作逻辑上达到了前所未有的高度。GNOME 50 的打磨程度堪称历史最佳,而 Fedora 44 完美呈现了这一点。 ## 细节改进:润物无声的升级 Fedora 44 的改进遍布系统各处。从安装程序的优化到默认应用的更新,每个细节都体现了开发团队的用心。例如,软件包管理更加高效,系统更新流程更加顺畅,甚至壁纸选择都更具品味。这些看似微小的变化,累积起来却让整体体验有了质的提升。 ## 适合谁用? 如果你曾因 Linux 的复杂而却步,Fedora 44 或许能改变你的看法。它既保留了专业用户所需的灵活性,又通过极致的稳定性降低了使用门槛。对于追求高效、稳定且美观桌面环境的用户,Fedora 44 无疑是一个值得尝试的选择。 ## 小结 Fedora 44 不是一次革命性更新,但它通过无数细节的优化,让 Linux 桌面体验达到了新高度。它让我在使用过程中完全忘记了底层操作系统的存在——而这正是优秀操作系统应有的样子。
SAP 宣布收购德国 AI 初创公司 Prior Labs,并计划在未来四年内投资 10 亿欧元(约 11.6 亿美元)将其打造为专注于结构化数据的 AI 实验室。这笔交易中,Prior Labs 的创始团队获得了超过 5 亿美元的现金对价。与此同时,SAP 更新了 API 政策,明确禁止未经授权的 AI 代理访问其产品,但 NVIDIA 的 NemoClaw 被列入白名单。 ## 结构化数据的 AI 新战场 Prior Labs 成立于 18 个月前,专注于**表格基础模型(TFM)**,这类模型能够从表格和数据库中提取数据并进行预测,相比通用大语言模型,更适合企业级应用。对于 SAP 这样依赖数据库的软件巨头而言,TFM 无疑是更优的选择。SAP 计划将 Prior Labs 发展为内部 AI 实验室,重点攻克企业数据中的结构化信息处理难题。 ## 代理 AI 的攻防战 随着 AI 代理技术的兴起,SAP 显然也在构筑自己的护城河。其最新 API 政策明确禁止未经授权的 AI 代理通过 API 访问 SAP 产品,仅有 SAP 认可的架构才被允许。目前,SAP 自家的 **Joule Agents**(仍处于测试阶段)以及 **NVIDIA 的 NemoClaw**(基于 Agent Toolkit)是少数被授权的选择。NemoClaw 作为 OpenClaw 的企业级替代方案,强调安全性与可控性,这或许是 SAP 选择合作的原因。 ## 投资背后的战略考量 SAP 股价在 2026 年因 SaaS 市场寒冬等因素大幅下跌,此次收购与投资显然是重振市场信心的关键举措。通过建立自己的 AI 实验室并限制外部代理,SAP 意图在 AI 时代保持对企业软件生态的掌控力。同时,与 NVIDIA 的合作也为其注入了更强的技术背书。 ## 小结 SAP 的这步棋既是对结构化数据 AI 的前瞻布局,也是对代理 AI 浪潮的防御性回应。未来,企业级 AI 的竞争将不再局限于语言模型,而是深入到数据底座与生态控制权的争夺。
在 OpenAI 与 Elon Musk 的法律诉讼中,OpenAI 联合创始人兼总裁 Greg Brockman 于周二出庭作证,披露了 2017 年与 Musk 的一次激烈会面。Brockman 表示,当时 Musk 因未能获得 OpenAI 的控制权而暴怒,甚至让他担心会遭到人身攻击。 ## 事件回顾:豪宅里的“鸿门宴” 2017 年 8 月,Brockman 和 OpenAI 联合创始人兼首席科学家 Ilya Sutskever 受邀前往 Musk 位于加州 Hillsborough 的豪宅。这座占地 47 英亩、价值 2300 万美元的庄园被 Musk 自称为“鬼屋”。当晚,Musk 当时的女友 Amber Heard 为大家倒了威士忌后便离开。 令人意外的是,Musk 在会面前赠送了 Brockman 和 Sutskever 每人一辆全新的 Tesla Model 3。Brockman 在证词中表示:“感觉他在讨好我们,想让我们觉得欠他人情。”作为回礼,Sutskever 将自己创作的一幅 Tesla 画作赠予 Musk。 ## 核心矛盾:控制权之争 会议主题是 OpenAI 的转型——从非营利组织转向设立营利部门,以吸引数十亿美元投资用于计算资源。Musk 要求获得公司的绝对控制权,但 Sutskever 和 Brockman 认为这相当于将 AI 发展的未来交予“独裁者”,因此提出共享控制权的方案。 Musk 在短暂考虑后拒绝了这一提议。Brockman 回忆道:“他站起来,绕着桌子暴走。我当时真的以为他要打我,物理上攻击我。”随后,Musk 抓起那幅画,威胁说如果 Brockman 和 Sutskever 不退出,他将切断对非营利组织的资金支持,然后摔门而去。 ## 后续:谈判并未终止 然而当晚,Musk 的幕僚长 Shivon Zilis 致电 Brockman 和 Sutskever,表示“事情还没结束”,并讨论了包括他们在内的未来方案。Brockman 认为,这次冲突只是 Musk 反复无常行为的缩影,而这恰恰削弱了 Musk 对 OpenAI 的指控。 ## 诉讼背景 Musk 此前起诉 OpenAI 及其 CEO Sam Altman,声称其约 **3800 万美元** 的捐赠遭到滥用,被用于打造如今估值 **8520 亿美元** 的营利性企业(包括 ChatGPT、Codex 等产品)。OpenAI 方面否认所有不当行为,案件目前正在审理中,陪审团最早可能于下周开始审议。 这场庭审不仅揭示了 OpenAI 早期决策中的紧张关系,也折射出 AI 行业巨头之间关于控制权、资金与伦理的深层博弈。
对于从事电池、半导体和医疗设备研发的公司而言,海量数据往往散落在电子表格和遗留系统中,形成难以跨越的“数据孤岛”。这不仅拖慢了研发进程,也让故障诊断变得异常困难。旧金山初创公司 **Altara** 近日宣布获得 **700 万美元** 种子轮融资,旨在用 AI 层将这些碎片化的技术信息整合到统一平台,大幅缩短研发中的故障排查时间。 本轮融资由 **Greylock** 领投,Neo、BoxGroup、Liquid 2 Ventures 以及谷歌 AI 高级研究员 Jeff Dean 参投。Altara 成立于 2025 年,联合创始人 Eva Tuecke 曾在费米实验室从事粒子物理研究,并在 SpaceX 工作过;另一位联合创始人 Catherine Yeo 则是前 Warp 的 AI 工程师。两人在哈佛大学攻读计算机科学时相识。 ## 数据碎片化:物理科学研发的隐形瓶颈 Yeo 用电池研发场景举例说明痛点:“想象你是一家开发下一代电池的公司,电池在研发过程中的单元测试环节失效了。工程师团队必须手动检查大量不同来源的数据——从传感器日志到温度、湿度数据,还要交叉核对历史故障报告。”科学家和工程师常常需要花费数周甚至数月时间,在多个数据源之间来回搜寻,才能诊断并解决故障。 Altara 宣称,其 AI 能将这一过程从数周压缩到几分钟。Greylock 合伙人 **Corinne Riley** 将 Altara 在物理科学领域的作用类比为软件领域的站点可靠性工程师(SRE):“如果系统故障,SRE 会检查公司的可观测性堆栈,找到是谁推送了代码变更导致了宕机。”Altara 所做的就是为物理科学领域提供类似的“可观测性”能力。 ## AI 如何“驯服”异构数据? Altara 的核心技术在于构建一个能够理解、关联并查询异构数据的 AI 层。它不直接替换现有系统,而是作为“中间层”连接到各种电子表格、数据库和遗留系统中,自动提取、清洗和整合数据。当工程师需要诊断故障时,只需用自然语言提问,AI 就能快速检索所有关联数据源,给出综合性的分析结果。 这种能力对于研发周期长、实验数据量大的物理科学领域尤为关键。以电池研发为例,一次失败可能涉及数千个传感器数据点、数十份实验报告和多年的历史记录。传统人工排查方式效率低下,且容易遗漏关键线索。Altara 的 AI 则能同时扫描所有数据源,发现隐藏的相关性,甚至自动推荐可能的根因。 ## 团队背景与行业意义 两位创始人的跨界背景赋予了 Altara 独特的优势。Tuecke 的粒子物理和 SpaceX 经历让她深刻理解实验数据管理的痛点;Yeo 的 AI 工程经验则提供了技术实现的基础。这种“科学+AI”的组合正是当前硬科技领域创业公司所需要的。 从行业角度看,Altara 瞄准的是一个被忽视但价值巨大的市场。物理科学领域的研发数据管理长期依赖传统工具,数字化转型程度远低于软件行业。随着电池、半导体、医疗设备等领域的竞争加剧,企业越来越需要从数据中挖掘洞察以加速创新。Altara 的产品有望填补这一空白,成为物理科学领域的“数据操作系统”。 不过,挑战同样存在。物理科学领域的数据格式和标准极其多样,AI 模型需要不断适应新的数据源和实验场景。此外,企业对数据安全的顾虑也可能成为推广的障碍。Altara 能否在 Greylock 等投资方的支持下快速迭代产品、建立标杆客户,将决定其能否在细分赛道中脱颖而出。
Google 宣布将 Google Home 中的 Gemini 模型升级至 **Gemini 3.1**,显著提升了智能家居助手的理解与执行能力。此次更新让用户可以通过单一语音指令完成多步骤任务和组合操作,例如同时要求“关闭客厅灯、打开空调并播报天气”。 Gemini 3.1 还改进了对**周期性事件和全天活动**的处理,允许用户“移动”即将到来的日程安排。此外,Google 同步推出了多项新功能: - **摄像头体验优化**:提升了事件检测与回放效率。 - **自动化能力增强**:支持更复杂的条件触发场景。 - **两项公开预览**: - **Ask Home on Web**:允许用户通过电脑管理智能家居,包括用自然语言搜索摄像头历史、检查设备状态和创建自动化。 - **改进的通知**:新增“快捷操作”按钮,可直接在通知中控制设备。 此次升级旨在解决此前用户反馈的**准确性 bug**,例如摄像头误判动物类型、活动摘要不准确等问题。上个月,Google 已通过自然语言理解和设备识别优化为 Gemini 打下基础。 分析认为,Gemini 3.1 的发布标志着 Google 在智能家居 AI 赛道上的加速追赶。相比 Amazon Alexa 和 Apple HomeKit,Google 正试图通过**多模态理解**和**任务编排**能力建立差异化优势。然而,实际体验是否流畅仍需观察——过去一年中,Google Home 的 AI 功能曾因响应延迟和误解指令而受到诟病。 对于用户而言,此次更新意味着更自然的交互方式:不再需要死记硬背固定指令句式,而是可以用日常语言表达复杂需求。例如,“我出门了”可能触发关灯、调低恒温器、启动扫地机器人等一系列操作。智能家居正从“被动响应”走向“主动理解”。 未来,随着 Gemini 模型持续迭代,Google Home 有望进一步整合 Google 生态(如 Calendar、Maps),实现跨场景的智能联动。但隐私与数据安全仍是悬而未决的问题——AI 需要更深入地理解用户行为,这也意味着更敏感的数据采集。
随着陆地建设AI数据中心面临电力、土地和冷却等挑战,硅谷投资者正将目光投向海洋。由Palantir联合创始人彼得·蒂尔等支持的初创公司Panthalassa,已累计获得约2亿美元投资,计划在2026年于太平洋测试浮动的AI计算节点。这些节点利用波浪能发电,直接为机载AI芯片供电,并通过卫星链路将推理结果传输至全球客户。 ## 从能源问题到数据传输问题 传统可再生能源项目通常将电力输送至陆地数据中心,而Panthalassa的思路截然不同:将计算设备置于发电现场。宾夕法尼亚大学计算机架构师Benjamin Lee指出,这实际上将“能源传输问题转变为了数据传输问题”。模型需先上传至海洋节点,节点接收用户查询后执行推理,再将结果回传。 ## 节点设计:波浪能驱动的巨型钢球 每个节点形似巨大的钢球,漂浮在水面,下方连接垂直管状结构。波浪运动驱动海水沿管道上升进入加压储水舱,释放时冲击涡轮发电机产生电力,供AI芯片使用。同时,周围海水可直接用于冷却芯片,相比陆地数据中心大量耗电和淡水冷却,海洋节点具有天然优势。 ## 最新原型与测试计划 最新原型Ocean-3长约85米,高度堪比伦敦大本钟或纽约熨斗大厦,计划于2026年在北太平洋测试。此前,Panthalassa已测试Ocean-1(2021年)和Ocean-2(2024年2月在华盛顿州海域进行了三周试验)。公司还计划在俄勒冈州波特兰附近建设试点制造设施,加速节点部署。 ## 行业背景与挑战 当前AI浪潮推动数据中心需求激增,但陆地项目面临审批周期长、电力供应紧张、冷却水资源消耗大等问题。海洋部署虽能规避部分障碍,但技术成熟度、卫星通信延迟、海洋环境维护等仍是未知数。Panthalassa的尝试若成功,可能为AI基础设施开辟全新路径。
苹果公司已同意支付 **2.5 亿美元**,以和解一起指控其误导消费者关于 Apple Intelligence 功能可用性的集体诉讼。该拟议和解方案适用于 **2024 年 6 月 10 日至 2025 年 3 月 29 日** 期间在美国购买 **iPhone 16 全系列** 及 **iPhone 15 Pro** 机型的用户。符合条件的用户每台设备可获 **25 美元** 补偿,根据申请数量可能上下浮动至 **95 美元**。 这起诉讼源于 2025 年,原告指控苹果的广告“营造了合理且清晰的消费者预期”,即 Apple Intelligence 功能将在 iPhone 16 发布时可用。然而,实际产品“提供的 Apple Intelligence 版本严重受限或完全缺失,误导了消费者对其实际效用和性能的判断”。苹果在 2024 年 6 月 WWDC 上预览了多项 AI 功能,包括更个性化的 Siri,但 iPhone 16 在 9 月发布时仅标注为“为 Apple Intelligence 打造”,实际功能如 Image Playground、Genmoji 和 ChatGPT 集成 Siri 却逐步延迟推送。 苹果发言人 Marni Goldberg 表示,公司“解决此事是为了专注于做我们最擅长的事——向用户交付最具创新性的产品和服务”。此次和解虽金额可观,但相较于苹果的现金储备与 iPhone 营收规模,更像是一次品牌信誉的止损。 ### 行业影响与反思 此案为科技巨头在“AI 承诺”与“实际交付”之间的落差敲响了警钟。近年来,从三星到谷歌,多家厂商在 AI 功能宣传上趋于激进,但往往因技术成熟度或监管问题而推迟落地。苹果此次和解不仅涉及财务赔偿,更可能促使其调整产品营销策略——例如,在功能未就绪时避免使用“内置”或“专为……打造”等暗示即买即用的措辞。 对消费者而言,这起案例展示了集体诉讼作为维权工具的有效性:尽管单笔赔偿不高(预计多数用户获 25 美元),但大规模索赔总额可观,足以对企业形成约束。未来,类似诉讼可能成为消费者监督 AI 产品宣传的重要机制。
宾夕法尼亚州近日对 AI 聊天机器人平台 Character.AI 提起诉讼,指控其平台上名为“Emilie”的机器人角色冒充持牌精神科医生,并提供虚假的执业许可证号。该诉讼由宾夕法尼亚州国务院和州医学委员会联合提起,州长乔什·夏皮罗办公室在公告中强调:“我们不会允许公司部署 AI 工具,误导人们相信他们正在从持牌医疗专业人士那里获得建议。” 根据起诉书,一名专业行为调查员在 Character.AI 上搜索“psychiatry”后发现了“Emilie”角色,其描述为“精神科医生。你是她的病人。”调查员向 Emilie 表达情绪低落、疲惫和缺乏动力等症状后,机器人不仅建议预约评估,还声称“在我的医生职权范围内”,并给出了一个无效的宾夕法尼亚州许可证号。截至 2026 年 4 月 17 日,该角色已累计约 45,500 次用户交互。 Character.AI 发言人在回应中辩称,用户创建的角色“本质上是虚构的,仅供娱乐和角色扮演”,平台已采取显著措施(如每次对话中显示免责声明)提醒用户角色并非真人,其言论应视为虚构。同时,平台还添加了“用户不应依赖角色获取任何专业建议”的醒目提示。 ## 事件背后的行业隐忧 这起诉讼并非孤立事件。去年,得克萨斯州一名 14 岁少年因沉迷 Character.AI 中的“龙妈”角色并产生情感依赖后自杀身亡,其母亲已起诉平台。今年更早时,欧洲多国消费者组织联合投诉 Character.AI,指责其“将儿童置于危险之中”。 从技术层面看,当前的大语言模型(LLM)在角色扮演场景中极易出现“幻觉”——即生成看似合理但实际虚假的信息。当用户询问专业资质时,模型可能基于训练数据中常见的“持牌医生”表述,编造出具体的许可证号。这种“拟人化”风险在心理健康等敏感领域尤为致命,因为用户可能正处于脆弱状态,更容易信任 AI 的回应。 ## 监管与责任的边界 宾夕法尼亚州的诉讼核心在于:AI 平台是否应对用户生成的内容承担连带责任?Character.AI 辩称其角色由用户创建,平台仅提供技术框架,但监管机构认为平台未能有效过滤或标注那些明确声称专业资质的角色。 值得注意的是,该案援引了州法律中关于“无证行医”的条款,而非通用的消费者保护法。这一定性可能为后续 AI 相关医疗纠纷树立判例——如果平台允许角色自称“医生”并提供诊断建议,就可能构成非法行医。 ## 小结 这起案件将 AI 平台的“免责声明”效力推向法庭。尽管 Character.AI 已标注“虚构”字样,但宾州政府认为这不足以抵消角色主动声称“持牌”的误导性。随着 AI 角色扮演越来越流行,如何在“娱乐性”与“用户保护”之间划定红线,将是整个行业必须面对的课题。
据 Bloomberg 最新报道,苹果计划在 iOS 27 中引入一项名为“Extensions”的新功能,允许用户从已安装的第三方应用中调用生成式 AI 能力,通过 Siri、写作工具、图像游乐场等苹果智能功能使用。这意味着 iPhone 用户将能够自主选择使用哪个 AI 模型来完成任务——Google 和 Anthropic 的模型已在测试中,而当前默认的 ChatGPT 预计仍将作为选项之一。该功能也将同步登陆 iPadOS 27 和 macOS 27。 这一举措标志着苹果 AI 策略的重大转向。长期以来,苹果被外界视为 AI 竞赛中的“追赶者”,并未像谷歌、微软那样大规模自建 AI 基础设施或推出大量独立 AI 服务。但事实上,苹果正通过另一种方式实现 AI 落地:将现有硬件转化为以 AI 为中心的用户体验。即将接替蒂姆·库克担任 CEO 的约翰·特努斯,将负责制定苹果的 AI 未来方向。 **苹果的“AI 自助餐”策略** 与竞争对手不同,苹果并不急于打造自己的大型语言模型,而是选择开放生态,让用户自行选择第三方模型。这种策略有几个潜在优势: - **用户选择权**:用户可以根据任务需求选择最适合的模型,比如用 Anthropic 的 Claude 处理长文本,用 Google 的 Gemini 进行多模态分析。 - **降低自研风险**:苹果无需在 AI 模型研发上投入巨额资金,而是直接利用业界顶尖成果。 - **隐私与安全**:苹果一直强调设备端处理,第三方模型可能通过本地化运行或严格沙盒机制保护用户数据。 不过,该策略也面临挑战。如何确保不同模型在 iOS 系统内无缝协作?苹果是否会对模型进行审核和限制?以及,苹果与第三方模型提供商的商业模式如何分成?这些问题仍有待解答。 **行业影响与展望** 苹果此举可能重塑移动 AI 生态。如果用户确实能自由切换 AI 模型,那么模型提供商之间的竞争将更加激烈,而苹果则扮演“超级聚合者”角色。对于开发者和用户而言,这或许意味着更丰富的 AI 应用场景和更灵活的体验。 当然,具体细节仍需等待 iOS 27 正式发布才能揭晓。但可以确定的是,苹果正在尝试一条不同于以往的道路——不是自己造轮子,而是让用户选择最好的轮子。
每当使用 AI,你都在某种程度上依赖一家成立 42 年、拥有 44000 名员工的荷兰公司——ASML。这家总部位于荷兰的企业每年投入 45 亿欧元推进技术,制造出全球唯一能生产最先进芯片所需的光刻机。这些机器采用极紫外光刻(EUV)技术,在硅片上蚀刻微观电路,每台造价高达 2 亿至 4 亿美元,体积与校车相当,组装耗时数月。 正是这种垄断地位,让 ASML 成为欧洲市值最高的公司,价值超过 5300 亿美元。随着微软、Meta、亚马逊、谷歌等科技巨头今年在 AI 基础设施上承诺投入超过 6000 亿美元,ASML 的机器需求激增,公司甚至坦言全球芯片短缺将持续数年。 但垄断也引来了挑战者。旧金山初创公司 Substrate 由 Peter Thiel 的门徒创立,已融资超 1 亿美元,估值超 10 亿美元,声称能打造竞争对手的光刻机。此外,有报道称中国的前 ASML 工程师部分逆向掌握了该技术,可能带来地缘政治影响。 ASML 新任 CEO Christophe Fouquet 在 Milken 全球会议前夕接受专访,谈及竞争时显得从容。他表示:“没人能取代我们。”Fouquet 认为,EUV 系统的复杂性和生态壁垒极高,新进入者需要数十年才能追赶。他承认中国有工程师试图复制技术,但强调 ASML 的供应链和知识产权保护严密。 Fouquet 还透露,ASML 正与客户合作开发下一代 High-NA EUV 光刻机,预计将在 2025 年交付首批系统。他相信 AI 对芯片的需求将持续增长,而 ASML 将保持关键角色。
微软 Xbox 部门正在逐步淘汰其 AI 助手 Copilot,新上任的 Xbox CEO Asha Sharma 于周二宣布,将“逐步关闭移动端的 Copilot”并“停止开发主机端的 Copilot”。这一决定紧随 Sharma 对 Xbox 平台团队的重组——她将来自微软 CoreAI 团队的几位高管引入 Xbox,而 Sharma 本人此前正是 CoreAI 团队的成员。 Sharma 在 X 平台上表示:“Xbox 需要更快行动,加深与社区的连接,并解决玩家和开发者面临的摩擦。今天我们提拔了帮助打造 Xbox 的领导者,同时也引入了新声音来推动我们前进。这种平衡对于让业务重回正轨至关重要。作为这一转变的一部分,你们将看到我们开始淘汰那些不符合未来方向的功能。我们将开始逐步关闭移动端的 Copilot,并停止主机端 Copilot 的开发。” 这一举措标志着微软在游戏 AI 战略上的重大转向。去年,微软曾高调宣传“Copilot for Gaming”,并在今年 3 月承诺该游戏专用 AI 助手将于年内登陆当前世代主机。如今这些计划已被彻底搁置。 Sharma 自今年 2 月接替 Phil Spencer 担任 Xbox CEO 以来,已实施了一系列激进改革,包括取消 Microsoft Gaming 品牌、下调 Xbox Game Pass 价格等。此次放弃 Copilot 项目,进一步表明她正以务实态度重新评估 Xbox 的业务优先级。 分析人士指出,Xbox Copilot 的退场反映出微软在游戏 AI 落地上遇到的挑战。尽管 AI 助手在办公场景已取得一定成功,但在游戏领域,玩家对“AI 介入游戏体验”的态度仍存分歧。微软此前试图通过 Copilot 实现游戏内攻略、设置优化等功能,但实际效果未达预期。 与此同时,Sharma 将 CoreAI 团队高管调入 Xbox,暗示未来 Xbox 的 AI 应用可能更侧重后台优化与开发者工具,而非面向消费者的对话式助手。这一调整与整个游戏行业对 AI 的谨慎态度一致——近期多家游戏公司均收缩了 AI 驱动的玩家交互功能。 对于玩家而言,移动端 Copilot 的关闭影响有限,该功能此前并未获得广泛关注;而主机端 Copilot 的取消则意味着微软放弃了将 AI 深度整合进游戏主机的计划。未来,Xbox 的 AI 探索或将转向更底层的系统优化,例如智能帧率调节、动态负载平衡等。 总的来看,微软放弃 Xbox Copilot 是 Sharma 领导下 Xbox 战略收缩的一部分。在游戏业务面临增长压力的当下,削减非核心功能、聚焦平台基础体验,或许是其重振 Xbox 的必要之举。
据彭博社 Mark Gurman 透露,苹果计划在 iOS 27、iPadOS 27 和 macOS 27 中引入一项重大更新:允许用户系统级地选择第三方 AI 模型来驱动 Apple Intelligence 功能。这些被称为“Extensions”的第三方 AI 模型将不仅能运行 Siri,还能调用 Writing Tools、Image Playground 等苹果原生 AI 能力。用户可针对不同 AI 模型设置不同的 Siri 语音,例如苹果自家模型用一种声音,ChatGPT 驱动的 Siri 用另一种。用户只需从 App Store 安装兼容的 AI 应用,即可在设置中将其设为首选模型。Gurman 称苹果已在内部测试与 Google 和 Anthropic 模型的集成,而 Google 的模型也是苹果即将推出的 Siri 改版的核心基础。目前 ChatGPT 是唯一深度集成的第三方模型,但这一局面可能很快改变。 这一举措标志着苹果在 AI 策略上的重大转向:从封闭生态走向开放平台。通过允许用户自由选择 AI 模型,苹果不仅规避了“押注单一模型”的风险,还能借助第三方创新快速丰富功能。对于开发者而言,这意味着新的分发渠道和商业化机会——模型提供商可通过 App Store 应用接入系统级 AI,获取更多用户。 然而,开放也带来挑战:隐私与安全如何保障?不同模型的能力差异可能导致用户体验不一致。苹果很可能需要建立严格的审核机制,确保第三方模型符合隐私标准。此外,用户选择权增加也可能导致碎片化,影响 Siri 等功能的连贯性。 总的来说,这一变化若如期落地,将重新定义移动 AI 的竞争格局。苹果不再只是 AI 技术的提供者,更是生态的组织者。对于用户,这或许是“AI 自由”的开始——你不再被绑定于单一智能助手,而是可以根据任务选择最合适的模型。
亚马逊 Kindle 系列迎来母亲节前促销,多款热门型号降价,包括 **Kindle Paperwhite** 和 **Colorsoft**。本文整理最值得关注的优惠,助你做出明智选择。 ## 热门型号折扣一览 - **Kindle Paperwhite**:仅售 **$135**(节省 $25),经典防水款,适合日常阅读。 - **Kindle Colorsoft**:降至 **$190**(节省 $60),彩色电子墨水屏,漫画和杂志体验更佳。 - **Kindle Essentials Bundle**:**$141**(节省 $20),含基础款和保护套。 - **Kindle Scribe Essentials Bundle**:**$404**(节省 $76),大屏手写笔记设备。 ## 选购建议 对于追求性价比的用户,**Paperwhite** 是平衡价格与功能的最佳选择;而 **Colorsoft** 则适合对色彩有需求的读者。Scribe 套装适合学生或专业人士,用于笔记和文档批注。 ## 注意事项 促销截至母亲节周末,部分优惠可能随时结束。建议通过亚马逊官方渠道购买,确保享受保修和退货服务。