AI 资讯

每日聚合最新人工智能动态

261

Instagram CEO 亚当·莫塞里：不喜欢 AI 内容？那就别让它出现在你的信息流里

新上线

Instagram 负责人亚当·莫塞里（Adam Mosseri）在 Lenny Rachitsky 的播客中表示，平台不会完全过滤 AI 生成内容，但用户若不喜欢，应有权将其从信息流中排除。莫塞里强调：“我不认为我们应该过滤掉 AI 内容，但应该告知用户哪些是 AI 生成的。”他同时区分了基于内容的分类与全面禁止 AI：喜欢 AI 的用户可以拥有“纯 AI 信息流”，而不喜欢的用户则应能选择不看。然而，Instagram 目前仅对 AI 内容进行标记，并未提供过滤选项。莫塞里承认检测 AI 内容“很难”，随着模型进步，平台可能“失去识别能力”。他建议更务实的做法是标记“相机拍摄的真实内容”，而非 AI 内容。这一观点与他 2025 年 12 月关于“真实媒体”指纹识别的表态一致。尽管莫塞里表示需要打击垃圾 AI 内容，Instagram 仍在积极拥抱 AI 技术。Meta 推出的 AI 图像生成器 Muse Spark 允许用户通过标记将他人融入 AI 创作，引发安全担忧。国家性剥削中心执行主任指出，该功能“为剥削、性虐待、骚扰和身份欺诈创造了明显且可预见的机会”。 **行业背景**：当前 TikTok、YouTube、Facebook 等平台均采取类似策略——标记但不过滤。这反映了平台在平衡 AI 创新与内容治理之间的困境：一方面，AI 内容带来流量和用户参与；另一方面，虚假信息、滥用和版权问题日益突出。莫塞里的表态或许预示着未来平台将提供更细粒度的用户控制权，而非一刀切禁止。

The Verge6天前原文

262

你家会成为AI数据中心的一部分吗？

新上线

一家太阳能和家用储能公司正将业务拓展至AI数据中心领域，但并非通过自建数据中心——而是计划向客户付费，允许在其家中部署计算单元。Sunrun 宣布启动一项名为“分布式AI计算”的试点项目，该项目将“在客户家中放置大量计算节点”，利用家庭太阳能和储能系统为这些节点供电。 ## 模式与动机 Sunrun 的模式本质上是将算力下沉至用户侧。与传统集中式数据中心不同，分布式计算节点部署在住宅中，借助家庭已有的光伏和电池储能系统运行。用户无需承担硬件成本，Sunrun 会为占用的空间和电力支付费用。这一策略既能降低数据中心建设的土地和电力成本，又能利用分布式储能缓解电网压力，同时为用户创造额外收入。 ## 行业背景与挑战 AI 训练和推理对算力的需求呈指数级增长，而数据中心能耗已成为全球关注焦点。集中式数据中心面临电力供应紧张、冷却成本高、建设周期长等问题。分布式计算并非新概念，早期有通过家庭节点进行蛋白质折叠等科学计算的案例，但 Sunrun 的尝试首次将分布式计算与 AI 工作负载结合，且由能源公司主导。 **潜在优势：** - **绿色能源利用：** 家庭太阳能和储能系统可提供清洁电力，降低碳足迹。 - **电网友好：** 计算任务可灵活安排在太阳能发电高峰或电价低谷时段，辅助电网调峰。 - **低延迟边缘计算：** 对于某些推理场景，靠近用户的数据处理可减少延迟。 **主要挑战：** - **可靠性：** 家庭网络和电力稳定性不如专业数据中心，可能影响任务连续性。 - **安全与隐私：** 计算节点处理的数据类型和安全性未明确，用户对硬件在自家运行可能有顾虑。 - **规模效应：** 分散的计算节点管理和维护成本较高，能否达到 AI 训练所需的算力密度存疑。 ## 试点与未来展望 Sunrun 的试点计划规模有限，具体参与条件、硬件配置和报酬机制尚未公布。如果成功，可能开启一种“算力共享经济”模式，类似家庭太阳能发电并网获利。但 AI 计算对硬件要求苛刻，尤其是训练任务需要高速互联和专用加速芯片，普通家庭环境难以满足。因此，该模式更可能聚焦于推理或轻量级训练任务。总体而言，Sunrun 的尝试反映了 AI 基础设施向分布式、绿色化发展的趋势，但能否规模化落地仍需观察。对于用户而言，这或许是一个用闲置屋顶和储能赚钱的新机会，但需要权衡隐私与便利性。

The Verge6天前原文

263

“学会编程”时代终结——雇主现在应为员工再技能化负责

新上线

## 从“学会编程”到“再技能化”：AI 时代的就业新规则过去十年，“学会编程”曾是无数人职业转型的金科玉律。从非营利组织到政府项目，大量资源被投入让更多人进入科技行业。然而，随着生成式 AI 的爆发式发展，这一口号正在失去效力。**我们正从“学会编程”时代，迈入“再技能化”时代——而这一次，责任主体不再是员工个人，而是雇主。** ### 为什么“学会编程”不再足够？ AI 工具如 GitHub Copilot、ChatGPT 等正在大幅降低编程门槛。以往需要数月甚至数年掌握的编码技能，现在可以通过自然语言指令部分完成。这意味着： - 初级编程岗位需求萎缩，重复性编码工作被 AI 替代。 - 企业更看重“AI 协作能力”而非纯编码能力。 - 单纯依靠个人学习编程来保证就业，已不再现实。 ### 雇主为何必须承担再技能化责任？过去，员工被期望自行投资学习新技能，企业则坐享其成。但在 AI 快速迭代的背景下，这种模式已不可持续： 1. **技能半衰期缩短**：一项技能可能 2-3 年就过时，个人难以持续跟进。 2. **企业内部知识流失**：如果员工自行转型失败，企业将失去宝贵的人才和经验。 3. **公平性问题**：并非所有人都有时间、金钱或资源去学习新技能，企业主导的培训能减少不平等。 ### 从“教会编程”中吸取的教训过去十年的“编程普及运动”虽有成效，但也暴露出问题： - 培训与岗位脱节：许多培训项目教的是基础语法，而企业需要的是实战能力。 - 短期冲刺 vs 长期成长：密集训练营往往无法培养持续学习的能力。 - **雇主参与不足**：企业很少深度参与课程设计或提供实习机会，导致人才供给与需求错配。 ### 再技能化的新范式成功的再技能化需要企业、政府和教育机构协同，但**雇主必须成为核心推动者**： - **内部培训体系**：建立与业务直接相关的技能提升计划，例如针对非技术员工的 AI 素养培训。 - **与教育机构合作**：共同开发课程，确保内容紧跟行业需求。 - **提供实践机会**：让员工在真实项目中应用新技能，而非纸上谈兵。 - **文化转变**：将学习视为工作的一部分，而非额外负担。 ### 结语 “学会编程”时代或许正在落幕，但“再技能化”时代才刚刚开始。**那些主动投资员工技能发展的企业，将在 AI 浪潮中获得更强的韧性和竞争力。** 对于个人而言，与其焦虑“该学什么”，不如关注“在哪里能获得持续成长的机会”。未来属于既能拥抱变化，又能为他人创造学习生态的组织。

ZDNet AI6天前原文

264

3M Command 无痕胶条，你用对了吗？

新上线

3M Command 无痕胶条以其方便、不留痕的特性，成为居家收纳的利器。但很多人抱怨“挂上去没多久就掉下来”，其实问题往往出在使用方法上。掌握以下几个关键技巧，就能让物品稳稳上墙数年。 ## 准备工作：清洁与干燥是第一步墙面必须干净、干燥、无灰尘。用酒精擦拭待贴区域，等完全干透后再操作。潮湿或油污的墙面会大幅降低粘性。 ## 粘贴手法：按压时间要足够撕开胶条背胶后，将胶条贴在挂钩或挂件背面，然后用力按压**30秒以上**。很多人只是随手一按，导致胶面与墙面未能充分贴合。 ## 等待时间：别急着挂东西贴上胶条后，**至少等待1小时**再挂载物品。如果是较重的物品（如相框、镜子），建议等待24小时。胶水的“应力松弛”需要时间，急于承重容易导致脱落。 ## 移除技巧：向下拉伸，而非硬拔正确移除方法是：抓住胶条下方的拉片，**沿墙面平行方向缓慢向下拉伸**，胶条会自然伸长并脱离墙面。千万不要垂直向外硬拽，否则可能损坏墙面或残留胶体。 ## 承重与数量：别超载，也别吝啬每个Command产品都有明确的最大承重标识。对于较重物品，使用多个挂钩分散受力。同时，墙面材质也很重要——光滑瓷砖、玻璃效果最好，粗糙墙面（如砖墙、纹理漆）需要配合专用胶条。 ## 温度与时间：极端环境要留意高温（如夏季阳光直射）或低温（低于10℃）会降低粘性。长期处于潮湿环境（如浴室）建议选择防水系列。一般产品在适当条件下可保持粘性2-3年，之后建议更换新胶条。 ## 小结 Command 胶条并非“随手一贴就能用”，而是需要遵循正确的操作流程：清洁、按压、静置、正确移除。只要做到这几点，它就能成为你可靠的墙面收纳伙伴。

ZDNet AI6天前原文

265

2026年最佳无线充电器实测推荐：Anker、Nomad等品牌谁更胜一筹？

新上线

在配件满天下的时代，无线充电器凭借MagSafe技术简化了设备充电流程，彻底告别线缆缠绕。ZDNET专家团队对Anker、Belkin、Nomad等品牌的十余款无线充电器进行了严格测试，从折叠便携性、外观设计、充电速度、多设备同时充电能力等维度综合评估，精选出2026年度最佳产品。本文不仅呈现测试结果，还深入分析无线充电技术的最新进展（如Qi2标准普及、快充协议兼容性），并结合日常使用场景（办公桌、床头柜、车载等）给出选购建议。无论你是苹果用户还是安卓用户，都能找到最适合自己生活方式的无线充电方案。

ZDNet AI6天前原文

266

地面机器人接管“杀戮区”：乌克兰机器人专家正打造无人前线

新上线

乌克兰的机器人专家正加速推进一项雄心勃勃的计划：让地面机器人接管战场最危险的区域——“杀戮区”，从而构建一条真正意义上的人类无需涉足的前线。这一趋势不仅反映了俄乌冲突中技术对抗的升级，也预示着未来战争形态的深刻变革。 ## 从无人机到地面机器人：战场的自动化演进自俄乌冲突爆发以来，无人机已在前线侦察、炮火校正和精确打击中扮演关键角色，大幅降低了飞行员和侦察兵的风险。然而，地面作战始终是伤亡最惨重的环节。步兵在战壕、城市废墟和开阔地带面临密集火力，被称为“杀戮区”的接触线往往是血肉磨坊。如今，乌克兰的工程师正试图将这种风险转移给机器人。 RoverTech公司的Zmyi无人地面车辆（UGV）便是这一趋势的代表。在一次森林演示中，Zmyi展示了穿越复杂地形的能力，可执行物资运输、伤员后送甚至火力支援任务。这类机器人并非简单的遥控玩具，而是集成传感器、自主导航和模块化武器站的作战平台。 ## 技术挑战与实战适配将机器人投入实战面临诸多挑战。首先，**通信链路**在电子战环境下极易被干扰或切断，因此自主决策能力至关重要。其次，**地形适应性**：乌克兰春季的泥泞、冬季的积雪以及遍布的废墟要求机器人具备高通过性。此外，**成本控制**也是关键——一次性无人机相对廉价，但地面机器人若造价过高则难以大规模部署。乌克兰军方和私营企业正通过模块化设计应对这些难题。例如，RoverTech的Zmyi采用履带式底盘，可更换不同任务载荷，从侦察传感器到遥控武器站，实现一车多用。同时，利用民用部件降低采购成本，并借鉴无人机领域的快速迭代经验。 ## 战略意义：从“消耗战”到“无人战” 地面机器人的大规模应用可能改变战争的底层逻辑。当前，俄乌双方在长达千公里的战线上陷入残酷的堑壕战，人力消耗巨大。若机器人能有效执行高危区域的任务，**一线士兵的伤亡率有望显著下降**，同时延长部队的持续作战能力。值得注意的是，这种转变并非一蹴而就。目前，机器人更多是辅助角色，而非完全替代人类。但在某些特定场景，如战壕清扫、雷区排障和弹药补给，机器人已展现出独特价值。乌克兰国防部下属的Brave1科技加速器正在资助多个UGV项目，目标是在2024年内实现小规模实战部署。 ## 未来展望：人机协同的新前线尽管“完全无人前线”仍是一个远景，但乌克兰的实践正在为全球军事科技探索新路径。随着AI自主决策能力的提升和机器人成本的下降，**地面机器人将从辅助工具演变为战场主力之一**。然而，这也引发伦理争议：当杀戮完全由机器执行时，战争的规则与底线如何界定？目前，乌克兰的机器人专家更关注实用主义目标——减少士兵牺牲。正如一位工程师所言：“我们不是要取代战士，而是让他们远离最危险的地方。”这种务实态度，或许正是技术演进最真实的驱动力。

IEEE AI6天前原文

267

这家新开的体验式画廊，可能会改变你对AI艺术的看法

新上线

位于洛杉矶市中心的 **Dataland** 自称“全球首个人工智能艺术博物馆”，于6月20日向公众开放，开幕两周内便吸引了超过 **1万名** 访客。其核心展览 **《机器之梦：雨林》** 由艺术家 **Refik Anadol** 及其工作室联合创始人 **Efsun Erkılıç** 打造，通过可穿戴设备追踪访客的动作与生物特征，实时生成不断变化的数字影像与声景。 Anadol 表示，团队耗时三年从零训练自有AI模型 **Large Nature Model**，并亲自前往亚马逊等雨林采集原始数据，最终积累了 **5 PB** 的素材。这些数据与史密森尼等研究机构的自然科学档案共同驱动模型，创造出“幻觉化”的自然环境。与硅谷AI公司因未经授权使用训练数据而饱受争议不同，Dataland 强调所有数据均经研究人员同意并参与采集。此外，Google DeepMind 为画廊提供了“实验性低能耗”资源，使其能够依托 Google Cloud 实现可持续计算。Anadol 认为，当前正处于艺术史的“文艺复兴”时期，AI 作为媒介虽具争议但潜力巨大。Dataland 试图通过伦理数据采集、环境责任与沉浸式体验，重新定义“AI艺术”的内涵——这一概念此前常被许多创作者质疑。

WIRED AI6天前原文

268

2026年最佳VPS托管服务：专家测试与评测

新上线

随着人工智能和云计算技术的快速发展，虚拟专用服务器（VPS）托管服务正成为企业和开发者部署AI应用、网站和数据库的关键基础设施。在2026年，VPS市场预计将更加成熟，提供更强大的可扩展性、专用资源和精细控制能力，以满足从初创公司到大型企业的多样化需求。 **为什么VPS在AI时代至关重要？** VPS通过虚拟化技术将物理服务器划分为多个独立环境，每个环境拥有专属的CPU、内存和存储资源。这使其成为运行AI模型、机器学习工作负载或高流量网站的优选方案。与共享托管相比，VPS提供更高的性能和隔离性；与专用服务器相比，它更具成本效益和灵活性，允许用户按需扩展资源，适应AI项目从测试到生产的不同阶段。 **专家评测的关键维度** 在评估2026年最佳VPS服务时，专家通常关注以下核心方面： - **性能与可靠性**：包括服务器响应时间、正常运行时间保证（如99.9%以上）和硬件配置选项。 - **可扩展性**：能否轻松升级CPU、RAM或存储，以应对AI训练或数据增长的需求。 - **控制与管理**：提供root访问权限、自定义操作系统安装和API集成，便于自动化部署。 - **安全特性**：内置防火墙、DDoS防护和定期备份，确保数据安全。 - **成本效益**：透明定价、无隐藏费用，以及针对长期使用的折扣计划。 **行业趋势与选择建议** 2026年的VPS市场可能进一步整合AI优化功能，例如预配置的GPU实例用于深度学习，或与云AI平台（如AWS、Google Cloud）的无缝集成。对于中文用户，选择服务时还需考虑数据中心位置（如亚洲节点以降低延迟）、本地化支持和合规性要求。尽管具体评测结果未提供，但基于当前趋势，领先的VPS提供商可能包括DigitalOcean、Linode、Vultr等，它们以开发者友好和性价比著称。建议用户根据自身AI项目的资源需求、预算和技术栈，进行试用或咨询专家评测，以做出明智决策。 **小结** VPS托管服务在2026年将继续是AI和Web部署的基石，提供平衡性能、控制与成本的解决方案。通过专家评测，用户可以筛选出最适合其业务需求的选项，确保基础设施支持创新与增长。

ZDNet AI6天前原文

269

在安卓上运行 Linux 图形界面应用：理想很丰满，现实很骨感

新上线

Android 系统与 Linux 桌面之间的距离正在缩小，尤其是在 Google 为 Android 添加了 Linux 终端支持之后。理论上，通过 **Android 17** 引入的 **Weston 应用**（Wayland 合成器的参考实现），用户可以在安卓设备上运行完整的 Linux 图形界面（GUI）应用。这对于拥有大屏安卓平板的用户来说，似乎意味着设备生产力的巨大飞跃。然而，理想很丰满，现实很骨感。资深科技编辑 Jack Wallen 在亲自测试后直言，这个功能目前仍是个“白日梦”。 ### 理论上的“简单”步骤根据官方说明和社区指南，运行 Linux GUI 应用的过程似乎并不复杂： 1. 在 Android 设置中启用 Linux 终端支持。 2. 打开终端应用。 3. 安装 Flatpak 包管理器。 4. 启用 Flathub 仓库。 5. 在终端中运行 `weston` 命令启动图形环境。 6. 打开显示选项卡。 7. 启动 Wayland 终端。 8. 运行应用启动命令。对于有 Linux 经验的用户来说，这些步骤并不陌生。但问题在于，实际操作中充满了障碍。 ### 现实中的“硬伤” 尽管 Android 内核基于 Linux，但 Google 并未为 Linux 桌面应用提供原生优化。Wallen 使用 **Pixel 9 Pro** 进行测试（因为手头没有支持 Linux 终端的平板），结果发现： - **兼容性问题**：许多 GUI 应用在移动环境下无法正确渲染界面，按钮和菜单错位、窗口无法缩放等问题频发。 - **性能瓶颈**：手机的小屏幕和触控交互方式与桌面应用的设计理念格格不入，操作体验极差。 - **生态缺失**：缺乏对 GPU 加速、多窗口管理等关键特性的支持，导致应用运行卡顿或直接崩溃。 Wallen 总结道：“即使赢下部分应用，也依然是个白日梦。” ### 行业背景与未来展望 Android 的 Linux 终端支持本是为了满足开发者和极客用户的需求，而运行 GUI 应用更像是一个附加的“彩蛋”。相比之下，**Linux 平板**（如 PineTab 或某些定制设备）在运行桌面应用时体验更佳，因为它们从底层就为桌面环境做了适配。不过，这一功能的出现依然具有标志性意义：它表明 Google 正在认真考虑将 Android 打造成“全功能桌面系统”的可能性。随着 **Android 版本迭代** 和硬件性能的提升（尤其是折叠屏和大型平板的普及），未来或许会看到更完善的解决方案。 ### 小结目前，在安卓上运行 Linux GUI 应用更像是一个技术演示，而非实用的日常功能。如果你只是想尝鲜或进行轻度开发，可以一试；但如果追求流畅的生产力体验，不妨等待 Google 的进一步优化，或者直接选择一台原生 Linux 设备。

ZDNet AI6天前原文

270

2026年最佳HDMI线缆：专家实测推荐

新上线

## 2026年最佳HDMI线缆：专家实测推荐随着8K电视、高刷新率游戏显示器以及新一代游戏主机的普及，HDMI线缆的重要性日益凸显。一条质量不佳的线缆可能导致画面闪烁、音频中断，甚至完全无法显示。为了帮助消费者做出明智选择，我测试了来自多个领先品牌的HDMI线缆，从传输稳定性、兼容性、耐用性和性价比等维度进行了综合评估。 ### 测试结果速览 | 排名 | 品牌型号 | 核心亮点 | 适用场景 | |------|----------|----------|----------| | 1 | **Belkin Ultra HD HDMI 2.1** | 48Gbps带宽，支持8K/60Hz、4K/120Hz | 高端游戏、家庭影院 | | 2 | **Amazon Basics HDMI 2.1** | 性价比极高，通过认证 | 日常使用、入门级4K设备 | | 3 | **Monoprice Certified Premium HDMI** | 18Gbps带宽，稳定可靠 | 4K电视、蓝光播放器 | | 4 | **Anker PowerLine HDMI 2.1** | 编织线身，耐用抗弯折 | 移动设备、频繁插拔场景 | | 5 | **Zeskit Maya EX** | 超长距离传输（15米以上） | 投影仪、远距离连接 | ### 关键选择因素 - **版本与带宽**：HDMI 2.1是目前最新标准，支持48Gbps带宽，满足8K/60Hz或4K/120Hz无压缩传输。如果设备仅支持HDMI 2.0，则18Gbps的认证线缆即可胜任。 - **认证标志**：务必选择通过**HDMI Licensing Administrator**认证的产品，防止买到劣质线缆导致信号不稳定。 - **长度与线材**：超过5米的长距离传输建议选择光纤HDMI线或带信号放大器的型号。编织线身更耐用，但柔软度可能略差。 ### 实测体验在测试中，**Belkin Ultra HD**在8K分辨率下传输60Hz信号时表现完美，无任何花屏或延迟。**Amazon Basics**虽然价格仅为Belkin的一半，但在4K/120Hz测试中同样稳定，性价比突出。对于需要长距离布线的用户，**Zeskit Maya EX**的15米版本在光纤加持下依然保持了完整带宽，适合投影仪或壁挂电视场景。 ### 小结选择HDMI线缆不必盲目追求高价。根据你的设备规格和实际需求，匹配带宽和长度即可。如果未来有升级8K或高帧率游戏的计划，一步到位选择HDMI 2.1认证线缆是更省心的方案。

ZDNet AI6天前原文

271

2026年最佳智能戒指：专家实测推荐

新上线

随着可穿戴设备不断向微型化、无感化演进，智能戒指正从概念产品走向主流消费市场。2026年，这一品类迎来了全面升级，**Oura Ring 5** 等新品凭借更精准的健康监测、更流畅的交互体验，重新定义了“指尖上的健康管家”。 ## 实测亮点：Oura Ring 5 领衔在本次测试的多款智能戒指中，**Oura Ring 5** 表现最为突出。其核心升级包括： - **更精准的睡眠追踪**：通过新增的夜间血氧传感器和运动算法，睡眠阶段识别准确率提升约20%。 - **全天候心率监测**：改进的光学模块在运动场景下心率追踪误差低于±2bpm。 - **续航与设计**：保持7天续航的同时，将戒指厚度缩减至2.5mm，佩戴几乎无感。 ## 其他值得关注的选手除 Oura 外，**三星 Galaxy Ring** 在生态联动上优势明显，可直接控制手机拍照、接听电话；**亚马逊 Halo Ring** 则主打情绪监测，利用皮肤电导率分析压力水平。不过，这些产品在健康数据深度上与 Oura 仍有差距。 ## 行业趋势：从计步到医疗级 2026年的智能戒指已不再只是“计步器”，而是向**医疗级可穿戴**迈进。多家厂商获得 FDA 认证，可用于房颤检测、血氧饱和度监测等场景。但需注意，目前所有消费级智能戒指的数据仍不能替代专业医疗设备，仅作为健康参考。 ## 选购建议如果你追求最全面的健康追踪，**Oura Ring 5** 是当前首选；若注重品牌生态，三星 Galaxy Ring 值得考虑；而预算有限时，**亚马逊 Halo Ring** 的性价比不错。不过，智能戒指目前仍面临佩戴舒适度因人而异、部分功能需订阅服务等问题，建议购买前先试戴体验。

ZDNet AI6天前原文

272

机器狗、特斯拉与救援直升机：联合国AI峰会现场直击

新上线

在日内瓦机场区边缘的庞大会议中心里，联合国国际电信联盟（ITU）主办的“AI for Good”全球峰会迎来了第十个年头。绕过现场直播的编程演示、AI速成课程、布满小工具的障碍赛道，以及戴着发光静音迪斯科耳机、边走边听联合国小组讨论的人群，你可能会在“社交区”找到一张名为UFOTECH的旋转座椅——它看起来更像中餐馆里的懒人转盘，而非它本该充当的社交长椅。 ## 理想与现实的对撞 ITU秘书长多琳·博格丹-马丁在主旨演讲中表示：“我们坚信，负责任地部署人工智能，能够帮助解决人类最紧迫的问题——从饥饿到疾病再到全球变暖。但今天，这一信念正受到考验，包括AI自身带来的挑战。”当硅谷高管和AI实验室领导在华盛顿向立法者作证关于超级智能的风险，白宫对芯片实施出口管制时，这场峰会聚焦于更为理想主义的目标。然而，会场内始终伴随着一股忧虑的暗流：不受制约的企业垄断正在通过冷漠的部署，将全球不平等固化为硬编码，并侵蚀人权。对于身处一线的一些人来说，科技行业的乌托邦外衣早已褪去。活动组织Access Now的高级人道主义官员朱利奥·科皮在会场边直言：“我们应该走出天真时代。”他呼吁人道主义和公共部门停止将科技公司视为“最好的朋友”，并指出过去十年中，由公共资金资助的、不透明的数百万美元交易层出不穷。“你甚至无法解释你的技术栈里有什么，因为它一直在变。” ## 展区里的未来图景峰会现场展示了各式各样的AI应用：机器狗在障碍赛道上灵活穿梭，特斯拉汽车停放在展区供人体验，救援直升机模型则象征着AI在灾害应对中的潜力。这些具象化的展示，与会议室里关于治理框架的激烈辩论形成了鲜明对比。与会者试图在技术乐观主义与风险预警之间找到平衡点——毕竟，AI既能用于搜救，也能被滥用于监控与歧视。 ## 全球治理的紧迫命题峰会核心议题之一是：全球治理能否在技术失控之前迎头赶上？与往年相比，今年的讨论更加务实。各方不再空谈“AI造福人类”的口号，而是聚焦于具体问题：如何确保发展中国家也能分享AI红利？如何防止算法偏见加剧社会不公？如何建立跨国界的监管机制？一位匿名参会者表示：“我们需要的不是更多的宣言，而是可执行的规则。技术不会等待外交官们达成共识。”这种紧迫感贯穿全场——从主旨演讲到边会，从技术演示到政策辩论，所有人都意识到，AI的发展速度已经让传统治理模式显得力不从心。 ## 结语走出会场，日内瓦的夕阳洒在停机坪上的救援直升机上。这些机器或许很快将由AI辅助驾驶，但决策的责任终究要落在人类肩上。正如博格丹-马丁所言：“AI带来的挑战，正在考验我们用它行善的能力。”这场峰会没有给出完美答案，但它清晰地揭示了一个事实：在AI的浪潮中，没有人能置身事外。

WIRED AI6天前原文

273

时间图网络可解释性新突破：记忆回溯与拓扑归因方法登顶ICML 2026

新上线

时间图网络在社交网络、金融交易、生物信息等动态场景中广泛应用，但其内部记忆模块——负责记录和更新节点历史状态的核心组件——长期处于“黑箱”状态。现有解释方法多聚焦于拓扑结构，却忽略了记忆模块如何整合历史事件来驱动预测。来自北京邮电大学、里海大学和香港科技大学的研究团队提出了一种名为**记忆回溯与拓扑归因（Memory Backtracking and Topological Attribution）** 的方法，首次系统地将TGN的记忆机制纳入可解释性框架，相关工作已被ICML 2026接收为Spotlight论文。 ## 两大回溯树：从拓扑到记忆的完整归因该方法的核心在于构建两棵互补的归因树： - **拓扑归因树**：捕捉邻居节点及其记忆向量对当前预测的贡献。通过层级分解，模型能够定位哪些相邻节点在特定时间步产生了关键影响。 - **记忆回溯树**：进一步量化历史事件如何塑造节点记忆向量本身。这意味着，即使一个事件发生在较远的时间点，只要它对记忆向量产生持续影响，也能被准确追溯。这种“从拓扑到记忆”的双树结构，使得归因链条能够完整覆盖事件→记忆→预测的全路径。 ## LRP适配与优化目标：解决概率映射失真研究团队将**分层相关性传播（LRP）** 适配到TGN中，确保所有历史事件的总贡献等于模型输出的logits值，从而在数学上保证了归因的忠实性。此外，针对传统top-k选择方法因logits到概率的非线性映射而可能失真的问题，他们设计了专门的优化目标来筛选真正重要的事件，而非简单依赖阈值截断。 ## 九大数据集验证：全面超越现有基线实验覆盖了节点属性预测、链接预测和图分类三类任务，涉及九个公开时间图数据集。结果表明，该方法不仅在忠实度指标上显著优于现有最先进基线，还能提供更符合直觉的解释。例如，在社交网络动态链接预测中，模型能够正确识别出导致好友关系建立的关键早期互动，而非仅仅关注近期事件。 ## 行业意义：从“能用”到“可信”的关键一步时间图网络在金融反欺诈、交通流量预测、推荐系统等领域具有巨大潜力。然而，缺乏可解释性一直制约其在合规要求严格的行业落地。记忆回溯与拓扑归因方法首次揭示了记忆模块中的“因果链”，使开发者能够验证模型是否依赖了合理的业务逻辑，而非偶然的统计关联。随着ICML 2026的认可，这一思路有望成为TGN可解释性的标准范式。

HuggingFace6天前原文

274

LLT：面向偏微分方程算子学习的局部线性Transformer

新上线

近年来，神经算子（Neural Operator）已成为学习偏微分方程（PDE）解映射并加速数值模拟的主流方法之一。其中，基于Transformer的神经算子尤为引人关注，因为注意力机制能够捕捉计算域中的长程依赖关系。然而，标准注意力机制在应用于PDE时存在两大缺陷：**计算复杂度随节点数呈二次增长**，且**缺乏对局部交互的显式偏置**。为克服这些局限，来自特拉维夫大学的研究者Oded Ovadia和Eli Turkel提出了**局部线性Transformer（Local Linear Transformer, LLT）**。该架构创新性地将**线性全局注意力**与**局部空间混合**相结合，并融入了坐标与几何信息，从而在保持全局感知能力的同时，显著提升计算效率和对局部特征的捕捉能力。 ### 性能表现：精度与效率的双重提升 LLT在多个经典PDE问题上进行了评估，涵盖**弹性力学、塑性力学、翼型绕流、管道流以及达西流**等。参考数据来自**有限元、有限体积和有限差分**等不同离散化方法，且同时适用于结构化与非结构化网格。与先前研究中的多种神经算子和Transformer基线相比，LLT在这些问题上取得了**具有竞争力或更低的相对L₂误差**。更值得一提的是其计算效率：在匹配的结构化离散化设置下，LLT每个训练迭代的**墙钟时间相比Transolver降低了1.8至2.5倍**。 ### 大规模应用验证研究团队还将LLT扩展至一个**三维汽车空气动力学数据集**，每个样本包含多达**32,186个非结构化网格点**。实验结果表明，LLT在该大规模复杂问题上依然保持高精度和高效性，证明了其处理实际工程问题的潜力。 ### 行业意义与未来方向 LLT的提出为PDE求解领域提供了一种**准确且计算高效的算子学习方案**，尤其适用于跨离散化类型、网格类型和问题设置的场景。相比传统Transformer，LLT通过局部线性化设计有效缓解了二次复杂度瓶颈，同时保留了全局注意力对长程依赖的建模能力。这一工作也反映出AI for Science领域的一个趋势：**在通用架构基础上，融入领域先验知识（如局部性、几何结构）来提升模型在科学计算中的适用性**。未来，类似LLT的混合架构有望在流体力学、固体力学、气候模拟等更广泛的实际应用中发挥关键作用。

HuggingFace6天前原文

275

ReCoLoRA：频谱感知递归整合，破解大模型持续微调中的灾难性遗忘

新上线

大语言模型在连续多任务微调时，常因新任务覆盖旧知识而出现灾难性遗忘。最新研究 ReCoLoRA 提出一种频谱感知的递归整合框架，通过动态重分解权重空间，在不增加参数量的前提下有效保留历史任务能力，在四个 7-8B 级模型上取得了领先的持续学习效果。 ## 问题背景：LoRA 在持续学习中的困境参数高效微调方法（如 LoRA）虽然能低成本适配单一任务，但在面对任务序列时，新任务的低秩更新会不断叠加在相同的冻结权重上，导致旧任务特征被覆盖。这种“遗忘”问题限制了 LLM 在多轮微调场景中的实用价值，例如对话系统的持续人格更新或企业级模型的分阶段领域适配。 ## ReCoLoRA 的核心创新：递归整合与频谱感知 ReCoLoRA（Recursive Consolidation of Low-Rank Adapters）从两个维度解决上述问题： 1. **频谱感知初始化**：对预训练权重进行随机 SVD 分解，利用肘部准则（elbow criterion）自动选择每层有效秩，优先适配主成分子空间，再开放残差容量。 2. **递归整合机制**：在每个新任务开始前，ReCoLoRA 重新分解当前的“有效权重”（而非原始权重），将其拆分为三个部分：冻结残差、缓慢更新的主成分、以及全新的适配器。这样，新任务从已经吸收了前序知识的模型状态出发，实现渐进式整合。该方法的优势在于：无需记忆旧任务数据，也不增加推理时的参数量，仅通过改变权重分解方式实现知识保留。 ## 实验结果：全面超越基线团队在六个连续 GLUE 任务序列上测试了四个 7-8B 级模型（如 LLaMA-2、Mistral 等），与 LoRA、PiSSA、AdaLoRA、DoRA 等方法进行对比。结果显示： - ReCoLoRA 在 **4 个主干模型中的 3 个上取得了最佳最终平均分**； - 训练参数更少，效率更高； - 作为上限的 oracle-routed 任务银行变体，在完全任务隔离条件下展现了理论最优性能。此外，频谱感知的秩选择机制使模型能够自适应不同层的容量需求，避免了人工调参。 ## 行业价值与未来方向持续微调是 LLM 落地的关键瓶颈之一。ReCoLoRA 提供了一种轻量级、无需数据回放的解决方案，尤其适合隐私敏感或数据存储受限的场景。未来工作可探索将该框架扩展到跨模态模型（如视觉-语言模型），或与动态架构结合实现更灵活的容量分配。论文代码已开源（链接见原文），为社区提供了可直接复现的基线。

HuggingFace6天前原文

276

Omni-Sleep：基于中枢与自主神经层级对比学习的睡眠基础模型

新上线

## 从生理学出发，重新定义睡眠基础模型现有睡眠基础模型在处理多模态生理信号（如脑电图、心电图、呼吸等）时，往往采用拓扑无关的融合方式，忽视了中枢神经系统（CNS）与自主神经系统（ANS）之间固有的生理层级结构。近日，一项发表于 arXiv 的研究提出了 **Omni-Sleep**——一个利用 CNS/ANS 分区作为生理先验的睡眠基础模型，在表征学习中引入拓扑约束，从而更准确地捕捉睡眠过程中的脑-体动态。 ## 三大学习目标：层级对比与时间建模 Omni-Sleep 的核心在于三个精心设计的训练目标： - **系统内一致性**：在神经信号（如 EEG、EOG、EMG）和心肺信号（如 ECG、呼吸）内部，分别学习共享的子系统级表征，捕捉同一系统内不同通道的共性因素。 - **系统间同步性**：对齐 CNS 与 ANS 的表征轨迹，建模脑与身体之间的动态耦合关系。 - **潜空间掩码时间建模**：通过掩码预测任务，学习长时程的睡眠动态，提升对时间依赖关系的建模能力。这种设计使得模型能够从超过 **10 万小时** 的多中心多模态多导睡眠图（PSG）数据中，学习到具有生理意义的结构化表征。 ## 性能全面超越现有基线在睡眠分期和多疾病分类任务上，Omni-Sleep 均表现出色。与当前最强的基础模型基线相比，它在标签效率、跨数据集泛化能力以及对缺失模态的鲁棒性方面实现了显著提升。即使在某些模态缺失的情况下，Omni-Sleep 依然能保持较高的分类精度，这在实际临床场景中尤为重要——因为患者数据常因设备或记录条件限制而不完整。 ## 生理层级先验的价值 Omni-Sleep 的成功证明了将生理学知识融入模型设计的巨大潜力。传统方法将不同信号一视同仁，而 Omni-Sleep 通过显式利用 CNS/ANS 分区，让模型学会区分“大脑的内部状态”与“身体的自主调节”，从而更准确地表征睡眠的不同阶段和病理特征。研究者已在 GitHub 上开源代码（论文中提供的链接），这将推动睡眠医学领域的基础模型研究，并为其他生物医学信号处理任务提供新思路。 ## 小结 Omni-Sleep 并非简单的“更大数据+更大模型”，而是从睡眠生理学本质出发，设计了匹配生物系统的表征学习框架。对于睡眠研究者而言，它可能意味着更精准的自动分期工具；对于 AI 从业者，则是一次将领域知识与自监督学习巧妙结合的示范。未来，这一思路有望扩展到其他依赖多模态生理信号的领域，如癫痫监测、重症监护等。

HuggingFace6天前原文

277

不确定性门控选择：让块稀疏注意力不再“短视”

新上线

## 一句话总结 **块稀疏注意力**通过为每个查询选择 top-k 键块来降低长上下文语言模型的计算复杂度，但传统 top-k 截断在分数接近时可能遗漏关键信息。新提出的**不确定性门控路由器**能在这种“犹豫”时刻自动增加保留块数，在多个模型上显著提升召回率，且几乎不增加额外延迟。 ## 背景：长上下文的效率与精度之困处理超长文本（如 128K token）时，标准 Transformer 的 O(N²) 注意力计算成本过高。块稀疏注意力（Block-sparse Attention）是一种主流加速方案：它将键划分为块，对每个查询只保留得分最高的 k 个块，从而将复杂度降至 O(Nk)。然而，这种“一刀切”的 top-k 选择存在固有缺陷——当第 k 块与第 k+1 块得分非常接近时，选择器仍会硬性截断，而那个被丢弃的块可能恰好包含关键证据，且后续层无法恢复。 ## 方法：给注意力加上“犹豫”机制 Thomas Rossi 提出的 **Uncertainty-gated selection**（不确定性门控选择）核心是一个 **价值信息路由器**，它衡量每个查询在 top-k 截断时的决策置信度。具体而言，计算第 k 块与第 k+1 块得分之差，差值越小说明决策越“犹豫”。对于这些低置信度查询，路由器将保留的块数加倍（即 2k），从而在不全局增加预算的前提下，为关键查询提供更多上下文。该路由器与现有块评分方法（如 Quest）正交，可直接叠加使用。 ## 实验结果：显著提升召回，逼近全注意力在 **LongBench-v2 medium**（n=215 全子集）上，路由器加持的 Quest 达到 **配对召回率 0.75**，而传统 top-k 仅为 0.47，提升 28 个百分点（McNemar 检验 p<0.01）。在 **RULER NIAH multikey** 任务中，相同上下文长度下，路由器结果与全注意力（dense）仅差 2 个百分点。该提升在 **Qwen2.5、Mistral-Nemo、Qwen3.6** 四种模型、三种架构上均得到复现。在 128K 上下文下，路由器使 Qwen2.5-7B-1M 和 Qwen3.6 分别保持全注意力精度的 **0.81 和 0.89**，而传统 top-k 在 Qwen2.5-7B-1M 上仅剩 0.09。 ## 效率：几乎无额外开销融合选择与核的流水线在保持高精度的同时，运行时间为全注意力的 **0.62 倍（Qwen2.5）和 0.80 倍（Qwen3.6）**，证明了该方法的实用价值。 ## 总结这项研究直击块稀疏注意力的“短视”痛点，通过轻量级的不确定性门控动态调整保留块数，在长上下文场景下实现了精度与效率的更好平衡。对于需要处理超长文档、代码库或多轮对话的 LLM 应用，该技术有望成为标准组件。

HuggingFace6天前原文

278

SHIFT：面向不完整与异构基因组数据的生存预测新方法

新上线

在精准肿瘤学中，跨机构部署基因组预测模型常因测序面板差异导致特征结构性缺失，现有方法或限制分析共有基因、或剔除不完整病例、或依赖测试时插补，均影响鲁棒性与多中心数据利用。近日，研究团队提出 **SHIFT（Survival prediction Handling Incomplete Features using Transformer）**，一种无需测试时插补即可直接从缺失基因组输入预测的生存模型。 ## 核心思路：缺失感知的Transformer架构 SHIFT 将每个基因组特征独立表示，通过**掩码自注意力机制**与**特征可用性掩码**，使模型仅基于观测到的输入进行预测。训练时引入**可变比率特征掩码**，模拟不同缺失模式，增强对异构缺失的鲁棒性。该方法无需像传统方案那样限制分析范围或丢弃数据，而是将缺失本身作为模型输入的一部分。 ## 实验验证：跨队列泛化能力突出研究团队在**胶质母细胞瘤**与**肺鳞状细胞癌**数据集上评估 SHIFT，并进行跨多个队列的外部验证，包括极具挑战的**严重跨队列面板不匹配**场景。结果显示，SHIFT 在泛化性能上显著优于标准生存基线模型与基于插补的方法，且**单一模型即可适配不同特征集**。此外，在模型开发阶段纳入不完整队列的病例数据，能进一步提升外部数据上的表现，表明部分观测队列无需被排除在模型构建之外。 ## 行业意义：推动多中心精准医疗落地当前多中心基因组数据整合面临两大障碍：**测序技术差异**导致的特征缺失，以及**数据隐私**限制下的模型迁移。SHIFT 提供了一种实用策略——通过缺失感知建模，在不依赖插补或数据对齐的情况下实现稳健预测。这为真实世界中医疗记录不完整、测序方案各异的场景提供了可行的技术路径，有望加速精准肿瘤学从单中心研究向多中心大规模应用的转化。 ## 小结 SHIFT 以 Transformer 架构为核心，巧妙地将特征缺失转化为可学习的信号，在保持预测性能的同时大幅提升了模型的适用性。未来，该方法可进一步扩展至其他组学数据（如转录组、蛋白质组），并与其他缺失处理机制（如生成式插补）结合，构建更通用的临床决策支持框架。

HuggingFace6天前原文

279

Jet-Long：动态双焦RoPE实现高效长上下文扩展

新上线

大语言模型正被广泛部署于检索增强生成、仓库级代码编写和智能体工作流等长上下文场景。在这些应用中，累积的推理与工具调用痕迹常常将输入长度推至预训练窗口的十倍以上，使得零样本上下文扩展成为开源权重模型的主要部署路径。然而，现有零样本方法大多预先固定单一重缩放因子——激进的因子会牺牲短上下文保真度，保守的因子则在长上下文处失效。针对这一困境，来自MIT的研究团队提出了 **Jet-Long**，一种无需微调的零样本方法。其核心思想是**双焦位置编码**：将注意力计算拆分为一个局部RoPE忠实窗口和一个远程窗口。局部窗口严格保留原始旋转位置编码，确保短输入时模型行为与基座完全一致；远程窗口的重缩放因子则根据当前序列长度动态调整，在长输入时实现平滑外推。通过**容斥注意力合并**与**即时RoPE校正旋转**，双焦结构在推理时几乎不引入额外开销。研究团队将其融合为单个CuTe内核，在H100 GPU上，长上下文预填充吞吐量达到FlashAttention 2的1.39倍，接近Hopper专属的FlashAttention 4；单批生成时，各长度下的开销均不超过4%。实验在**Qwen3-1.7B/4B/8B**模型上展开，上下文长度达128K。在RULER评测中，Jet-Long在1.7B/4B/8B规模上分别领先最强基线**+4.79、+2.18、+2.03个百分点**；在HELMET-RAG基准上取得最佳总体准确率（该基准被HELMET识别为下游长上下文性能最有效的预测指标）；并在PG-19困惑度指标上达到最低值。此外，Jet-Long可泛化至**混合注意力架构**（如Jet-Nemotron），无需重新训练即可进一步改善长上下文效果。其超参数鲁棒性强，易于部署，为长上下文LLM的实际应用提供了高效、可靠的解决方案。

HuggingFace6天前原文

280

长尾胸部X光分类中，阈值下的亚组漏诊：谁被遗漏了？

新上线

在胸部X光（CXR）分类任务中，即使模型在排序指标上表现良好，仍可能将罕见阳性患者置于阈值之下，尤其是在特定亚组中。一篇发表于arXiv的新研究将这一部署前的公平性问题作为审计问题来探讨：当长尾多标签CXR模型从分数转换为决策时，谁被遗漏了？研究团队在**VinDr-CXR**和**MIMIC-CXR/CXR-LT**两个数据集上，使用一种“诊断阶梯”方法，分别考察了类别级长尾损失、亚组感知加权、群体鲁棒性和阈值选择的影响。在VinDr-CXR上，采用**组尾加权**结合**尾感知阈值**，将尾部假阴性率（FNR）从0.665降至0.269，性别最差组FNR从0.705降至0.157，年龄最差组FNR从0.822降至0.133，同时宏观平均精度（macro-mAP）从0.611提升至0.635。在MIMIC-CXR/CXR-LT上，相同的分数到阈值比较将尾部FNR从0.866降至0.741，并降低了性别、年龄、种族和保险类型的最差组FNR；然而，残余的漏诊率仍然较高。通过配对Bootstrap对比验证了VinDr上阈值化FNR的降低效果，而GroupDRO参考运行表明，仅靠聚合群体鲁棒性并不能消除该场景下的罕见亚组漏诊。研究支持一个狭窄的审计主张：CXR中的罕见标签公平性**共同取决于发现类别、亚组和操作阈值**，而非仅依赖于标签频率或排序指标。 ### 关键发现 - **问题本质**：长尾分布下，模型对罕见阳性患者的漏诊存在亚组偏差，传统排序指标无法反映阈值后的公平性问题。 - **解决方案**：通过组尾加权和尾感知阈值调整，可显著降低最差亚组的假阴性率，但无法完全消除漏诊。 - **剩余挑战**：即使使用GroupDRO等鲁棒性方法，罕见亚组的漏诊仍难以根除，表明阈值选择和亚组特异性处理至关重要。 ### 行业意义该研究为医疗AI部署前的公平性审计提供了方法论框架，强调了从“分数排序”到“实际决策”的转换过程中，必须考虑亚组差异和阈值效应。对于CXR分类系统，仅追求整体性能提升可能掩盖对特定人群（如老年、女性或少数种族）的诊断不足，需引入细粒度的公平性评估。

HuggingFace6天前原文