AI 资讯

每日聚合最新人工智能动态

901

粒度感知的脑电特征框架：为精神病理维度预测提供新思路

新上线

脑电图（EEG）作为一种非侵入性技术，被广泛用于探索精神病理的神经生理学基础。然而，不同EEG范式与特征粒度之间的系统证据仍然匮乏。近期，一篇发表在arXiv上的研究提出了一种**粒度感知的EEG特征管道**，将多尺度描述符组织为全局、区域和通道三个层次，并基于健康大脑网络（HBN）队列评估了对四种精神病理维度（p因子、内化、外化、注意问题）的预测能力。该研究涵盖了四种EEG范式，包括静息态和任务态数据。考虑到儿童精神病理的异质性以及问卷评分的有限可靠性，研究者将这一设定定位为**可行性测试**而非临床筛查。结果显示，基于树的模型与粒度平衡的特征选择在部分条件下优于传统方法，但效应量仍然较小。所选标志物的可视化揭示了维度特异性的空间和频谱模式，与现有神经生理学知识大体一致。在独立的PEARL队列上进行的跨数据集验证表明，所提出的选择原则在协议变化下仍具有技术可行性，但**不宣称跨数据集泛化能力**。整体而言，多尺度EEG特征包含与维度精神病理相关的微弱但可检测的信号，粒度感知选择有望成为未来基于EEG的表型研究中有效的特征降维策略。 ### 方法亮点该框架的核心在于**粒度层次化设计**： - **全局特征**：捕捉整个大脑的整体活动模式； - **区域特征**：反映特定脑区（如前额叶、颞叶）的活动； - **通道特征**：保留单个电极的精细信息。通过**粒度平衡的特征选择**，研究者避免了传统方法中偏向某一尺度的问题，从而更全面地挖掘EEG信号中的病理信息。 ### 结果与意义尽管预测效果有限，但研究证实了多尺度EEG特征在精神病理维度预测中的潜力。这一方法为未来EEG研究提供了可参考的框架，尤其是在处理高维、低信噪比的生物信号时。研究者强调，该工作更侧重于**方法学验证**，而非直接临床应用。 ### 局限与展望研究指出，当前模型的效应量较小，可能受到样本量、数据质量以及精神病理维度复杂性的影响。未来研究可结合深度学习或更大规模数据集进一步提升预测性能。此外，跨数据集验证的初步成功为方法的通用性提供了初步证据，但仍需更多独立验证。总之，这项研究为利用EEG进行精神病理评估提供了新的分析视角，**粒度感知特征框架**的提出有望推动精准精神医学的发展。

HuggingFace14天前原文

902

LiNO：基于提升方案的多分辨率神经算子，攻克多尺度物理建模难题

新上线

近日，一篇发表在 arXiv 上的论文提出了一种名为 **LiNO（Lifting Neural Operator）** 的新型神经算子架构，旨在解决现有神经算子难以同时捕捉全局动力学与精细尺度结构的痛点。该研究由 Himanshu Pandey 等人完成，核心创新在于将**第二代小波提升方案**引入神经算子设计，实现了数据驱动的自适应多分辨率分解。 ## 背景：神经算子的机遇与挑战神经算子是一类学习函数空间之间映射的深度学习模型，能够直接从数据中学习微分方程的解算子，从而预测整个参数族对应的解，而非单个实例。然而，现有神经算子（如 FNO、DeepONet）在处理包含多尺度特征的物理问题时往往力不从心——要么过度平滑丢失细节，要么计算成本过高。 ## LiNO 的核心设计：提升变换与多分辨率空间 LiNO 的关键在于将**提升方案（lifting scheme）**参数化，使其成为可学习的变换。提升方案是一种构造小波的方法，其特点是计算高效且保证**精确可逆**。LiNO 通过学习数据中的自适应提升变换，将输入函数分解为**粗尺度系数**和**方向细节系数**，并在该多分辨率空间中分别演化这两类系数。这种“尺度感知”的建模方式使得算子能够同时处理全局趋势和局部振荡。与传统的固定小波基不同，LiNO 的变换是**数据驱动**的，能够根据底层解函数的特性自动调整分解方式。同时，由于变换可逆，信息在分解和重构过程中无损，确保了多尺度学习的保真度。 ## 性能评估：覆盖多类物理现象研究者在五个经典基准上对 LiNO 进行了测试，涵盖了不同物理行为： - **Darcy 流**（多孔介质流动） - **Poisson 方程**（椭圆型问题） - **Allen-Cahn 方程**（相场模型） - **可压缩 Navier-Stokes 方程**（流体动力学） - **Gray-Scott 反应-扩散系统**（图灵斑图）这些基准涉及多尺度现象、输运主导动力学和混沌系统。实验结果表明，LiNO 在所有任务上均取得了**与最先进神经算子相当或更优**的表现，尤其在捕捉精细结构和长时间演化方面展现出明显优势。 ## 意义与展望 LiNO 为科学机器学习提供了一条有前景的路径：通过自适应多分辨率算子，有望在气候模拟、材料设计、流体力学等需要同时关注大尺度演化与小尺度细节的领域发挥重要作用。未来，该方向可能进一步结合物理信息约束或无监督学习，提升泛化能力与数据效率。

HuggingFace14天前原文

903

SwarmResearch：用群体智能编排编码代理，实现开放式探索突破

精选

## 核心发现：单一长程代理的“视野局限” 在AI辅助编程领域，长时运行的编码代理（如AutoResearch）能够持续为开放式问题发现优化方案。然而，一个关键缺陷始终存在：这类代理倾向于**收敛到单一的高级方法**，随后仅在该方法内进行低层级的局部编辑，而忽略了其他可能更优的解决路径。最新提交至arXiv的论文《SwarmResearch: Orchestrating Coding Agents for Open-Ended Discovery》指出，这一行为源于两个设计层面的选择： 1. **单一代理的上下文累积**——随着运行时间增长，代理的上下文窗口被早期决策主导，限制了后续探索的多样性。 2. **单一程序状态暴露**——代理每次只编辑一个程序状态，缺乏并行探索不同方向的能力。 ## SwarmResearch：牧羊人+搜索代理的群体架构为突破这一瓶颈，研究团队提出了**SwarmResearch**框架，其核心是一个“编排者-子代理”架构： - **Shepherd Agent（牧羊人代理）**：拥有全局上下文，负责制定高级策略，并动态分配任务给多个子代理。 - **Search Agents（搜索代理）**：每个搜索代理在独立的 **git 分支** 中运行，拥有局部上下文，专注于探索特定方向。这种设计实现了**探索与利用的分离**：牧羊人代理从全局视角决定何时深入一个方向、何时转向新方向，而搜索代理则专注于局部优化，互不干扰。 ## 实验验证：13/15任务优于现有方法在针对**开放式优化任务**的测试中，SwarmResearch 在 **13/15 个任务**上发现了优于或媲美当前最先进的 LLM 引导进化算法和多代理技术（如 GPT-4 驱动的多智能体系统）的解决方案。研究强调，其优势源于**更高层次的探索**——不是通过蛮力增加计算量，而是通过编排引导，让代理在不同搜索深度自适应地调整并行度。 ## 行业意义：从“堆算力”到“调架构” 当前AI编码代理的竞争正从单一模型能力转向**系统架构设计**。SwarmResearch 的启示在于： - **上下文管理**：单一长上下文并非万能，合理的上下文隔离与全局协调可能更高效。 - **并行策略**：固定并行度（如同时运行多个代理）不如动态调整——牧羊人代理可根据搜索阶段决定是增加探索者还是聚焦优化。 - **开源潜力**：论文代码已公开（arXiv HTML版本），为社区提供了可复现的基线。 ## 局限与展望目前 SwarmResearch 主要面向**编程优化任务**（如算法改进、代码性能调优），其架构是否适用于更广泛的开放式发现（如科学假设生成、设计空间探索）仍有待验证。此外，牧羊人代理本身的决策质量依赖于底层LLM的推理能力，未来或可引入元学习或强化学习来进一步优化编排策略。 --- **一句话总结**：SwarmResearch 通过“一个全局指挥官+多个局部行动者”的群体架构，解决了长时编码代理的探索收敛问题，为开放式AI发现提供了更高效的路径。

Anthropic14天前原文

904

QuantFlow：基于联邦Mamba的后Transformer时序预测基础模型

新上线

时间序列预测在金融、能源、交通、公共卫生和工业监测等领域支撑着关键决策。近期涌现的基础模型虽提升了跨任务迁移能力，但大多依赖中心化数据和Transformer注意力机制，在处理长序列、高维度和隐私敏感信号时捉襟见肘。来自多所机构的研究团队提出了一种名为 **QuantFlow** 的概率预测框架，巧妙融合了倒置序列嵌入、双向Mamba状态空间解码器、分位数回归与联邦学习，为时序预测领域带来了新的解题思路。 ## 核心设计：倒置嵌入 + 双向Mamba QuantFlow 的架构设计颇具巧思。首先，它采用 **倒置序列嵌入** 策略：将每个变量在整个观测窗口上的时间步进行嵌入，而非将同一时间步的所有变量拼合。这种处理方式能更好地捕捉变量自身的长期依赖关系。随后，嵌入后的序列分别沿正向和反向送入 **双向Mamba 状态空间解码器**。Mamba 作为近年来兴起的状态空间模型，凭借线性复杂度的序列建模能力，在长序列任务上展现出超越 Transformer 的潜力。QuantFlow 通过双向处理，使模型能同时感知过去和未来的上下文信息。最终，解码器输出被投影到 **五个条件分位数**（如 10%、25%、50%、75%、90%），从而实现概率预测，不仅给出点估计，还提供不确定性区间。此外，团队引入 **TSMixup** 数据增强方法，通过狄利克雷加权插值增加时间序列多样性，同时保持序列的结构完整性。 ## 联邦学习：隐私保护下的分布式训练 QuantFlow 的另一大亮点是内置 **联邦学习** 机制。在 20 个客户端的非独立同分布（non-IID）数据部署中，模型仅需 **三轮通信** 即可保持有用精度，且原始数据始终留在本地。这意味金融机构、医院等数据敏感方可以协作训练强大模型，而无需共享原始记录，极大拓展了实际应用场景。 ## 实验结果：优势与局限并存在加密货币、交通流量、电力负荷、电力变压器温度（ETT）、流感和天气等六类数据集上，QuantFlow 取得了有竞争力的结果。具体指标上，在 **ETTm1** 数据集上均方误差（MSE）为 **0.2834**，在 **Weather** 数据集上为 **0.2218**，优于或持平于同类基线。不过，论文也坦诚指出了当前版本的局限：在处理 **不规则的流行病学信号** 和 **超长预测区间** 时，QuantFlow 的泛化能力仍有不足。这提示状态空间模型在极端不规则采样和极长序列场景下，可能还需要更精细的设计。 ## 行业启示：后Transformer时代的新方向 QuantFlow 的发布正值 AI 社区对 Transformer 注意力机制进行反思的时期。Mamba 等状态空间模型凭借线性复杂度，已在语言建模和长序列任务中初露锋芒。QuantFlow 将这一思路引入时序预测，并叠加联邦学习与概率输出，为构建 **可扩展、可量化不确定性、隐私友好** 的时序基础模型指出了可行路径。对于金融风控、智慧电网、流行病监测等需要兼顾准确性与数据合规的行业而言，QuantFlow 所代表的技术方向值得密切关注。

HuggingFace14天前原文

905

三菱日联金融集团携手OpenAI，迈向“AI原生”银行之路

精选

日本最大金融集团之一三菱日联金融集团（MUFG）正通过部署ChatGPT Enterprise，加速向AI原生企业转型。截至2026年5月，已有约35,000名三菱UFJ银行员工在日常工作中使用该工具。MUFG集团CDTO山田忠史表示，AI将从根本上改变金融的本质，而OpenAI的技术与协作让这一愿景成为可能。从2024年10月起，双方开始合作，计划通过生成式AI实现运营现代化、提升效率，并创造全新的客户体验。MUFG不仅将AI视为效率工具，更将其视为拓展人类思维与创造力的方式，致力于构建员工与AI共同学习的文化。 ## 从试点到规模化：35,000名员工的AI实践 2024年10月，MUFG与OpenAI启动合作，探索生成式AI在金融业务中的应用。2026年初，三菱UFJ银行开始分阶段部署ChatGPT Enterprise，目标覆盖约35,000名员工。这一规模在金融行业属于前列，体现了MUFG对AI落地的决心。 MUFG集团CDTO山田忠史强调：“我相信AI将从根本上改变金融的本质。要让AI快速融入组织，关键在于营造一个每位员工都能自然使用AI的环境和文化。”为此，MUFG采取了自上而下的领导承诺与自下而上的员工赋能相结合的策略。 ## OpenAI：从设计到落地的深度伙伴在选择AI合作伙伴时，MUFG看重的是OpenAI的前沿技术与协作精神。山田忠史评价道：“OpenAI与我们共享成为AI原生公司的愿景。凭借其前沿技术和模型，我们看到了一个能将愿景变为现实的合作伙伴。”OpenAI不仅在技术层面提供支持，更从服务设计到实施落地全程参与，帮助MUFG同时推进客户服务创新和银行业务转型。 ## AI原生：超越效率工具的战略定位 MUFG对AI的定位远不止于提升效率。集团认为，AI是延伸人类思维和创造力的方式，员工与AI可以相互学习，共同构建更好的金融服务。这种理念体现在三个方面： - **运营转型**：通过ChatGPT Enterprise优化内部流程，降低重复性工作耗时。 - **客户体验创新**：利用AI提供个性化、智能化的金融服务，例如智能客服、投资建议等。 - **文化变革**：培养“AI原生”思维，让每位员工都能在日常工作中自然使用AI，形成人机协作的新工作模式。 ## 金融业的AI竞赛：MUFG的先行者优势在全球金融业，AI已成为竞争焦点。MUFG的大规模部署不仅提升了内部效率，更可能在客户服务、风险控制等领域形成差异化优势。通过OpenAI的先进模型，MUFG有望在零售银行、财富管理、信贷审批等场景中率先推出AI驱动的创新服务。值得注意的是，MUFG的转型并非一蹴而就。从2024年10月开始探索，到2026年初的规模化部署，整个过程体现了金融机构在技术应用上的谨慎与稳健。随着35,000名员工的逐步接入，MUFG正从“使用AI”迈向“成为AI原生”的新阶段。 ## 未来展望 MUFG的案例为金融行业提供了重要参考：AI原生不是简单的工具部署，而是涉及战略、文化、流程的系统性变革。随着更多员工熟悉AI工具，MUFG有望在内部创新和外部服务上释放更大价值。OpenAI与MUFG的合作也表明，前沿AI技术正在深入垂直行业，推动传统金融服务的重构。

OpenAI14天前原文

906

澳大利亚支付巨头AP+用ChatGPT和Codex加速支付复杂性处理

精选

澳大利亚支付与身份基础设施公司 **Australian Payments Plus（AP+）** 近日分享了其利用 **ChatGPT Enterprise** 和 **Codex** 提升团队效率的实践成果。作为连接数百万用户日常支付的核心枢纽，AP+ 面临着规则、技术规范、运营流程、网络安全及监管合规等多重复杂挑战，准确性与问责制至关重要。 ### 效率提升：从数据到行动 AP+ 在全公司范围内推广 ChatGPT Enterprise，帮助员工快速合成大量上下文信息，将技术性内容转化为清晰的决策、文档和面向成员的指导。调查显示，**77% 的受访员工每周节省超过 2 小时**，**80% 的员工报告创造力或工作质量有所提升**。 ### Codex 加速技术调查对于产品、工程和技术团队，**Codex** 成为下一阶段的关键工具。在一次对账实例中，团队利用 Codex 追踪系统日志与对账数据中微妙的时间戳不一致问题，将原本需要数天的调查缩短至 **30 分钟**。此前类似问题通常需要 **4 小时** 手动排查。此外，Codex 还被用于构建工作模拟，**原来需数天至数周的任务，现在一天内即可完成**。 ### 安全与风险：AI 辅助而非替代 AP+ 还在探索 Codex 在安全团队中的应用，包括威胁建模、漏洞分析、警报分类以及跨系统可见性。公司强调，**AI 的目标不仅是提高效率，更是帮助员工发挥最佳水平**，同时保持人类专家对风险决策的最终责任。 ### 行业启示在支付行业，速度与准确性并重。AP+ 的实践表明，大型语言模型（LLM）和代码生成工具能够显著降低重复性认知负荷，使技术人员专注于更高价值的判断工作。随着金融监管日益严格，这种“人机协作”模式或将成为行业标配。

OpenAI14天前原文

907

首个AI自主实施的勒索攻击？真相是：人类依然全程在幕后

新上线

上周，云安全公司Sysdig声称记录了首例完全由AI代理自主执行的勒索软件攻击，代号JadePuffer。报道称该AI代理在没有人类干预的情况下，独立完成了从入侵服务器、窃取凭证、横向移动到加密文件并撰写勒索信的全过程。然而，Sysdig威胁研究高级总监Michael Clark在最新采访中澄清：人类依然深度参与——只是未负责技术执行环节。人类选择了攻击目标、搭建了命令控制服务器和用于存储窃取数据的临时服务器，甚至攻击所用的凭证也来自先前的一次独立入侵，并非AI自行获取。 **攻击的技术细节依然令人瞩目**。该AI代理利用开源LLM构建工具Langflow的已知漏洞进入系统，随后转向生产环境MySQL服务器，利用另一个已知漏洞获取管理员权限。它加密了超过1300条配置记录，不仅自行撰写了勒索信，还留下了比特币收款地址。Sysdig未透露受害目标的具体身份。 **更值得关注的是攻击过程的透明度和速度**。AI代理在31秒内修复了一次失败的登录尝试，并在代码注释中以自然语言全程记录自身的推理过程。关于攻击中使用多个模型的疑问，Clark澄清：从窃取的密钥中发现了OpenAI、Anthropic、DeepSeek和Gemini等多个平台的API key，但这些只是攻击过程中窃取的数据，并非驱动攻击的模型。 **这一事件揭示了AI在网络安全领域的新边界**。虽然尚未实现完全自主的犯罪闭环，但AI代理在特定技术环节的自主执行能力已远超预期。安全行业需要重新审视防御策略：不仅要防范人类黑客，还要应对能够快速学习、自主决策并记录自身推理过程的AI攻击者。 **小结**：JadePuffer并非“无人值守”的完全自主攻击，但它展示了AI代理在攻击执行层面的潜力。未来，随着AI能力的提升，人类可能只需提供目标和初始入口，其余环节均可由AI独立完成。这既是警示，也是安全技术演进的方向。

TechCrunch14天前原文

908

美国投资者即将迎来AI存储芯片巨头SK海力士的IPO

新上线

韩国存储芯片制造商SK海力士（SK Hynix）正计划在美国进行首次公开募股（IPO），预计将于本周五开始交易。该公司将发行约1780万股美国存托凭证（ADR），每份代表十分之一普通股，预计筹集资金约28亿美元。SK海力士是三星和美光的竞争对手，其业绩和股价均因AI需求激增而大幅上涨。第一季度营收同比增长近200%，股价今年已上涨约260%。AI系统对内存需求极高，尤其是高带宽内存（HBM）、DRAM和NAND芯片，导致市场供不应求，被称为“RAMageddon”。苹果高管表示，芯片短缺已迫使其提高Mac和iPad的价格。韩国科技公司（包括SK海力士和三星）已承诺投资超过5500亿美元建设新产能，但这存在风险：当产能建成时，AI内存需求可能已发生变化，导致供过于求。目前，华尔街正在寻找下一个“英伟达”，存储芯片制造商是最接近的选择之一。美光科技（Micron）过去一年股价上涨近700%，市值超过1万亿美元，同样受益于AI驱动的内存需求。

TechCrunch14天前原文

909

一键从 Hugging Face 直达 Amazon SageMaker Studio，模型部署从未如此简单

新上线

Amazon SageMaker AI 与 Hugging Face 宣布推出深度链接集成，开发者现在只需一次点击，即可从模型发现直接进入 SageMaker Studio 进行实验。无论是微调基础模型还是部署推理端点，选定的模型将自动预加载，环境完全配置就绪，省去了以往手动创建域、配置 IAM 权限、申请 GPU 配额等繁琐步骤。这一集成大幅降低了从灵感到实验的摩擦，为企业和开发者提供了从开源模型到企业级部署的最短路径。 ## 一键直达，零配置启动在 Hugging Face 上浏览模型时，支持的模型页面会新增 **Customize on SageMaker AI** 和 **Deploy on SageMaker AI** 按钮。点击后，开发者将直接跳转到 SageMaker Studio 控制台，系统在数秒内自动预配置新域和权限，并将模型上下文完整传递。此前，从 Hugging Face 发现模型到在 SageMaker 上运行需要经历多个步骤：打开 AWS 管理控制台、创建 SageMaker 域、配置 IAM 权限，有时还需申请 GPU 配额。对于追求快速迭代的开发者来说，这些摩擦严重拖慢了从灵感走向实验的速度。 ## 开源模型与企业云的完美结合 Arcee AI 创始人兼 CEO Mark McQuade 评价道：“我们构建开放模型，让开发者和企业真正拥有他们运行的东西：检查权重、用自己的数据后训练、按自己的方式部署。这次集成将这一承诺推进到最后一英里。从 Hugging Face 上的开放模型一键进入 SageMaker Studio，然后在自己的 AWS 环境中微调或部署，无需任何额外配置——这正是开放模型一直缺少的体验。你拥有的开放权重，在你控制的云中运行。这正是我们的客户一直要求的组合。” ## 三大新能力，缩短从发现到部署的路径此次发布引入了三项关键能力： 1. **深度链接直达 SageMaker Studio**：Hugging Face 模型页面上新增的操作按钮直接映射到 SageMaker Studio 工作流，点击后即进入对应的定制化或部署页面。 2. **自动环境配置**：SageMaker AI 自动预配置域和权限，无需手动设置，数秒内即可使用。 3. **模型上下文无缝传递**：选定的模型信息自动填充到 Studio 工作流中，开发者无需再次搜索或配置。 ## 对 AI 开发者的意义这一集成对 AI 开发者和企业用户意义重大。首先，它显著降低了入门门槛，让开发者能更快地从模型探索过渡到实际实验。其次，它强化了开源模型与云原生工具的结合——开发者可以在 Hugging Face 上发现最新模型，然后立即在 AWS 上使用企业级基础设施进行微调和部署，同时保持对数据和模型的控制。最后，对于需要频繁实验和迭代的团队，这一功能可以节省大量时间，加速从研究到生产的转化。随着生成式 AI 和基础模型领域的快速发展，缩短从发现到部署的周期已成为竞争关键。AWS 与 Hugging Face 的这一深度集成，正是对开发者痛点的直接回应，也为其他云平台与开源社区的协作树立了新的标杆。

AWS ML14天前原文

910

教模型学会遗忘：Amazon Nova 的选择性遗忘技术

新上线

部署基础模型（FM）的组织常面临一个共同挑战：用于内容审核的模型安全护栏，也可能阻碍合法且关键的业务用例。例如，一家媒体公司需要总结包含成人语言的剧本，一家网络安全公司希望模拟真实威胁，或一个法律团队正在处理敏感证据——默认的内容审核机制往往会屏蔽这些本应被处理的合法内容。由于模型在后训练对齐阶段习得了这些安全策略，仅靠提示工程无法克服。模型拒绝回答的倾向已嵌入其参数中，需要在模型层面进行针对性修改，以选择性地调整这一行为。在这篇文章中，我们介绍了 **反向直接偏好优化（rDPO）**——这是 Amazon Nova 可定制内容审核设置（CCMS）背后的创新遗忘技术，并展示了它如何在保持模型质量的同时减少过度拒绝。我们还为客户提供了将偏好优化技术应用于自身实验的指导。 ## 背景：安全护栏与业务需求的冲突以安全团队为例：当他们要求模型生成一封用于员工安全意识培训的钓鱼邮件样本时，即使意图是防御性的，模型也可能直接拒绝回答。这种过度拒绝源于模型在训练过程中习得的严格安全对齐，而简单的提示工程（如“请假装这是用于培训的示例”）往往无法绕过。 ## 解决方案：Amazon Nova 可定制内容审核设置（CCMS） Amazon Nova CCMS 允许经批准的客户在四个负责任 AI（RAI）支柱下选择性调整安全设置： - **安全**：涉及危险活动、武器和受控物质。 - **敏感内容**：包括脏话、裸露和霸凌。 - **公平性**：涉及偏见和文化考量。 - **安全性**：涉及恶意软件和恶意内容。同时，Amazon Nova 强制执行不可配置的基本控制，例如防止对儿童造成伤害和保护隐私。 ## 核心创新：反向直接偏好优化（rDPO） CCMS 背后的科学原理是**遗忘（unlearning）**，即在不从头重新训练的情况下，从模型参数中选择性地移除已学习的行为。具体方法是训练**低秩适配（LoRA）适配器**来逆转模型对特定策略的对齐。训练过程大致如下： 1. 对于需要遗忘的策略（例如“生成包含脏话的脚本”），收集一组包含“被禁止行为”的提示-响应对。 2. 使用这些数据训练 LoRA 适配器，目标是让模型在这些提示下不再拒绝回答，而是生成合规内容。 3. 适配器仅修改模型的部分参数，因此模型在其他策略上的对齐保持不变。结果是：客户获得一个自定义模型变体，该变体在已批准的政策领域能够生成内容，而在其他所有领域仍然保持对齐。 ## 实际应用与效果在内部测试中，rDPO 显著减少了过度拒绝。例如，对于网络安全培训场景，模型能够生成钓鱼邮件样本，同时仍拒绝提供真正的恶意代码或具体的攻击方法。CCMS 目前对选定的 Amazon Nova 客户开放，并计划逐步推广。 ## 客户如何自行实验对于希望将偏好优化技术应用于自身实验的客户，文章提供了以下建议： - 使用 rDPO 时，需要明确界定“遗忘”的范围，避免意外移除重要的安全策略。 - 推荐使用 LoRA 适配器，因为它可以快速切换不同策略配置，而无需重新训练整个模型。 - 在部署前，务必进行充分的红队测试，确保自定义模型不会产生有害输出。 ## 总结 Amazon Nova 的 rDPO 技术为企业提供了一种精细控制模型行为的方式，在保持核心安全性的同时，解锁了被过度限制的业务用例。随着模型部署场景日益复杂，这种“选择性遗忘”的能力将成为负责任 AI 落地的关键工具。

AWS ML14天前原文

911

免费安卓应用 Sponge 让你像左滑一样轻松删除照片

新上线

手机存储空间告急？照片和视频堆积如山？一款名为 **Sponge** 的免费安卓应用或许能成为你的救星。它让删除照片变得像左滑屏幕一样简单快捷，大幅提升整理相册的效率。 ## 痛点：手机相册的“空间危机” 对于很多用户来说，手机相册里塞满了无数照片和视频，尤其是像 **Pixel 9 Pro** 这类拍照能力强劲的设备，动辄几十 GB 的媒体文件让存储空间频频告急。手动逐张删除不仅耗时，还容易误删重要内容。 ## Sponge：左滑即删，效率革命 Sponge 的核心设计理念就是“极简”。它允许用户通过 **左滑手势** 快速标记并删除照片，无需进入复杂的编辑菜单或长按选择。这种交互方式借鉴了社交应用中的滑动操作，学习成本几乎为零。 - **免费使用**：基础的照片删除功能完全免费，适合大多数普通用户。 - **高级功能**：如果需要删除视频或批量管理集合（如按日期、地点分组删除），则需要付费解锁。不过对于清理照片而言，免费版已经足够。 - **安全机制**：应用通常会提供回收站或撤销选项，防止误删。 ## 行业视角：AI 与存储管理的融合虽然 Sponge 目前主打手势操作，但类似的清理工具正越来越多地融入 **AI 能力**。例如，自动识别模糊照片、相似照片或截屏，甚至根据使用频率推荐删除对象。Sponge 未来也可能加入智能分类功能，进一步提升清理效率。 ## 小结如果你正在为手机存储空间发愁，Sponge 提供了一个极其轻量的解决方案。它没有花哨的功能，但把“删除”这一核心体验做到了极致。对于追求效率的用户来说，这款应用值得一试。

ZDNet AI14天前原文

912

如何让 Zorin OS 看起来像 Windows 11——完全免费

新上线

如果你喜欢 Windows 11 的界面风格，但又想使用 Linux，那么 Zorin OS 可以帮你实现这一愿望。本文将详细介绍如何免费将 Zorin OS 的桌面布局定制成类似 Windows 11 的样子。 ## 为什么选择 Zorin OS？ Zorin OS 基于 Ubuntu，拥有出色的易用性。它对 GNOME 桌面进行了深度改造，并提供了多种布局选项。免费版包含四种布局，但默认没有 Windows 11 风格。Pro 版（售价 47.99 美元）则内置了 Windows 11 布局，不过每次大版本升级都需要重新购买授权。如果你不想付费，也可以手动调整免费版布局，达到类似效果。 ## 免费实现 Windows 11 布局的步骤 1. **下载并安装 Zorin OS**：从官网获取 ISO 镜像，制作启动 U 盘并完成安装。 2. **打开 Zorin Appearance 应用**：登录系统后，如果该应用未自动启动，可从菜单中手动打开。 3. **选择基础布局**：在 Zorin Appearance 中，选择右上角的布局（该布局提供底部任务栏和右侧桌面菜单）。 4. **调整任务栏设置**：关闭 Zorin Appearance，右键点击底部任务栏，选择“Taskbar Settings”。在“Style”选项卡中，将“Border radius”滑块拖动到最左侧（直角风格），以模拟 Windows 11 的矩形窗口角。 5. **进一步自定义**（可选）：你可以调整任务栏图标对齐方式、开始菜单样式等，使其更接近 Windows 11。通过以上简单调整，你就能在免费版 Zorin OS 上获得与 Windows 11 高度相似的视觉体验。 ## 小结 Zorin OS 的灵活性让用户无需付费即可拥有 Windows 11 的界面风格。对于希望从 Windows 过渡到 Linux 的用户来说，这是一个低门槛的友好选择。

ZDNet AI14天前原文

913

5 个我离不开的 Linux 小工具：小而美，效率翻倍

新上线

在 Linux 生态中，大型应用如浏览器、办公套件固然重要，但那些小巧、专注的工具往往能在日常工作中发挥意想不到的作用。本文作者分享了他每日必用的 5 个轻量级 Linux 工具，涵盖备份、文本编辑、系统监控等领域，它们免费、易用，却能显著提升工作效率。 ## 1. Déjà Dup Backups：最易用的备份工具数据丢失是每个用户的噩梦，尤其对于写作或重要项目而言。**Déjà Dup Backups** 是 Linux 上最简单的备份工具，只需几次点击即可配置自动备份，真正做到“设置后忘掉”。需要注意的是，若要通过 Flatpak 安装，需调整权限以支持自动备份功能；部分桌面环境（如 COSMIC）可能限制后台访问，建议优先使用发行版自带的包管理器。 ## 2. COSMIC Text Editor：现代文本编辑器的新选择文本编辑器之争在 Linux 社区由来已久，vi 和 emacs 是传统强者的代表，但学习曲线陡峭。**COSMIC Text Editor** 是 COSMIC 桌面环境（System76 开发）的原生编辑器，界面简洁、响应迅速，支持语法高亮、多标签、搜索替换等基础功能，同时保持了极低的资源占用。对于不需要复杂 IDE 的日常编辑任务，它比 Nano 更直观，比 Gedit 更轻量。 ## 3. htop：系统监控的利器当系统运行缓慢或出现异常时，**htop** 是诊断问题的首选。它比 top 更友好：支持彩色显示、进程树、鼠标操作，可以直观地查看 CPU、内存和交换分区的使用情况。通过 F6 键可以按不同指标排序，快速定位资源占用高的进程。对于服务器运维或日常性能排查，htop 几乎不可或缺。 ## 4. fzf：模糊搜索神器 **fzf** 是一个通用模糊搜索工具，可与命令行深度集成。它能快速过滤文件、命令历史、进程列表等。例如，在终端输入 `Ctrl+R` 调出历史命令搜索，或结合 `find` 命令快速定位文件。fzf 的即时过滤和交互式选择机制大幅减少了键盘敲击次数，是命令行用户的效率倍增器。 ## 5. flameshot：截图与标注的瑞士军刀截图工具看似简单，但 flameshot 提供了丰富的标注功能：箭头、文字、模糊、高亮等，并支持直接上传到图床或保存至本地。它支持命令行调用和快捷键绑定，非常适合写文档、做教程或快速分享屏幕内容。相比系统自带的截图工具，flameshot 的编辑能力使其成为专业用户的标配。 ## 小结这些工具的共同特点是：**体积小、启动快、功能专注**。它们不追求大而全，而是通过解决一个具体问题来提升整体工作流。如果你也是 Linux 用户，不妨尝试将这些小工具融入日常，或许会发现：效率的提升往往来自这些不起眼的细节。

ZDNet AI14天前原文

914

苹果 AirTag 对阵蓝牙追踪器：从 40 美元到 2 美元，差距有多大？

新上线

## 蓝牙追踪器大比拼：价格差 20 倍，性能差多少？苹果 AirTag 自发布以来，一直是蓝牙追踪器市场的标杆产品。但市面上存在大量价格低廉的竞品，甚至有些仅售 2 美元。ZDNET 的编辑 Adrian Kingsley-Hughes 对多款蓝牙追踪器进行了实测，包括苹果 AirTag（约 40 美元）和一款仅售 2.5 美元的廉价追踪器。结果令人意外：**所有追踪器都能正常工作**，但蓝牙覆盖范围差异巨大，廉价版的覆盖范围不足苹果 AirTag 的一半。 ### 核心发现 - **功能可用性**：所有测试的追踪器都能实现基本的物品定位功能，包括发出声音和显示位置。 - **蓝牙范围差异**：苹果 AirTag 的蓝牙范围最远，而 2.5 美元的追踪器范围锐减，实测中超过 10 米就难以连接。 - **性能根源**：差异主要源于硬件设计和制造质量。廉价追踪器使用更基础的蓝牙芯片和天线，导致信号强度弱、穿透力差。 - **网络效应**：苹果 AirTag 依赖庞大的“查找”网络，即使超出蓝牙范围，也能通过附近苹果设备匿名定位；而廉价追踪器通常仅依赖蓝牙直连，丢失后更难找回。 ### 选购建议对于日常使用，**苹果 AirTag 的综合体验仍是最优选择**，尤其是在城市环境中，其网络效应几乎能让任何丢失的物品被“全球定位”。但如果预算有限且使用场景相对固定（例如在家内寻找钥匙），廉价追踪器也能满足基本需求，只是需要接受其有限的覆盖范围和较低的可靠性。 ### 小结蓝牙追踪器市场并非“一分钱一分货”那么简单，但**硬件质量和生态网络**确实是决定体验的关键。这次对比再次验证：苹果 AirTag 的高价不仅买的是品牌，更是更稳定的连接和庞大的寻物网络。

ZDNet AI14天前原文

915

Vercel CEO Guillermo Rauch：AI 模型与智能体分离之战

新上线

Vercel CEO Guillermo Rauch 在 ShipNYC 大会后接受 TechCrunch 专访，深入探讨了 AI 从原型验证走向生产部署的关键转变。他指出，去年行业普遍处于“原型阶段”，疯狂构建智能体，但进入生产环境后，价格/性能比、数据安全、可审计性等现实挑战浮出水面。Rauch 认为智能体有两大杀手级应用：**编码智能体**和**内部运营智能体**。前者驱动了全球大量 token 消耗，后者则面临数据安全访问和审计追踪的难题。为此，Vercel 推出了 **Eve 框架**和 **Vercel Sandbox**。Eve 允许用自然语言定义智能体的指令和技能，而 Sandbox 则为智能体提供“笼子”——在保障智能体自由表达智能的同时，通过策略控制其数据访问和输出。Rauch 强调，在 AI 生产中，**模型与智能体的分离**至关重要：智能体负责编排和逻辑，模型提供推理能力，这种解耦能带来更好的性能优化和成本控制。目前 Vercel 日均处理 **600 万次部署**，其中一半由编码智能体触发，日均处理 **1 万亿 token**，成为 AI 软件基础设施的关键节点。

TechCrunch14天前原文

916

iOS 27 测试版新功能：自定义 Siri 语速与情感表达

新上线

在最新的 iOS 27 开发者测试版中，苹果为 Siri 引入了语速和表达力的自定义选项，旨在让虚拟助手更自然、更个性化。 ## 功能详情该功能在 **iOS 27 beta 3** 中正式启用，此前在首个开发者测试版中仅标注为“即将推出”。用户现在可以通过滑块调整 **Pace（语速）** 和 **Expressivity（表达力）**，从而控制 Siri 说话的快慢以及情感丰富程度。调整时，Siri 会示范朗读“你有一条新消息”等常见语句，帮助用户预览效果。 ## 行业背景这一更新是苹果围绕生成式 AI 重建 Siri 的长期努力的一部分。与 ChatGPT 等竞品类似，允许用户自定义 AI 声音是提升技术亲和力的关键。ChatGPT 早在 2025 年 12 月就推出了调节“温暖度”和“热情度”的选项，并可设定友好、专业、坦诚等不同风格，这些不仅影响语音，也影响信息呈现方式。 ## 操作与集成在 WWDC 26 上首次亮相的 Siri 语音控制，让用户不再局限于男声或女声，而是能在多种口音的声音间切换。新版 Siri 深度集成于 iOS 27，支持通过语音、从灵动岛下滑输入、侧边按钮或全新的独立 Siri 应用启动对话。 ## 其他更新与问题 iOS 27 beta 3 还包括更新后的提醒事项应用图标等小改进。不过，部分用户在 X 平台反馈，更新后新 Siri 不可用，或手机重新开始索引数据——这通常是优化 Siri AI 搜索的第一步。

TechCrunch14天前原文

917

2026年科技巨头AI裁员潮：微软、甲骨文、GitLab、谷歌纷纷削减岗位

新上线

2026年，科技行业的裁员潮愈演愈烈，而人工智能（AI）成为企业削减岗位时最常提及的理由。据Layoffs.fyi追踪数据，截至2026年6月，已有约12万个科技岗位被裁撤。微软、甲骨文、GitLab和谷歌等巨头均在其中，它们的共同点是：一边报告创纪录的营收，一边以AI为由进行大规模裁员。 ## 微软：4800个岗位被裁，AI不是直接替代者微软在6月宣布裁减约4800个岗位，占全球员工总数的2.1%。公司强调这些岗位“不会被AI取代”，但承认“AI正在改变工作方式”，并自动化了许多日常任务。这延续了科技行业的普遍现象：企业将AI视为增长引擎和裁员理由的双重角色。 ## 甲骨文：一年减员2.1万，AI是明确原因甲骨文在6月22日披露，过去12个月内员工总数减少了2.1万人，降幅达13%。公司在年度财务文件中明确写道：“AI技术的采用和部署已导致、并可能继续导致员工人数的减少。”这比此前已知的裁员规模更大。 ## GitLab：裁员14%为AI基础设施“输血” GitLab在6月3日裁员约350人（占员工总数的14%），以筹集资金投资AI基础设施并应对AI工作流带来的流量激增。CEO Bill Staples表示，代理型工作负载正将竞争对手推向边缘，公司已开始对核心基础设施进行“代际重建”，以支持所谓的“100倍增长需求”。GitLab同时退出22个国家、精简管理层，并与一家未具名的AI实验室合作，为代理级工作负载重建平台。公司第一季度营收2.64亿美元，同比增长23%，但预计将承担3000万至3500万美元的重组成本。 ## 谷歌：云部门持续裁员 Alphabet旗下的谷歌在5月前已悄然裁减了云部门的员工，具体规模未公开。这延续了其2023年以来多轮裁员的趋势，AI同样被列为关键因素。 ## 行业背景：裁员潮与AI投资的矛盾据再就业服务机构Challenger, Gray & Christmas数据，5月科技行业裁员达到单月最高水平，AI是首要原因。但分析指出，许多公司在疫情期间过度招聘，当前裁员更多是纠正此前的人力扩张，而非AI直接替代。企业需要重新审视将AI作为裁员理由的合理性，因为裁员与AI投资之间的矛盾可能损害员工信任和长期创新能力。 ## 小结 2026年的AI裁员潮反映了科技行业在转型期的阵痛：企业急于押注AI，却通过削减人力来“降本增效”。这种策略短期内可能提升财务指标，但长期来看，如何在AI投资与人才保留之间取得平衡，将是巨头们面临的真正考验。

TechCrunch14天前原文

918

你在OpenAI的300美元股份：山姆·奥特曼的全民分红计划再掀波澜

精选

OpenAI CEO 山姆·奥特曼（Sam Altman）关于让美国人分享AI创造财富的承诺，上周再次成为焦点。据《金融时报》报道，奥特曼正与特朗普总统讨论向美国政府转让 OpenAI 5% 股份的计划。这一构想并非全新——奥特曼早在2021年就提出过更激进的版本，今年4月OpenAI也曾披露类似方案。其逻辑在于：AI从人类创作中学习，却未支付报酬，股权可作为补偿；同时，分红能缓解AI导致失业的焦虑。若将5%股份（当前估值约426亿美元）平分给全美1.33亿家庭，每户约得320美元。但更可能的方式是成立财富基金，仅分享收益。对科技公司而言，此举有助于改善公众对AI的观感，但具体实施细节仍待明朗。

MIT Tech14天前原文

919

网络中断？我用旧安卓手机为家庭路由器提供备用连接的3种方法

新上线

当家庭网络中断时，一台旧安卓手机可以成为救急的备用连接方案。资深编辑 Adrian Kingsley-Hughes 分享了三种将手机与路由器连接的方法，其中一种无需更改每台设备的 Wi-Fi 设置。 ## 为什么需要备用连接？英国近期遭遇创纪录高温，网络稳定性面临挑战。更常见的是，恶劣天气、施工事故或 ISP 故障都可能导致断网。对于依赖网络工作、学习或娱乐的家庭来说，备用连接至关重要。 ## 三种实现方式 ### 1. USB 网络共享通过 USB 数据线将手机连接至路由器（需路由器支持 USB 共享功能）。这是最稳定的方式，同时能为手机充电。 ### 2. 蓝牙网络共享配对后通过蓝牙共享网络，无需线缆，但速度较慢，适合临时使用。 ### 3. Wi-Fi 中继（最佳方案）使用手机热点功能，但通过路由器设置将 Wi-Fi 作为 WAN 源。这样所有连接路由器的设备都能自动通过手机上网，无需逐一修改设备设置。 ## 实操建议 - 选择支持 WAN 故障转移的路由器，可自动切换。 - 旧安卓手机建议保持充电状态，并开启“始终开启移动数据”选项。 - 注意流量上限，避免超额费用。这种方法不仅适合临时断网，也适合旅行时在酒店使用，让所有设备通过路由器统一管理网络。

ZDNet AI14天前原文

920

如果你在用Google，你正在训练它的AI。以下是退出方法。

新上线

近期Google对隐私设置进行了更新，在未明确告知用户的情况下，将更多数据（包括图片、文件、音频和视频）用于训练AI模型。这意味着，如果你使用Google搜索、地图、翻译等服务并上传媒体内容，这些数据都可能被用于AI训练，除非你手动退出。本文将详细解释这一变化，并提供逐步的退出指南。 ## 发生了什么？今年6月，Google通过一封客户邮件悄然更新了其搜索服务的隐私设置。新引入了“搜索服务历史”和“个性化推荐”两项设置，表面上是为了让用户更好地控制数据保存时长和个性化体验，但实际上，Google借此将用户默认“选择加入”了更广泛的AI训练。涉及的服务不仅限于Google搜索，还包括**地图、购物、航班、酒店、翻译和新闻**等。例如，使用Google Lens拍照搜索时，图片可能被保存用于AI训练；使用语音搜索或翻译的音频练习，也会被记录。 ## 为什么重要？这一变化反映了行业趋势：科技公司正在从依赖网络爬虫转向收集用户主动上传的数据来改进AI。Meta同样在大量使用用户图片和AI眼镜录制内容进行训练。Google在邮件中明确表示：“您的保存媒体（包括搜索服务历史）用于开发和改进Google服务和技术，包括AI模型和安全措施。” 虽然部分数据存储是临时的，且与产品功能相关，但用户若想完全避免媒体数据被用于AI训练，必须主动退出。 ## 如何退出？ 1. 访问 [myaccount.google.com](https://myaccount.google.com) 并登录。 2. 点击“数据和隐私”选项卡。 3. 找到“历史记录设置”部分，点击“搜索服务历史”。 4. 关闭“搜索服务历史”开关。注意：这也会影响个性化推荐等功能。 5. 同样在“数据和隐私”页面，找到“个性化推荐”并关闭。此外，你可以定期检查“网络和应用活动”设置，删除已保存的媒体数据。Google也提供了自动删除选项，可设定3个月或18个月后自动清除。 ## 小结 Google的这次更新再次提醒我们，在享受免费服务的同时，数据隐私需要主动守护。虽然退出会牺牲部分个性化体验，但对于重视隐私的用户而言，这是值得的权衡。如果你不想让自己的照片、语音成为AI训练的一部分，现在就去修改设置吧。

TechCrunch14天前原文