AI 资讯

每日聚合最新人工智能动态

801

突破上下文窗口限制：用 Amazon Bedrock AgentCore 处理超长文档

新上线

在处理数百万字符的文档时，传统大语言模型（LLM）的上下文窗口往往成为瓶颈。即使是最长的上下文窗口，也可能因输入过长而拒绝请求，或产生基于不完整信息的回答。本文介绍了如何利用 **Amazon Bedrock AgentCore Code Interpreter** 和 **Strands Agents SDK** 实现**递归语言模型（RLM）**，从而突破这一限制。 ## 为什么上下文窗口不够用？以金融分析为例，比较一家公司两年年报中的指标。每份报告 300–500 页，加上分析师报告、SEC 文件等，总字符数可达数百万。直接输入模型时，要么超出上下文窗口限制而失败，要么虽然“塞入”但模型难以关注中间部分的信息——这就是著名的 **“lost in the middle”** 问题。上下文窗口大小是一个硬限制，单纯通过提示工程无法解决。我们需要一种将文档大小与模型上下文窗口解耦的方法。 ## RLM：将上下文视为环境 RLM 由 Zhang 等人在 arXiv:2512.24601 中提出，它重新定义了问题：不将整个文档喂给模型，而是将输入视为一个**外部环境**，模型通过编程方式与之交互。模型只接收查询和环境描述，然后编写代码来搜索、切片、迭代分析文档。当需要理解某个特定部分的语义时，模型会委托给**子 LLM 调用**，并将结果保存在工作记忆中。 ## 实现方式通过 **Bedrock AgentCore Code Interpreter**，你可以： - 处理任意长度的文档，无上下文窗口上限。 - 将 Code Interpreter 作为**持久工作记忆**，进行迭代式文档分析。 - 在沙盒化 Python 环境中编排子 LLM 调用，分析特定文档片段。具体流程如图 1 所示：根 LLM 生成代码探索文档环境，将语义分析委托给子 LLM，并将结果累积在工作记忆中，然后优化下一步操作。 ## 实际价值这种递归方法不仅突破了上下文窗口的硬限制，还避免了“lost in the middle”问题。对于金融、法律、学术研究等需要处理超长文档的领域，RLM 提供了一种可扩展的解决方案。Amazon Bedrock AgentCore 和 Strands Agents SDK 的组合，让开发者能够快速构建这类应用，而无需从头实现复杂的工作流。 ## 小结上下文窗口不再应该是文档分析的瓶颈。通过递归语言模型和 Amazon Bedrock AgentCore，你可以将文档处理能力提升到新的水平。无论是百万字符的报告还是多文件集合，RLM 都能让你在不丢失信息的前提下进行深入分析。

AWS ML12天前原文

802

Launch HN：Runtime (YC P26) – 为团队打造的沙盒化编码智能体

新上线

## 一句话总结 **Runtime** 是一个为团队协作设计的沙盒化编码智能体平台，让非工程师也能安全使用 Claude Code、Codex 等 AI 编码工具，无需工程师全程陪同。 ## 核心问题当前，AI 编码智能体（如 Claude Code、Codex）能力强大，但直接使用时存在两大痛点： 1. **安全性**：智能体可能访问敏感数据、执行危险命令。 2. **门槛**：非工程师难以独立操作，需要工程师“手把手”指导。 Runtime 的目标就是解决这些问题，让 **全团队（包括销售、支持等非技术角色）** 都能安全、自主地使用编码智能体。 ## 产品亮点 ### 1. 沙盒化环境每个智能体都在隔离的沙盒中运行，预装公司所需的 CLI、API、服务或 MCP 服务器。支持快照功能，**每次会话在几秒内启动**，无需重复配置。 ### 2. 专用智能体团队可以为特定场景创建专用智能体，例如： - **告警检查员**：用于 #incidents 频道，自动调查问题、提交 PR。 - **销售勘探员**：用于 #revenue 频道，辅助客户挖掘。 - **支持分类员**：自动处理工单、草拟回复。这些智能体可以通过 Slack、Linear、GitHub 等工具触发，**自动运行并在完成后暂停**。 ### 3. 协作与治理 - **实时协作**：团队成员可以随时加入正在运行的智能体会话，观察进度、中途接手，最终输出 PR、部署、消息或报告。 - **全面监控**：管理面板显示每次会话的工具调用、思维链、文件变更，以及按智能体、用户、团队统计的成本。 - **安全控制**：支持预算限制、允许列表、审批门禁，确保使用可控。 ### 4. 多入口访问支持通过浏览器、终端或 API 使用，满足不同工作流。 ## 行业背景与意义随着 AI 编码工具的爆发，企业面临“效率提升”与“安全风险”的两难。Runtime 在两者之间架起桥梁，将智能体的能力从少数工程师扩展到整个组织。这不仅是效率工具，更是一种 **组织协作范式的创新**——让非技术人员也能直接参与软件交付，而工程师则能从重复的“保姆式”指导中解放出来。 ## 快速上手 Runtime 已开放免费试用，支持与 Claude Code、Cursor、Codex、Copilot、Gemini CLI、Devin 等主流编码智能体集成。团队可以在几分钟内配置环境、创建专用智能体，并开始协作。 ## 小结 Runtime 提供了一种安全、可管理的方式，让整个团队都能利用 AI 编码智能体的力量。对于希望提升开发效率、促进跨部门协作的企业，这无疑是一个值得关注的方向。

Hacker News10212天前原文

803

用 Amazon Bedrock AgentCore 构建商业智能 AI 代理：OPLOG 的实践与成效

新上线

## 从数据孤岛到实时洞察：OPLOG 的 AI 代理实践在电商与物流行业，数据碎片化是普遍挑战。土耳其科技驱动型履约公司 OPLOG 每月处理数百万件商品，服务横跨土耳其、英国和德国的多个品牌与全球市场。然而，其业务数据分散在 Hubspot CRM、通信系统、Microsoft Teams 以及 Databricks 数据仓库中，导致传统商业智能（BI）系统难以提供及时、全面的洞察。为破解这一困局，OPLOG 基于 **Amazon Bedrock AgentCore** 构建了一套由 AI 代理驱动的生产级 BI 系统。该系统利用 **Strands Agents SDK** 开发了三个专用 AI 代理，分别负责**销售管道管理**、**数据质量管控**和**潜在客户调研**，并集成了 **Anthropic 的 Claude Sonnet** 模型与 **Amazon Bedrock Knowledge Bases** 实现检索增强生成（RAG）。 ### 核心架构与实现三个 AI 代理分工明确： - **销售管道代理**：自动从 Hubspot CRM 抓取销售阶段数据，结合客户沟通记录与团队聊天上下文，自动更新交易状态、识别瓶颈，并生成每周预测报告。 - **数据质量代理**：持续监控 CRM 中的字段完整性、重复记录和异常值，自动触发数据清洗工作流，将数据完整度从 70% 提升至 91%。 - **调研代理**：针对潜在客户，自动从公开数据源和内部知识库中提取公司背景、行业趋势和竞品信息，生成结构化的客户画像，将人工调研时间缩短 98%。所有代理通过 **Amazon Bedrock AgentCore** 统一管理，利用 Claude Sonnet 的推理能力进行任务分解与决策，并通过 **RAG** 机制从 Amazon Bedrock Knowledge Bases 中检索最新的业务文档和交易记录，确保输出基于实时数据。 ### 业务成效：数据驱动决策的闭环 OPLOG 的实践证明了 AI 代理在 BI 场景中的巨大价值： - **销售周期缩短 35%**：代理实时更新管道状态，销售团队能立即跟进高价值机会，避免因信息滞后导致的丢单。 - **CRM 数据完整性提升 91%**：自动化数据校验与补全大幅减少了人工录入错误，为后续分析提供可靠基础。 - **人工调研时间减少 98%**：调研代理将原本需要数小时的客户背景调查压缩至几分钟，让销售团队专注于高价值互动。 ### 行业启示：AI 代理重塑 BI 范式 OPLOG 的案例并非孤例。随着企业数据量激增，传统 BI 工具（如报表与仪表盘）已难以满足实时、交互式的决策需求。AI 代理通过**自主感知、推理与行动**，能够主动发现数据异常、触发工作流并生成可执行的洞察，将 BI 从“被动查询”升级为“主动服务”。结合 **Amazon Bedrock AgentCore** 的托管能力，企业无需自建复杂的代理编排系统，即可快速集成大语言模型、知识库和业务 API。对于面临类似数据碎片化问题的 B2B 组织而言，这一架构提供了一条低门槛、高回报的落地路径。 > 提醒：本文基于 AWS 官方博客内容整理，所有数据均来自 OPLOG 的实际运营结果。

AWS ML12天前原文

804

Marshall Milton ANC 耳机：独特连接功能或让我告别 Bose 和 Sony

新上线

Marshall 最新发布的 Milton ANC 头戴式耳机，凭借独特连接功能和经典设计，可能吸引长期偏好 Bose 和 Sony 的用户。该耳机定价 229 美元，在便携性、续航和音质上均有亮点。 ### 设计传承与升级 Milton ANC 延续了 Marshall Major V 的折叠设计，但升级了更大尺寸的耳垫和记忆海绵，提升被动降噪与佩戴舒适度。方形 TPU 模塑耳罩、纹理皮革表面、黄铜金属徽标及粉末涂层金属臂，共同营造出高端质感。耳机重 200 克，略重于 Major V 的 186 克，但折叠结构仍保持便携性。 ### 音质与连接突破 Marshall 为 Milton ANC 配备了全新驱动系统，旨在优化低音和高频延展。支持 SBC、AAC、LC3 及 LDAC 编解码器，驱动单元尺寸为 32mm（Major V 为 40mm）。更值得注意的是，该耳机搭载 **蓝牙 6.0 与 LE Audio**，原生兼容 Apple Find My 和 Google Find Hub 服务，这意味着无论 iPhone 还是 Android 用户，都能在各自生态中轻松定位耳机。这一跨平台无缝连接体验，是 Bose 和 Sony 同类产品尚未完全实现的差异化优势。 ### 市场定位与竞争在 Bose 和 Sony 主导的降噪耳机市场，Milton ANC 以 **229 美元** 的定价切入中端价位。其核心卖点并非极致降噪，而是将 Marshall 标志性的摇滚调音、耐用设计以及最新的蓝牙连接技术结合，吸引追求个性与便捷的用户。对于厌倦了传统旗舰耳机“大而全”策略的消费者，Milton ANC 提供了一个更轻巧、更具风格的选择。 ### 小结虽然尚未经实际测试，但 Marshall Milton ANC 在连接性上的创新，确实为 on-ear 耳机品类注入了新活力。如果你看重设备间的无缝切换和查找功能，又偏爱 Marshall 的复古美学，这款耳机值得密切关注。

ZDNet AI12天前原文

805

用 Amazon Bedrock 打造 AI 招聘助手：简历解析、智能评分与面试题生成

新上线

## 当招聘变成“体力活”：AI 如何破局？一份针对 748 名 HR 领导者的调查显示，招聘人员平均在每个职位空缺上花费 **17.7 小时** 处理行政事务——相当于两个多工作日。另一项 2024 年的 SmartRecruiters 调查发现，**45% 的人才招聘负责人** 超过一半的工作时间花在可自动化的任务上。这种行政负担导致简历筛选流于表面，大量合格候选人被忽略，而匹配结果往往取决于简历格式和关键词密度，而非真实能力。 ## 架构解析：Serverless + 大模型 + 安全护栏 AWS 近期发布了一篇技术博客，详细展示了如何利用 **Amazon Bedrock** 构建一套 AI 驱动的招聘助手。这套参考架构（非生产就绪方案）整合了多个 AWS 服务，形成一个协同工作的无服务器系统： - **Amazon Bedrock Converse API + Amazon Nova Pro**：负责核心的 AI 推理，包括简历解析、候选人评分、技能评估和面试题生成。 - **AWS Lambda**：处理业务逻辑，串联各个模块。 - **Amazon API Gateway**：提供 API 路由。 - **Amazon DynamoDB & Amazon S3**：分别存储结构化数据（如评分结果）和原始简历文件。 - **Amazon Bedrock Guardrails**：提供 **PII 匿名化、提示词攻击检测和偏见内容过滤**，确保 AI 应用负责任地运行。前端方面，使用 **AWS Amplify** 托管 Web 应用，**Amazon Cognito** 处理用户认证与 JWT 令牌管理。 ## 核心能力：从简历到面试题的全链路智能化 1. **简历解析与多维评分**：AI 不仅提取基本信息，还能基于职位要求计算 **多维度兼容性分数**，避免“关键词堆砌”式的误判。 2. **个性化面试题生成**：根据候选人的背景和岗位需求，动态生成有针对性的面试问题，帮助面试官深入考察真实能力。 3. **数据驱动的洞察**：所有评估结果以结构化数据存储，方便后续分析和决策。 ## 行业背景与思考当前，AI 在招聘领域的应用已从简单的关键词匹配走向 **深度语义理解与推理**。Amazon Bedrock 提供的托管大模型服务，让企业无需自建基础设施即可调用前沿模型，同时通过 Guardrails 解决合规与伦理问题——这对处理敏感个人数据的 HR 场景尤为重要。不过，博客也明确指出，这套架构仅用于 **学习目的**，并非生产就绪方案。实际落地时，企业需要根据自身需求调整，例如增加更严格的隐私保护措施、优化成本控制，或与现有 ATS（申请人追踪系统）集成。 ## 小结 AI 招聘助手并非要取代人类面试官，而是将 HR 从繁琐的行政工作中解放出来，让他们专注于更有价值的决策——比如判断候选人的文化契合度、软技能和发展潜力。随着 Amazon Bedrock 等平台降低了大模型的使用门槛，这类智能化工具将加速进入中小企业，改变整个招聘行业的效率格局。

AWS ML12天前原文

806

在 Amazon Bedrock AgentCore 上用 NLP 构建 AI 驱动的仪表板自动化代理

新上线

## 概述传统上，业务分析师在调整仪表板以响应变化的需求时，往往需要等待数天。典型的流程涉及向 IT 团队提交修改请求，由 IT 人员解读需求、查阅 API 文档、理解表结构并部署变更。虽然这种方式能保证适当的监督和质量控制，但在需要快速更新仪表板时，可能导致数天的周转时间。本文介绍的方案结合了 **Amazon Bedrock AgentCore**、**Strands Agents** 和 **Amazon QuickSight** 的强大功能，构建了一个安全、可扩展且智能的系统，用于创建和运行 AI 代理，同时将数据转化为可执行的业务洞察。 ## 解决方案架构该方案采用基于 Amazon Bedrock AgentCore 和 Strands 框架的多智能体架构。Amazon Bedrock AgentCore 是一个智能体平台，用于安全地大规模构建、部署和运行高效代理，无需管理基础设施。Strands Agents 是一个代码优先的框架，用于构建与 AWS 服务集成的代理。Amazon QuickSight 则提供 AI 驱动的 BI 能力，将分散的数据转化为战略洞察。架构由三个专门代理协作组成： - **查找仪表板代理**：执行发现操作，包括搜索仪表板、检索仪表板和数据集中的列元数据。 - **修改仪表板代理**：执行配置变更，如验证列、更新表格视觉效果以及创建新的仪表板版本。 - **编排代理**：根据意图分类，将用户请求路由到相应的专门代理。 ## 工作流程编排代理作为用户交互的入口。当用户提交自然语言查询（例如“将 lastname 添加到测试仪表板”）时，Amazon Nova 将请求分类为对话型或操作型。对话型查询直接利用 Nova 的大语言模型能力进行响应；操作型请求则通过 Strands 框架路由到相应的专门代理进行处理。 ## 行业背景与价值在 AI 行业，将自然语言处理与智能代理结合，正在重新定义企业与数据交互的方式。这一方案不仅缩短了仪表板修改的周期，还降低了非技术用户的使用门槛。业务分析师无需掌握技术细节，即可通过自然语言指令完成复杂的仪表板操作，从而加速决策过程。该方案体现了 **Agentic AI** 在商业智能领域的落地潜力：通过多代理协作，将意图识别、任务分解与执行自动化融为一体。Amazon Bedrock AgentCore 提供的安全性和动态扩展能力，确保了生产级部署的可靠性。 ## 关键优势 - **效率提升**：将仪表板修改时间从天级缩短至分钟级。 - **自然语言交互**：用户无需学习特定命令或 API。 - **安全可控**：代理访问权限和数据操作受到严格管理。 - **可扩展性**：基于微服务架构，易于添加新的代理或功能。 ## 总结通过 Amazon Bedrock AgentCore、Strands Agents 和 Amazon QuickSight 的组合，企业可以构建一个智能的仪表板自动化系统，让数据分析师和业务用户都能以更自然、更高效的方式获取洞察。这不仅是技术上的进步，更是企业数据文化向自助式、即时响应方向转型的重要一步。

AWS ML12天前原文

807

Spotify 联手环球音乐推出 AI 混音功能：粉丝创作，艺术家获利

新上线

Spotify 与环球音乐集团（UMG）达成一项具有里程碑意义的授权协议，将允许付费用户利用 AI 工具为流媒体曲目生成混音和翻唱版本。该功能作为 Premium 用户的付费附加组件推出，参与计划的艺术家将从这些 AI 生成的混音中获得版税收入。这是自去年 10 月 Spotify 宣布与多家主流唱片公司合作开发“负责任的 AI 产品”以来，首个落地的具体成果。 ## 合作框架与核心原则 Spotify 与 UMG 的此次合作明确了三大指导原则：**参与选择权、公平补偿与新增收入、艺术家与粉丝的连接**。Spotify 联合 CEO Alex Norström 表示：“我们所构建的一切都基于参与艺术家的同意、署名和补偿。”UMG 首席执行官 Sir Lucian Grainge 则强调：“音乐行业最有价值的创新始终是拉近艺术家与粉丝的距离。这一开创性的 AI 超级粉丝计划旨在支持人类艺术创作、加深粉丝关系，并为艺术家和词曲作者创造额外收入机会。” ## 商业模式与艺术家权益该 AI 工具将作为 Spotify Premium 的付费增值服务推出，具体定价和上线时间尚未公布。艺术家可以选择退出该计划，而选择参与的艺术家将获得由 AI 生成的混音和翻唱带来的版税收入。这种设计试图解决此前 AI 音乐生成工具面临的版权争议——通过确保原始创作者获得收益，在技术创新与权利保护之间取得平衡。 ## 行业影响与未来展望 Spotify 此前已与索尼音乐、华纳音乐、Merlin 和 Believe 等主要厂牌达成类似合作意向。此次与 UMG 率先敲定协议，标志着主流音乐产业对 AI 生成内容的态度从抵制转向合作。值得注意的是，Spotify 同期也在加强对“真人播客”的验证，以区分 AI 生成内容与人类创作。随着 AI 混音功能的推出，音乐流媒体平台有望开辟新的收入来源，同时也将重新定义“创作”的边界——当粉丝的 AI 改编也能为艺术家创收时，音乐消费的互动模式或将迎来根本性变革。

The Verge12天前原文

808

我用Gemini的AI化身克隆了自己，结果令人不安地像我

新上线

我使用Gemini应用生成了一段逼真的视频，其中包含一个数字克隆的我。Google将此视为创作的未来，而我仍然感到毛骨悚然。 ## 初次体验：从设置到生成一个温暖的午后，我在旧金山多洛雷斯公园为一只史前恐龙唱生日歌。当我完成小夜曲时，一个插着粉色蜡烛的纸杯蛋糕凭空出现在我空着的手中。吹灭蜡烛后，那个CGI风格的恐龙露出满足的表情。视频中的男人看起来和听起来都像我，但实际上这是使用Google Gemini应用的新功能——**化身（Avatars）** 生成的。这些数字再现类似于OpenAI已停用的Sora应用的核心功能。化身由Google新的Omni视频模型驱动，仅对付费订阅用户开放。我每月支付20美元订阅Google AI Pro计划，但很快就用完了使用限额（每5小时重置）。我只问了几个问题并生成了两个10秒的片段，就被提示等待。 ## 技术细节与限制与OpenAI允许用户决定是否允许他人使用自己肖像生成视频不同，Google只允许成年用户用自己的化身制作视频。设置过程大约需要5分钟：在光线充足的房间里，用手机摄像头对准脸部，朗读一串两位数数字，然后缓慢向右转头再向左转。完成后，我的数字克隆诞生了。需要注意设置时的着装，因为衣服很可能出现在AI生成的画面中。 ## 质量与感受前两个片段分别是我在旧金山为恐龙唱歌和在金门大桥下冲浪。我既印象深刻又感到不安。内容有些尴尬，存在混乱的时刻和不合逻辑的服装，但视频中的人确实是我。我放大画面观察嘴巴的动作——牙齿有点不协调，但那就是我，连双下巴都还原了。 ## 行业背景与前景 Google将化身视为创作的未来，但这类技术也引发伦理担忧。相比OpenAI的开放态度，Google采取了更谨慎的策略，限制用户只能生成自己的化身，这在一定程度上降低了滥用风险。然而，随着AI视频生成技术日益成熟，如何在创新与隐私保护之间取得平衡仍是行业面临的重大挑战。

WIRED AI12天前原文

809

Spotify Studio 推出 AI 代理，为你打造专属每日播客

新上线

Spotify 近日发布了一款名为 **Studio by Spotify Labs** 的全新独立 AI 应用，能够根据用户的个人数据生成每日简报、播客和播放列表。该应用目前以研究预览形式推出，面向 18 岁以上用户，未来几周内将正式上线。Studio 的独特之处在于，它不仅能调用用户的 Spotify 收听历史，还能连接邮箱、日历、笔记等第三方应用，从而生成高度个性化的音频内容。 ## 功能亮点：从“被动听”到“主动生成” Studio 的核心能力是 **通过聊天机器人提示词生成音频**。用户输入需求后，AI 会综合分析其 Spotify 数据与已授权的个人应用信息，制作出专属的每日简报播客。更值得关注的是，Spotify 宣称该 AI 能“代表用户采取行动”，例如研究主题、使用浏览器、整理信息或协助完成任务。所有生成的内容均可保存至用户的 Spotify 资料库。这一功能将 Spotify 从传统的音频流媒体平台推向 **个性化内容创作平台**。此前，Spotify 已允许用户将来自 OpenClaw 和 Claude 等第三方 AI 生成的播客保存到资料库，并计划于下月推出“个人播客”（Personal Podcasts）——用户可直接在 Spotify 应用内通过提示词生成 AI 播客。 ## 行业背景：AI 播客赛道竞争加剧 Spotify 并非首家涉足 AI 生成播客的公司。自 2024 年起，Google 的 NotebookLM 已提供类似功能；亚马逊的 Alexa Plus 和微软的 Edge 浏览器也在近期推出了各自的 AI 播客特性。部分用户将其视为快速获取新闻或学习新知识的工具，但整体使用规模尚不明确。然而，Spotify 的优势在于其 **音频内容生态的天然契合性**。用户本就习惯通过 Spotify 收听播客和音乐，而 Studio 的推出进一步降低了内容创作门槛——用户无需专业设备或编辑技能，即可生成定制化音频。不过，Spotify 明确表示 Studio 仅用于生成简报、播客和播放列表，**不涉及音乐创作**。 ## 用户价值与潜在争议对于普通用户而言，Studio 的最大吸引力在于 **效率与个性化**。例如，通勤前生成一份融合了日程安排、新闻要点和音乐推荐的播客，比手动切换多个应用更便捷。但这也引发了隐私担忧：用户是否愿意将邮箱、日历等敏感数据授权给 AI？此外，AI 生成播客能否替代真人主播的独特观点和情感表达，仍是未知数。 Spotify 同时宣布，Premium 用户即日起可使用 **播客问答聊天机器人**，它能针对正在收听的节目提供时间戳或主题解析。这些举措表明，Spotify 正试图通过 AI 技术巩固其音频领域的领先地位，但如何在创新与隐私、效率与人文价值之间取得平衡，将是其面临的关键挑战。

The Verge12天前原文

810

Fedora 官方仓库不再支持 Deepin 桌面，原因何在？

新上线

曾被誉为“最美 Linux”的 Deepin 桌面环境，如今正面临被主流发行版抛弃的窘境。继 SUSE 之后，Fedora 也正式从官方仓库中移除了所有 Deepin 软件包。这一决定并非一时冲动，而是基于长期积累的安全隐忧。 ## 从惊艳到隐忧 Deepin 桌面环境（DDE）以其精美的界面和用户体验一度被视为 Linux 桌面的“破圈”之作。然而，早在 2018 年，Deepin 就被曝出商店向中国第三方分析服务 CNZZ 发送未加密请求，涉及用户浏览器代理等信息。尽管 Deepin 官方随后停止了数据收集，且后续取证未发现核心层存在间谍软件，但信任裂痕已然产生。 ## SUSE 的“临门一脚” 2025 年，SUSE 率先宣布切断与 Deepin 的关系。其调查指出，Deepin 社区打包者为绕过安全审查，在 openSUSE 中采用了一种规避标准 RPM 打包机制的变通方案来安装受限资源。SUSE 直言：“鉴于这一违规行为以及 Deepin 代码审查的艰难历史，我们将暂时从 openSUSE 发行版中移除 Deepin 桌面包。” ## Fedora 紧随其后在 SUSE 声明之后，Fedora 团队也以类似的安全理由移除了 Deepin 软件包。这意味着 Fedora 和 Red Hat Enterprise Linux 用户将无法再从官方仓库直接安装 DDE。Red Hat 作为企业级 Linux 的标杆，其决策往往具有行业风向标意义。 ## 不是终点，而是转折对于 Deepin 而言，被两大主流发行版“拉黑”无疑是沉重打击。但换个角度看，这也为 Deepin 提供了自我革新的契机。目前，Deepin 的发展路径已十分明确：**必须进行严格的代码审查**，重建社区信任。如果 Deepin 能够借此机会彻底解决安全合规问题，未来或许仍有机会重返主流仓库。 ## 对用户的影响对于普通用户来说，最直接的影响是无法再通过 Fedora 或 openSUSE 的官方源一键安装 DDE。不过，用户仍可通过第三方源或自行编译的方式使用 Deepin 桌面，但这增加了安全风险和操作门槛。对于追求稳定与安全的用户，建议暂时转向其他桌面环境如 GNOME、KDE Plasma 或 Budgie。 ## 结语 Deepin 的遭遇再次提醒我们：在开源世界，**安全与信任是发行版的生命线**。任何绕过审查的“捷径”都可能带来长期代价。Deepin 能否走出低谷，取决于其能否以透明、合规的方式重新赢得社区的信任。

ZDNet AI12天前原文

811

摩托罗拉版DeX体验：Razr Fold变身桌面工作站，几乎取代了我的笔记本电脑

新上线

摩托罗拉为 Razr Fold 打造的 Smart Connect 桌面模式，让我几乎可以告别笔记本电脑。以下是我的实际体验。 ## 从手机到桌面：一次无缝切换当我第一次将 Razr Fold 连接到便携显示器时，Smart Connect 界面自动弹出，手机屏幕瞬间变成触摸板——无需额外配件，操作直观。连接方式灵活：有线、无线或通过智能眼镜投射，都能获得接近完整的桌面体验。 ## 性能与兼容性：够用且流畅在 Razr Fold 上运行 Smart Connect 时，多任务处理流畅。我同时打开了浏览器、文档编辑器和 Slack，切换迅速，没有明显卡顿。值得注意的是，它支持窗口自由缩放和排列，与 Windows 11 的体验高度相似。外接键盘和鼠标后，打字和导航效率大幅提升。 ## 关键场景：移动办公的新选择对于经常出差或需要临时办公的人来说，Smart Connect 提供了一个轻量级方案。我尝试用它撰写文章、回复邮件、甚至进行简单的图片编辑。虽然重度任务（如视频渲染）仍需笔记本，但日常办公已足够。 ## 与竞品对比：差异化优势与三星 DeX 相比，摩托罗拉的 Smart Connect 在连接便捷性和触控交互上更胜一筹。DeX 需要专用底座或有线连接，而 Smart Connect 支持无线投屏，且手机作为触控板的体验更自然。不过，应用生态上仍落后于 DeX，部分专业软件尚未适配。 ## 小结：值得尝试的移动工作站 Smart Connect 让 Razr Fold 从一个折叠手机升级为便携工作站。如果你已经有便携显示器或智能眼镜，这套组合几乎可以替代笔记本电脑完成大部分工作。当然，它并非完美——重度任务仍需传统 PC，但对于移动办公者来说，这是一个令人兴奋的补充。

ZDNet AI12天前原文

812

AI 视频正超越“片段污染”，好莱坞迎来真正的变革

新上线

社交平台上充斥着 AI 生成的劣质片段，如丹尼尔·克雷格骑 Vespa 或哥斯拉大战金刚，这些内容让许多人认为好莱坞将被 AI 取代。然而，AI 视频的真正潜力并不在于制造这些“片段污染”，而是通过智能体技术重塑整个影视制作流程。 Luma AI 的 CEO Amit Jain 指出，早期 AI 视频公司试图说服好莱坞用提示词替代摄像机，但这远远不够。生成的 10 到 16 秒片段无法构成镜头、序列或场景。如今，Luma 等公司转向开发 AI 智能体，覆盖从前期策划到后期制作的端到端工作流，类似于 Anthropic 从“氛围编码”转向智能体工作流的演进。这种变革意味着 AI 不再只是生成视频的工具，而是融入剧本分析、分镜设计、拍摄调度和视觉特效等环节。例如，Luma 与 Wonder Project 合作成立的新制作公司 Innovative Dreams，正探索如何用 AI 智能体辅助电影创作。虽然高质量影视作品仍需人类创意主导，但 AI 能显著提升效率，降低试错成本。好莱坞并未“被煮”，而是站在技术升级的关口。AI 视频的下一阶段，不是制造更多廉价片段，而是成为制片人的智能助手，让创意更快落地。这或许才是 AI 对娱乐产业最深远的影响。

The Verge12天前原文

813

Spotify 推出 AI 播客生成与问答功能，个性化音频体验再升级

新上线

Spotify 正在从单纯的播客消费平台，向“人人皆可创作”的个性化音频平台进化。近日，该公司宣布推出一系列基于 AI 的新功能，涵盖个人播客生成、AI 问答以及创作者工具，标志着其在音频内容领域的又一次重要布局。 ### 一、个人播客：你的专属音频简报核心亮点是 **AI 驱动的个人播客生成功能**。用户只需输入一个想法或自定义提示词，Spotify 就能自动生成一档播客。该功能不仅支持一次性主题创作，还能**按日或按周生成定期简报**，例如“分享我所在城市的每日更新，并告诉我喜欢的艺人有哪些本地演出”，或者“用五分钟帮我理解经济学”。更强大的是，用户可以**附加链接、PDF 和文本**作为素材来源，并**选择自定义语音**来播报。这让人联想到 Google 的 NotebookLM、ElevenLabs 的阅读器以及前 NotebookLM 开发者推出的 Huxe 应用——Spotify 显然借鉴了这些产品的思路，但将其无缝集成到自己的生态中。目前该功能可通过 GitHub 上的命令行工具（支持 Claude Code 和 Codex）体验，未来将直接整合进 Spotify 应用内。此外，Spotify 还发布了**桌面版应用 Studio by Spotify Labs**，它可以连接用户的邮箱和日历，生成个性化的日常简报。 ### 二、AI 问答：边听边问，深度互动针对 Premium 移动端用户，Spotify 在美国、瑞典和爱尔兰率先上线了 **AI 问答功能**。用户在收听播客时，可以针对当前剧集或其中提到的概念提问，AI 会即时给出答案。同时，用户还能请求针对特定主题的播客推荐。这一功能与 Google 本周早些时候推出的“Ask YouTube”高度相似，本质上是将大语言模型的理解能力嵌入到音频消费场景中，让被动收听变为主动探索。Spotify 透露，**视频播客的观看量同比增长了 50%**，而问答功能有望进一步提升用户参与度和留存率。 ### 三、创作者生态：变现工具与订阅制对于播客创作者，Spotify 开放了 **创作者赞助工具**，帮助其管理品牌合作。同时新增了**订阅制功能**，允许创作者对独家内容和体验收费。Instagram、Facebook 和 Snap 等社交平台早已提供类似产品，Spotify 正在追赶这一趋势，试图构建更完整的创作者经济闭环。 ### 行业视角从“听播客”到“做播客”，再到“问播客”，Spotify 正在用 AI 重新定义音频体验。这不仅是技术能力的展示，更是对用户粘性和内容差异化战略的深度考量。随着生成式 AI 在音频领域的渗透加速，Spotify 有望在个性化内容推荐之外，开辟出“用户即创作者”的新增长路径。

TechCrunch12天前原文

814

Spotify 推出 ElevenLabs 驱动的有声书创作工具

新上线

Spotify 于周四在投资者日活动中宣布，将在其 **Spotify for Authors** 平台中集成 **ElevenLabs** 的 AI 语音技术，推出一款面向自助出版有声书的工具。该功能计划于 **今年 6 月** 以邀请制开启 Beta 测试，初期仅支持英语。值得注意的是，使用该工具生成的有声书 **不附带独家合同**，作者可自由将作品发布至其他平台。这一举措建立在 Spotify 与 ElevenLabs 已有合作的基础上——此前作者已可通过 ElevenLabs 平台制作有声书并提交至 Spotify。Spotify 还与 Google Play Books 合作支持数字旁白内容，但 ElevenLabs 更富表现力和人性化的语音模型可能是此次升级的关键原因。有趣的是，ElevenLabs 本身已在 2025 年推出了自己的自助出版平台。与此同时，Spotify 将 **Spotify for Authors** 平台的语言支持扩展至 **10 种新语言**，包括法语、加拿大法语、德语、荷兰语、拉丁西班牙语、瑞典语、芬兰语、冰岛语、丹麦语和挪威语。此外，公司计划今年升级 **Audiobook+** 套餐，提供更高的收听限额，并未来为学生和家庭增加新选项（具体定价和用量细节尚未公布）。截至目前，Spotify 已拥有 **超过 100 万 Audiobook+ 订阅用户**，有声书业务年化经常性收入有望达到 **1 亿美元**。公司还推出了一项自然语言提问功能，帮助用户发现有声书。今年夏季，Spotify 将把基于提示生成播放列表的功能（当前适用于播客和音乐）扩展至有声书。过去几年，Spotify 大幅加码有声书领域，已积累 **70 万本有声书** 目录。公司通过拓展国际市场、投资非英语作品、支持应用内购买、发布有声书排行榜，以及在美国和英国启动作者实体书销售计划等举措，使收听时长同比提升了 **60%**。超过一半的 Audiobook+ 用户来自 Spotify 的免费层级，这表明有声书正成为吸引和留存用户的有效手段。

TechCrunch12天前原文

815

Spotify 推出新桌面应用，正面迎击 Google NotebookLM 的 AI 播客功能

新上线

Spotify 近日发布了一款名为 **Studio by Spotify Labs** 的独立桌面应用，以研究预览形式在 20 多个市场上线，旨在让用户通过 AI 生成个性化播客。该应用的核心功能是允许用户基于个人数据——如日历、邮件、日程等——创建每日简报或主题播客，甚至支持多步骤指令，例如“为我规划意大利自驾游的每日音频简报，推荐沿途晚餐地点，并以播客推荐结束”。所有生成的播客均保存在用户的 Spotify 库中，可跨设备同步，但不会公开分享。这一举措直接对标 Google 的 **NotebookLM**，后者因率先推出基于源材料的播客生成功能而走红，并随后增加了基于 Google Discover 信息流的每日播客功能。与此同时，Adobe、ElevenLabs 以及 Hero、Huxe 等应用也纷纷跟进这一格式。Spotify 的差异化在于深度整合个人上下文——应用内置的 AI 智能体可联网抓取用户邮件和日程信息，从而生成真正“私人订制”的音频内容。值得注意的是，Spotify 此前已为开发者推出命令行工具，供 Claude Code 或 Codex 等编码工具的用户生成播客并保存到库中；而新应用则面向非技术用户，降低了使用门槛。公司强调，目前仍处于早期预览阶段，AI 可能犯错或输出不可靠内容，用户需谨慎使用。从行业视角看，Spotify 此举是其“全音频”战略的延伸——通过将 AI 播客嵌入个人数据流，它希望在知识消费场景中占据一席之地。与 NotebookLM 偏重学术或文档驱动的模式不同，Spotify 更强调生活场景的实用性与个性化，这或许能吸引更广泛的普通用户。然而，隐私与数据安全将是关键挑战：用户是否愿意将日历、邮件等敏感信息授权给一个娱乐平台？此外，AI 生成内容的准确性与时效性也需要持续优化。简言之，Spotify 正在将“听”的边界从音乐、播客扩展到个人知识管理，与 Google 的竞争也从流媒体延伸至 AI 生产力工具。这场争夺“耳朵经济”的新战役，才刚刚开始。

TechCrunch12天前原文

816

微软不再发送短信验证码登录：为什么改用通行密钥更安全？

新上线

微软宣布将逐步淘汰 SMS 短信验证方式，推动用户改用通行密钥（passkey）等更安全的认证方法。短信验证码因缺乏加密、易被拦截和 SIM 卡交换攻击而成为安全隐患。微软建议用户设置通行密钥，通过生物识别或设备 PIN 实现无密码登录，同时保留备用邮箱验证。这一举措顺应了行业向无密码认证转型的趋势，有助于提升账户安全性并简化登录流程。

ZDNet AI12天前原文

817

毛利语文本转语音模型：拒绝大科技价值观，守护土著语言主权

新上线

在全球人工智能浪潮中，大型科技公司主导着语音助手、翻译工具和文本转语音（TTS）模型的发展，但它们的价值观往往与土著社区的需求相冲突。最近，新西兰怀卡托大学AI研究所联合主任、计算机科学家Te Taka Keegan领导的项目，开发了一款面向毛利语的文本转语音模型。该模型并非简单套用大科技公司的技术框架，而是从数据收集到模型训练全程由毛利社区主导，确保符合毛利文化价值观和语言特性。 ## 为什么需要土著拥有的AI模型？主流TTS模型通常依赖海量标注数据，这些数据多来自英语等主流语言，且训练过程往往忽视少数语言的语音、语法和文化背景。对于毛利语这类濒危语言，大科技公司的模型可能产生不自然的发音、误用敬语，甚至因训练数据不足而表现糟糕。更关键的是，数据主权问题——谁拥有语音数据？谁决定模型的使用方式？ Keegan团队的做法是：**从社区收集高质量的毛利语语音数据**，由母语者参与标注和验证，确保模型能准确反映毛利语的韵律、重音和方言差异。模型本身也采用开源架构，避免被单一商业公司控制，社区可以自由部署、修改和扩展。 ## 技术路径与挑战该模型基于**端到端TTS架构**，使用Transformer和WaveNet等技术，但针对毛利语音节结构（如长元音、双元音和声门塞音）进行了优化。训练数据来自数百位毛利语母语者，涵盖不同年龄段和地区方言，以提升模型的泛化能力。与传统模型不同，团队刻意避免使用自动语音识别（ASR）生成的伪标签，因为这类数据可能引入错误，损害语言质量。挑战在于：毛利语是低资源语言，可用的公开数据远少于英语。团队通过社区合作、口述历史录音和语言振兴计划获取数据，并设计了**数据增强策略**（如音高调整、速度变化）来扩充训练集。此外，模型需要处理毛利语中特有的**语法结构**，例如动词前缀和名词所有格标记，这些在英语TTS中并不常见。 ## 土著AI模型的全球趋势毛利语TTS项目并非孤例。全球范围内，多个土著社区正在开发自己的AI模型： - **加拿大**：因纽特语和克里语的语音助手，由土著非营利组织主导，重点保护方言多样性。 - **澳大利亚**：原住民语言TTS项目，结合传统故事叙述和现代语音合成，用于教育场景。 - **北欧**：萨米语自然语言处理工具，强调数据主权和社区许可协议。这些项目的共同点是：**拒绝大科技公司的“一刀切”解决方案**，转而建立社区拥有的数据基础设施和模型。它们通常采用开源许可，确保技术利益回流社区，而不是被商业公司垄断。 ## 对AI行业的意义毛利语TTS模型挑战了AI发展的主流叙事：技术必须由硅谷巨头定义。它证明，**低资源语言模型可以做到高质量，只要社区深度参与**。这为其他濒危语言提供了可复制的路径： 1. **数据主权优先**：社区控制数据收集、存储和使用。 2. **文化适配**：模型设计必须尊重语言的文化内涵（如敬语、禁忌词汇）。 3. **开源与可持续**：避免供应商锁定，允许社区长期维护。当然，这类项目也面临资金和人才短缺问题。Keegan团队呼吁更多政府和基金会支持土著AI研究，并建议大科技公司提供技术基础设施，但将控制权交给社区。 ## 小结毛利语TTS模型不仅是技术成果，更是文化自决的象征。它提醒我们：AI的价值观并非中性，而是由创造者决定。当社区掌握技术主权时，AI才能真正服务于多元文化，而不是强化主流语言的霸权。

IEEE AI12天前原文

818

Anthropic的“Code with Claude”活动展示了编程的未来——无论你喜不喜欢

精选

5月19日，Anthropic在伦敦举办了为期两天的开发者活动“Code with Claude”，恰逢Google I/O大会同期举行。Anthropic员工强调这只是巧合，并非刻意竞争。活动现场，工程师Jeremy Hadfield询问在场开发者：“过去一周内，谁提交了完全由Claude编写的拉取请求？”近半数人举手。当被问及“谁提交了完全由Claude编写且自己未阅读代码的拉取请求？”时，多数手仍举着，伴随紧张的笑声。这并非新闻——LLM驱动的工具如Anthropic的Claude Code和OpenAI的Codex已彻底改变软件开发方式。顶级科技公司如今乐于宣称开发者手写代码的比例极低。Hadfield表示：“Anthropic的大部分软件现在由Claude编写，Claude Code中的大部分代码也是Claude自己写的。”OpenAI、Google和Microsoft也有类似说法。令人瞩目的是，这种新范式已变得如此平常，且普及速度惊人。这是Anthropic第二次举办开发者活动，同时也在旧金山和东京举行。去年此时，公司刚发布Claude 4，其编码能力有限。但随着Claude 4.6和4.7（分别于2月和4月发布）的推出，Claude Code已成为越来越多开发者愿意托付工作的工具。 Anthropic的目标是将自动化推向极致——不是让AI生成代码再由人类修正，而是让Claude自行检查和修正。Claude Code负责人Boris Cherny在主题演讲中表示：“默认不再是‘我要提示Claude’，而是‘我要让Claude自我提示’。”理想情况下，开发者甚至不应看到错误信息，一切将由Claude处理、测试和调整，直到代码正常运行。这一转变对开发者角色影响深远。Anthropic强调，AI并非取代开发者，而是让他们专注于更高层次的设计与决策。然而，现场多数开发者承认未阅读AI生成的代码，引发对代码质量与安全性的担忧。活动展示了编程的未来——人机协作的新模式，但伴随责任与信任的挑战。

MIT Tech12天前原文

819

最佳阵亡将士纪念日笔记本电脑提前购：苹果、戴尔、联想等品牌大降价

新上线

随着阵亡将士纪念日临近，各大品牌纷纷推出笔记本电脑优惠活动。本文整理了当前最值得关注的笔记本折扣，涵盖苹果、戴尔、联想等主流品牌，包括 MacBook Air M5、MacBook Pro M5、华硕 Vivobook 14、戴尔 Plus 16 和 HP EliteBook 6 G1a 等型号，最高可节省 600 美元。这些优惠来自亚马逊、百思买等可靠零售商，适合有升级或购机需求的消费者。

ZDNet AI12天前原文

820

提前抢购阵亡将士纪念日沃尔玛最佳优惠：苹果、戴森等大牌降价

新上线

阵亡将士纪念日即将到来，沃尔玛已经提前对热门科技产品进行了大幅降价。以下是目前最值得关注的几款优惠： - **沃尔玛+会员**：首月仅需1美元（节省12美元） - **三星Odyssey Neo G7 43英寸Mini LED 4K游戏显示器**：售价499美元（节省400美元） - **Ninja Professional Plus搅拌机**：售价79美元（节省16美元） - **TCL 55英寸QM7K Mini LED QLED 4K电视**：售价648美元（节省302美元）这些优惠涵盖了从家庭娱乐到厨房电器的多种品类，折扣力度相当可观。例如，三星Odyssey Neo G7显示器降价幅度高达44%，而TCL电视也直降302美元。沃尔玛+会员的折扣则让用户能以极低成本体验会员服务。需要注意的是，这些价格可能随时变动，建议有需求的消费者尽早下单。ZDNET将持续关注更多促销动态，为读者提供最新信息。

ZDNet AI12天前原文