SheepNav

AI 资讯

每日聚合最新人工智能动态

在处理数百万字符的文档时,传统大语言模型(LLM)的上下文窗口往往成为瓶颈。即使是最长的上下文窗口,也可能因输入过长而拒绝请求,或产生基于不完整信息的回答。本文介绍了如何利用 **Amazon Bedrock AgentCore Code Interpreter** 和 **Strands Agents SDK** 实现**递归语言模型(RLM)**,从而突破这一限制。 ## 为什么上下文窗口不够用? 以金融分析为例,比较一家公司两年年报中的指标。每份报告 300–500 页,加上分析师报告、SEC 文件等,总字符数可达数百万。直接输入模型时,要么超出上下文窗口限制而失败,要么虽然“塞入”但模型难以关注中间部分的信息——这就是著名的 **“lost in the middle”** 问题。上下文窗口大小是一个硬限制,单纯通过提示工程无法解决。我们需要一种将文档大小与模型上下文窗口解耦的方法。 ## RLM:将上下文视为环境 RLM 由 Zhang 等人在 arXiv:2512.24601 中提出,它重新定义了问题:不将整个文档喂给模型,而是将输入视为一个**外部环境**,模型通过编程方式与之交互。模型只接收查询和环境描述,然后编写代码来搜索、切片、迭代分析文档。当需要理解某个特定部分的语义时,模型会委托给**子 LLM 调用**,并将结果保存在工作记忆中。 ## 实现方式 通过 **Bedrock AgentCore Code Interpreter**,你可以: - 处理任意长度的文档,无上下文窗口上限。 - 将 Code Interpreter 作为**持久工作记忆**,进行迭代式文档分析。 - 在沙盒化 Python 环境中编排子 LLM 调用,分析特定文档片段。 具体流程如图 1 所示:根 LLM 生成代码探索文档环境,将语义分析委托给子 LLM,并将结果累积在工作记忆中,然后优化下一步操作。 ## 实际价值 这种递归方法不仅突破了上下文窗口的硬限制,还避免了“lost in the middle”问题。对于金融、法律、学术研究等需要处理超长文档的领域,RLM 提供了一种可扩展的解决方案。Amazon Bedrock AgentCore 和 Strands Agents SDK 的组合,让开发者能够快速构建这类应用,而无需从头实现复杂的工作流。 ## 小结 上下文窗口不再应该是文档分析的瓶颈。通过递归语言模型和 Amazon Bedrock AgentCore,你可以将文档处理能力提升到新的水平。无论是百万字符的报告还是多文件集合,RLM 都能让你在不丢失信息的前提下进行深入分析。

AWS ML12天前原文

## 一句话总结 **Runtime** 是一个为团队协作设计的沙盒化编码智能体平台,让非工程师也能安全使用 Claude Code、Codex 等 AI 编码工具,无需工程师全程陪同。 ## 核心问题 当前,AI 编码智能体(如 Claude Code、Codex)能力强大,但直接使用时存在两大痛点: 1. **安全性**:智能体可能访问敏感数据、执行危险命令。 2. **门槛**:非工程师难以独立操作,需要工程师“手把手”指导。 Runtime 的目标就是解决这些问题,让 **全团队(包括销售、支持等非技术角色)** 都能安全、自主地使用编码智能体。 ## 产品亮点 ### 1. 沙盒化环境 每个智能体都在隔离的沙盒中运行,预装公司所需的 CLI、API、服务或 MCP 服务器。支持快照功能,**每次会话在几秒内启动**,无需重复配置。 ### 2. 专用智能体 团队可以为特定场景创建专用智能体,例如: - **告警检查员**:用于 #incidents 频道,自动调查问题、提交 PR。 - **销售勘探员**:用于 #revenue 频道,辅助客户挖掘。 - **支持分类员**:自动处理工单、草拟回复。 这些智能体可以通过 Slack、Linear、GitHub 等工具触发,**自动运行并在完成后暂停**。 ### 3. 协作与治理 - **实时协作**:团队成员可以随时加入正在运行的智能体会话,观察进度、中途接手,最终输出 PR、部署、消息或报告。 - **全面监控**:管理面板显示每次会话的工具调用、思维链、文件变更,以及按智能体、用户、团队统计的成本。 - **安全控制**:支持预算限制、允许列表、审批门禁,确保使用可控。 ### 4. 多入口访问 支持通过浏览器、终端或 API 使用,满足不同工作流。 ## 行业背景与意义 随着 AI 编码工具的爆发,企业面临“效率提升”与“安全风险”的两难。Runtime 在两者之间架起桥梁,将智能体的能力从少数工程师扩展到整个组织。这不仅是效率工具,更是一种 **组织协作范式的创新**——让非技术人员也能直接参与软件交付,而工程师则能从重复的“保姆式”指导中解放出来。 ## 快速上手 Runtime 已开放免费试用,支持与 Claude Code、Cursor、Codex、Copilot、Gemini CLI、Devin 等主流编码智能体集成。团队可以在几分钟内配置环境、创建专用智能体,并开始协作。 ## 小结 Runtime 提供了一种安全、可管理的方式,让整个团队都能利用 AI 编码智能体的力量。对于希望提升开发效率、促进跨部门协作的企业,这无疑是一个值得关注的方向。

Hacker News10212天前原文

## 从数据孤岛到实时洞察:OPLOG 的 AI 代理实践 在电商与物流行业,数据碎片化是普遍挑战。土耳其科技驱动型履约公司 OPLOG 每月处理数百万件商品,服务横跨土耳其、英国和德国的多个品牌与全球市场。然而,其业务数据分散在 Hubspot CRM、通信系统、Microsoft Teams 以及 Databricks 数据仓库中,导致传统商业智能(BI)系统难以提供及时、全面的洞察。 为破解这一困局,OPLOG 基于 **Amazon Bedrock AgentCore** 构建了一套由 AI 代理驱动的生产级 BI 系统。该系统利用 **Strands Agents SDK** 开发了三个专用 AI 代理,分别负责**销售管道管理**、**数据质量管控**和**潜在客户调研**,并集成了 **Anthropic 的 Claude Sonnet** 模型与 **Amazon Bedrock Knowledge Bases** 实现检索增强生成(RAG)。 ### 核心架构与实现 三个 AI 代理分工明确: - **销售管道代理**:自动从 Hubspot CRM 抓取销售阶段数据,结合客户沟通记录与团队聊天上下文,自动更新交易状态、识别瓶颈,并生成每周预测报告。 - **数据质量代理**:持续监控 CRM 中的字段完整性、重复记录和异常值,自动触发数据清洗工作流,将数据完整度从 70% 提升至 91%。 - **调研代理**:针对潜在客户,自动从公开数据源和内部知识库中提取公司背景、行业趋势和竞品信息,生成结构化的客户画像,将人工调研时间缩短 98%。 所有代理通过 **Amazon Bedrock AgentCore** 统一管理,利用 Claude Sonnet 的推理能力进行任务分解与决策,并通过 **RAG** 机制从 Amazon Bedrock Knowledge Bases 中检索最新的业务文档和交易记录,确保输出基于实时数据。 ### 业务成效:数据驱动决策的闭环 OPLOG 的实践证明了 AI 代理在 BI 场景中的巨大价值: - **销售周期缩短 35%**:代理实时更新管道状态,销售团队能立即跟进高价值机会,避免因信息滞后导致的丢单。 - **CRM 数据完整性提升 91%**:自动化数据校验与补全大幅减少了人工录入错误,为后续分析提供可靠基础。 - **人工调研时间减少 98%**:调研代理将原本需要数小时的客户背景调查压缩至几分钟,让销售团队专注于高价值互动。 ### 行业启示:AI 代理重塑 BI 范式 OPLOG 的案例并非孤例。随着企业数据量激增,传统 BI 工具(如报表与仪表盘)已难以满足实时、交互式的决策需求。AI 代理通过**自主感知、推理与行动**,能够主动发现数据异常、触发工作流并生成可执行的洞察,将 BI 从“被动查询”升级为“主动服务”。 结合 **Amazon Bedrock AgentCore** 的托管能力,企业无需自建复杂的代理编排系统,即可快速集成大语言模型、知识库和业务 API。对于面临类似数据碎片化问题的 B2B 组织而言,这一架构提供了一条低门槛、高回报的落地路径。 > 提醒:本文基于 AWS 官方博客内容整理,所有数据均来自 OPLOG 的实际运营结果。

AWS ML12天前原文

Marshall 最新发布的 Milton ANC 头戴式耳机,凭借独特连接功能和经典设计,可能吸引长期偏好 Bose 和 Sony 的用户。该耳机定价 229 美元,在便携性、续航和音质上均有亮点。 ### 设计传承与升级 Milton ANC 延续了 Marshall Major V 的折叠设计,但升级了更大尺寸的耳垫和记忆海绵,提升被动降噪与佩戴舒适度。方形 TPU 模塑耳罩、纹理皮革表面、黄铜金属徽标及粉末涂层金属臂,共同营造出高端质感。耳机重 200 克,略重于 Major V 的 186 克,但折叠结构仍保持便携性。 ### 音质与连接突破 Marshall 为 Milton ANC 配备了全新驱动系统,旨在优化低音和高频延展。支持 SBC、AAC、LC3 及 LDAC 编解码器,驱动单元尺寸为 32mm(Major V 为 40mm)。更值得注意的是,该耳机搭载 **蓝牙 6.0 与 LE Audio**,原生兼容 Apple Find My 和 Google Find Hub 服务,这意味着无论 iPhone 还是 Android 用户,都能在各自生态中轻松定位耳机。这一跨平台无缝连接体验,是 Bose 和 Sony 同类产品尚未完全实现的差异化优势。 ### 市场定位与竞争 在 Bose 和 Sony 主导的降噪耳机市场,Milton ANC 以 **229 美元** 的定价切入中端价位。其核心卖点并非极致降噪,而是将 Marshall 标志性的摇滚调音、耐用设计以及最新的蓝牙连接技术结合,吸引追求个性与便捷的用户。对于厌倦了传统旗舰耳机“大而全”策略的消费者,Milton ANC 提供了一个更轻巧、更具风格的选择。 ### 小结 虽然尚未经实际测试,但 Marshall Milton ANC 在连接性上的创新,确实为 on-ear 耳机品类注入了新活力。如果你看重设备间的无缝切换和查找功能,又偏爱 Marshall 的复古美学,这款耳机值得密切关注。

ZDNet AI12天前原文

## 当招聘变成“体力活”:AI 如何破局? 一份针对 748 名 HR 领导者的调查显示,招聘人员平均在每个职位空缺上花费 **17.7 小时** 处理行政事务——相当于两个多工作日。另一项 2024 年的 SmartRecruiters 调查发现,**45% 的人才招聘负责人** 超过一半的工作时间花在可自动化的任务上。这种行政负担导致简历筛选流于表面,大量合格候选人被忽略,而匹配结果往往取决于简历格式和关键词密度,而非真实能力。 ## 架构解析:Serverless + 大模型 + 安全护栏 AWS 近期发布了一篇技术博客,详细展示了如何利用 **Amazon Bedrock** 构建一套 AI 驱动的招聘助手。这套参考架构(非生产就绪方案)整合了多个 AWS 服务,形成一个协同工作的无服务器系统: - **Amazon Bedrock Converse API + Amazon Nova Pro**:负责核心的 AI 推理,包括简历解析、候选人评分、技能评估和面试题生成。 - **AWS Lambda**:处理业务逻辑,串联各个模块。 - **Amazon API Gateway**:提供 API 路由。 - **Amazon DynamoDB & Amazon S3**:分别存储结构化数据(如评分结果)和原始简历文件。 - **Amazon Bedrock Guardrails**:提供 **PII 匿名化、提示词攻击检测和偏见内容过滤**,确保 AI 应用负责任地运行。 前端方面,使用 **AWS Amplify** 托管 Web 应用,**Amazon Cognito** 处理用户认证与 JWT 令牌管理。 ## 核心能力:从简历到面试题的全链路智能化 1. **简历解析与多维评分**:AI 不仅提取基本信息,还能基于职位要求计算 **多维度兼容性分数**,避免“关键词堆砌”式的误判。 2. **个性化面试题生成**:根据候选人的背景和岗位需求,动态生成有针对性的面试问题,帮助面试官深入考察真实能力。 3. **数据驱动的洞察**:所有评估结果以结构化数据存储,方便后续分析和决策。 ## 行业背景与思考 当前,AI 在招聘领域的应用已从简单的关键词匹配走向 **深度语义理解与推理**。Amazon Bedrock 提供的托管大模型服务,让企业无需自建基础设施即可调用前沿模型,同时通过 Guardrails 解决合规与伦理问题——这对处理敏感个人数据的 HR 场景尤为重要。 不过,博客也明确指出,这套架构仅用于 **学习目的**,并非生产就绪方案。实际落地时,企业需要根据自身需求调整,例如增加更严格的隐私保护措施、优化成本控制,或与现有 ATS(申请人追踪系统)集成。 ## 小结 AI 招聘助手并非要取代人类面试官,而是将 HR 从繁琐的行政工作中解放出来,让他们专注于更有价值的决策——比如判断候选人的文化契合度、软技能和发展潜力。随着 Amazon Bedrock 等平台降低了大模型的使用门槛,这类智能化工具将加速进入中小企业,改变整个招聘行业的效率格局。

AWS ML12天前原文

## 概述 传统上,业务分析师在调整仪表板以响应变化的需求时,往往需要等待数天。典型的流程涉及向 IT 团队提交修改请求,由 IT 人员解读需求、查阅 API 文档、理解表结构并部署变更。虽然这种方式能保证适当的监督和质量控制,但在需要快速更新仪表板时,可能导致数天的周转时间。 本文介绍的方案结合了 **Amazon Bedrock AgentCore**、**Strands Agents** 和 **Amazon QuickSight** 的强大功能,构建了一个安全、可扩展且智能的系统,用于创建和运行 AI 代理,同时将数据转化为可执行的业务洞察。 ## 解决方案架构 该方案采用基于 Amazon Bedrock AgentCore 和 Strands 框架的多智能体架构。Amazon Bedrock AgentCore 是一个智能体平台,用于安全地大规模构建、部署和运行高效代理,无需管理基础设施。Strands Agents 是一个代码优先的框架,用于构建与 AWS 服务集成的代理。Amazon QuickSight 则提供 AI 驱动的 BI 能力,将分散的数据转化为战略洞察。 架构由三个专门代理协作组成: - **查找仪表板代理**:执行发现操作,包括搜索仪表板、检索仪表板和数据集中的列元数据。 - **修改仪表板代理**:执行配置变更,如验证列、更新表格视觉效果以及创建新的仪表板版本。 - **编排代理**:根据意图分类,将用户请求路由到相应的专门代理。 ## 工作流程 编排代理作为用户交互的入口。当用户提交自然语言查询(例如“将 lastname 添加到测试仪表板”)时,Amazon Nova 将请求分类为对话型或操作型。对话型查询直接利用 Nova 的大语言模型能力进行响应;操作型请求则通过 Strands 框架路由到相应的专门代理进行处理。 ## 行业背景与价值 在 AI 行业,将自然语言处理与智能代理结合,正在重新定义企业与数据交互的方式。这一方案不仅缩短了仪表板修改的周期,还降低了非技术用户的使用门槛。业务分析师无需掌握技术细节,即可通过自然语言指令完成复杂的仪表板操作,从而加速决策过程。 该方案体现了 **Agentic AI** 在商业智能领域的落地潜力:通过多代理协作,将意图识别、任务分解与执行自动化融为一体。Amazon Bedrock AgentCore 提供的安全性和动态扩展能力,确保了生产级部署的可靠性。 ## 关键优势 - **效率提升**:将仪表板修改时间从天级缩短至分钟级。 - **自然语言交互**:用户无需学习特定命令或 API。 - **安全可控**:代理访问权限和数据操作受到严格管理。 - **可扩展性**:基于微服务架构,易于添加新的代理或功能。 ## 总结 通过 Amazon Bedrock AgentCore、Strands Agents 和 Amazon QuickSight 的组合,企业可以构建一个智能的仪表板自动化系统,让数据分析师和业务用户都能以更自然、更高效的方式获取洞察。这不仅是技术上的进步,更是企业数据文化向自助式、即时响应方向转型的重要一步。

AWS ML12天前原文

Spotify 与环球音乐集团(UMG)达成一项具有里程碑意义的授权协议,将允许付费用户利用 AI 工具为流媒体曲目生成混音和翻唱版本。该功能作为 Premium 用户的付费附加组件推出,参与计划的艺术家将从这些 AI 生成的混音中获得版税收入。这是自去年 10 月 Spotify 宣布与多家主流唱片公司合作开发“负责任的 AI 产品”以来,首个落地的具体成果。 ## 合作框架与核心原则 Spotify 与 UMG 的此次合作明确了三大指导原则:**参与选择权、公平补偿与新增收入、艺术家与粉丝的连接**。Spotify 联合 CEO Alex Norström 表示:“我们所构建的一切都基于参与艺术家的同意、署名和补偿。”UMG 首席执行官 Sir Lucian Grainge 则强调:“音乐行业最有价值的创新始终是拉近艺术家与粉丝的距离。这一开创性的 AI 超级粉丝计划旨在支持人类艺术创作、加深粉丝关系,并为艺术家和词曲作者创造额外收入机会。” ## 商业模式与艺术家权益 该 AI 工具将作为 Spotify Premium 的付费增值服务推出,具体定价和上线时间尚未公布。艺术家可以选择退出该计划,而选择参与的艺术家将获得由 AI 生成的混音和翻唱带来的版税收入。这种设计试图解决此前 AI 音乐生成工具面临的版权争议——通过确保原始创作者获得收益,在技术创新与权利保护之间取得平衡。 ## 行业影响与未来展望 Spotify 此前已与索尼音乐、华纳音乐、Merlin 和 Believe 等主要厂牌达成类似合作意向。此次与 UMG 率先敲定协议,标志着主流音乐产业对 AI 生成内容的态度从抵制转向合作。值得注意的是,Spotify 同期也在加强对“真人播客”的验证,以区分 AI 生成内容与人类创作。随着 AI 混音功能的推出,音乐流媒体平台有望开辟新的收入来源,同时也将重新定义“创作”的边界——当粉丝的 AI 改编也能为艺术家创收时,音乐消费的互动模式或将迎来根本性变革。

The Verge12天前原文
我用Gemini的AI化身克隆了自己,结果令人不安地像我

我使用Gemini应用生成了一段逼真的视频,其中包含一个数字克隆的我。Google将此视为创作的未来,而我仍然感到毛骨悚然。 ## 初次体验:从设置到生成 一个温暖的午后,我在旧金山多洛雷斯公园为一只史前恐龙唱生日歌。当我完成小夜曲时,一个插着粉色蜡烛的纸杯蛋糕凭空出现在我空着的手中。吹灭蜡烛后,那个CGI风格的恐龙露出满足的表情。视频中的男人看起来和听起来都像我,但实际上这是使用Google Gemini应用的新功能——**化身(Avatars)** 生成的。这些数字再现类似于OpenAI已停用的Sora应用的核心功能。化身由Google新的Omni视频模型驱动,仅对付费订阅用户开放。我每月支付20美元订阅Google AI Pro计划,但很快就用完了使用限额(每5小时重置)。我只问了几个问题并生成了两个10秒的片段,就被提示等待。 ## 技术细节与限制 与OpenAI允许用户决定是否允许他人使用自己肖像生成视频不同,Google只允许成年用户用自己的化身制作视频。设置过程大约需要5分钟:在光线充足的房间里,用手机摄像头对准脸部,朗读一串两位数数字,然后缓慢向右转头再向左转。完成后,我的数字克隆诞生了。需要注意设置时的着装,因为衣服很可能出现在AI生成的画面中。 ## 质量与感受 前两个片段分别是我在旧金山为恐龙唱歌和在金门大桥下冲浪。我既印象深刻又感到不安。内容有些尴尬,存在混乱的时刻和不合逻辑的服装,但视频中的人确实是我。我放大画面观察嘴巴的动作——牙齿有点不协调,但那就是我,连双下巴都还原了。 ## 行业背景与前景 Google将化身视为创作的未来,但这类技术也引发伦理担忧。相比OpenAI的开放态度,Google采取了更谨慎的策略,限制用户只能生成自己的化身,这在一定程度上降低了滥用风险。然而,随着AI视频生成技术日益成熟,如何在创新与隐私保护之间取得平衡仍是行业面临的重大挑战。

WIRED AI12天前原文

Spotify 近日发布了一款名为 **Studio by Spotify Labs** 的全新独立 AI 应用,能够根据用户的个人数据生成每日简报、播客和播放列表。该应用目前以研究预览形式推出,面向 18 岁以上用户,未来几周内将正式上线。Studio 的独特之处在于,它不仅能调用用户的 Spotify 收听历史,还能连接邮箱、日历、笔记等第三方应用,从而生成高度个性化的音频内容。 ## 功能亮点:从“被动听”到“主动生成” Studio 的核心能力是 **通过聊天机器人提示词生成音频**。用户输入需求后,AI 会综合分析其 Spotify 数据与已授权的个人应用信息,制作出专属的每日简报播客。更值得关注的是,Spotify 宣称该 AI 能“代表用户采取行动”,例如研究主题、使用浏览器、整理信息或协助完成任务。所有生成的内容均可保存至用户的 Spotify 资料库。 这一功能将 Spotify 从传统的音频流媒体平台推向 **个性化内容创作平台**。此前,Spotify 已允许用户将来自 OpenClaw 和 Claude 等第三方 AI 生成的播客保存到资料库,并计划于下月推出“个人播客”(Personal Podcasts)——用户可直接在 Spotify 应用内通过提示词生成 AI 播客。 ## 行业背景:AI 播客赛道竞争加剧 Spotify 并非首家涉足 AI 生成播客的公司。自 2024 年起,Google 的 NotebookLM 已提供类似功能;亚马逊的 Alexa Plus 和微软的 Edge 浏览器也在近期推出了各自的 AI 播客特性。部分用户将其视为快速获取新闻或学习新知识的工具,但整体使用规模尚不明确。 然而,Spotify 的优势在于其 **音频内容生态的天然契合性**。用户本就习惯通过 Spotify 收听播客和音乐,而 Studio 的推出进一步降低了内容创作门槛——用户无需专业设备或编辑技能,即可生成定制化音频。不过,Spotify 明确表示 Studio 仅用于生成简报、播客和播放列表,**不涉及音乐创作**。 ## 用户价值与潜在争议 对于普通用户而言,Studio 的最大吸引力在于 **效率与个性化**。例如,通勤前生成一份融合了日程安排、新闻要点和音乐推荐的播客,比手动切换多个应用更便捷。但这也引发了隐私担忧:用户是否愿意将邮箱、日历等敏感数据授权给 AI?此外,AI 生成播客能否替代真人主播的独特观点和情感表达,仍是未知数。 Spotify 同时宣布,Premium 用户即日起可使用 **播客问答聊天机器人**,它能针对正在收听的节目提供时间戳或主题解析。这些举措表明,Spotify 正试图通过 AI 技术巩固其音频领域的领先地位,但如何在创新与隐私、效率与人文价值之间取得平衡,将是其面临的关键挑战。

The Verge12天前原文

曾被誉为“最美 Linux”的 Deepin 桌面环境,如今正面临被主流发行版抛弃的窘境。继 SUSE 之后,Fedora 也正式从官方仓库中移除了所有 Deepin 软件包。这一决定并非一时冲动,而是基于长期积累的安全隐忧。 ## 从惊艳到隐忧 Deepin 桌面环境(DDE)以其精美的界面和用户体验一度被视为 Linux 桌面的“破圈”之作。然而,早在 2018 年,Deepin 就被曝出商店向中国第三方分析服务 CNZZ 发送未加密请求,涉及用户浏览器代理等信息。尽管 Deepin 官方随后停止了数据收集,且后续取证未发现核心层存在间谍软件,但信任裂痕已然产生。 ## SUSE 的“临门一脚” 2025 年,SUSE 率先宣布切断与 Deepin 的关系。其调查指出,Deepin 社区打包者为绕过安全审查,在 openSUSE 中采用了一种规避标准 RPM 打包机制的变通方案来安装受限资源。SUSE 直言:“鉴于这一违规行为以及 Deepin 代码审查的艰难历史,我们将暂时从 openSUSE 发行版中移除 Deepin 桌面包。” ## Fedora 紧随其后 在 SUSE 声明之后,Fedora 团队也以类似的安全理由移除了 Deepin 软件包。这意味着 Fedora 和 Red Hat Enterprise Linux 用户将无法再从官方仓库直接安装 DDE。Red Hat 作为企业级 Linux 的标杆,其决策往往具有行业风向标意义。 ## 不是终点,而是转折 对于 Deepin 而言,被两大主流发行版“拉黑”无疑是沉重打击。但换个角度看,这也为 Deepin 提供了自我革新的契机。目前,Deepin 的发展路径已十分明确:**必须进行严格的代码审查**,重建社区信任。如果 Deepin 能够借此机会彻底解决安全合规问题,未来或许仍有机会重返主流仓库。 ## 对用户的影响 对于普通用户来说,最直接的影响是无法再通过 Fedora 或 openSUSE 的官方源一键安装 DDE。不过,用户仍可通过第三方源或自行编译的方式使用 Deepin 桌面,但这增加了安全风险和操作门槛。对于追求稳定与安全的用户,建议暂时转向其他桌面环境如 GNOME、KDE Plasma 或 Budgie。 ## 结语 Deepin 的遭遇再次提醒我们:在开源世界,**安全与信任是发行版的生命线**。任何绕过审查的“捷径”都可能带来长期代价。Deepin 能否走出低谷,取决于其能否以透明、合规的方式重新赢得社区的信任。

ZDNet AI12天前原文

摩托罗拉为 Razr Fold 打造的 Smart Connect 桌面模式,让我几乎可以告别笔记本电脑。以下是我的实际体验。 ## 从手机到桌面:一次无缝切换 当我第一次将 Razr Fold 连接到便携显示器时,Smart Connect 界面自动弹出,手机屏幕瞬间变成触摸板——无需额外配件,操作直观。连接方式灵活:有线、无线或通过智能眼镜投射,都能获得接近完整的桌面体验。 ## 性能与兼容性:够用且流畅 在 Razr Fold 上运行 Smart Connect 时,多任务处理流畅。我同时打开了浏览器、文档编辑器和 Slack,切换迅速,没有明显卡顿。值得注意的是,它支持窗口自由缩放和排列,与 Windows 11 的体验高度相似。外接键盘和鼠标后,打字和导航效率大幅提升。 ## 关键场景:移动办公的新选择 对于经常出差或需要临时办公的人来说,Smart Connect 提供了一个轻量级方案。我尝试用它撰写文章、回复邮件、甚至进行简单的图片编辑。虽然重度任务(如视频渲染)仍需笔记本,但日常办公已足够。 ## 与竞品对比:差异化优势 与三星 DeX 相比,摩托罗拉的 Smart Connect 在连接便捷性和触控交互上更胜一筹。DeX 需要专用底座或有线连接,而 Smart Connect 支持无线投屏,且手机作为触控板的体验更自然。不过,应用生态上仍落后于 DeX,部分专业软件尚未适配。 ## 小结:值得尝试的移动工作站 Smart Connect 让 Razr Fold 从一个折叠手机升级为便携工作站。如果你已经有便携显示器或智能眼镜,这套组合几乎可以替代笔记本电脑完成大部分工作。当然,它并非完美——重度任务仍需传统 PC,但对于移动办公者来说,这是一个令人兴奋的补充。

ZDNet AI12天前原文

社交平台上充斥着 AI 生成的劣质片段,如丹尼尔·克雷格骑 Vespa 或哥斯拉大战金刚,这些内容让许多人认为好莱坞将被 AI 取代。然而,AI 视频的真正潜力并不在于制造这些“片段污染”,而是通过智能体技术重塑整个影视制作流程。 Luma AI 的 CEO Amit Jain 指出,早期 AI 视频公司试图说服好莱坞用提示词替代摄像机,但这远远不够。生成的 10 到 16 秒片段无法构成镜头、序列或场景。如今,Luma 等公司转向开发 AI 智能体,覆盖从前期策划到后期制作的端到端工作流,类似于 Anthropic 从“氛围编码”转向智能体工作流的演进。 这种变革意味着 AI 不再只是生成视频的工具,而是融入剧本分析、分镜设计、拍摄调度和视觉特效等环节。例如,Luma 与 Wonder Project 合作成立的新制作公司 Innovative Dreams,正探索如何用 AI 智能体辅助电影创作。虽然高质量影视作品仍需人类创意主导,但 AI 能显著提升效率,降低试错成本。 好莱坞并未“被煮”,而是站在技术升级的关口。AI 视频的下一阶段,不是制造更多廉价片段,而是成为制片人的智能助手,让创意更快落地。这或许才是 AI 对娱乐产业最深远的影响。

The Verge12天前原文

Spotify 正在从单纯的播客消费平台,向“人人皆可创作”的个性化音频平台进化。近日,该公司宣布推出一系列基于 AI 的新功能,涵盖个人播客生成、AI 问答以及创作者工具,标志着其在音频内容领域的又一次重要布局。 ### 一、个人播客:你的专属音频简报 核心亮点是 **AI 驱动的个人播客生成功能**。用户只需输入一个想法或自定义提示词,Spotify 就能自动生成一档播客。该功能不仅支持一次性主题创作,还能**按日或按周生成定期简报**,例如“分享我所在城市的每日更新,并告诉我喜欢的艺人有哪些本地演出”,或者“用五分钟帮我理解经济学”。 更强大的是,用户可以**附加链接、PDF 和文本**作为素材来源,并**选择自定义语音**来播报。这让人联想到 Google 的 NotebookLM、ElevenLabs 的阅读器以及前 NotebookLM 开发者推出的 Huxe 应用——Spotify 显然借鉴了这些产品的思路,但将其无缝集成到自己的生态中。 目前该功能可通过 GitHub 上的命令行工具(支持 Claude Code 和 Codex)体验,未来将直接整合进 Spotify 应用内。此外,Spotify 还发布了**桌面版应用 Studio by Spotify Labs**,它可以连接用户的邮箱和日历,生成个性化的日常简报。 ### 二、AI 问答:边听边问,深度互动 针对 Premium 移动端用户,Spotify 在美国、瑞典和爱尔兰率先上线了 **AI 问答功能**。用户在收听播客时,可以针对当前剧集或其中提到的概念提问,AI 会即时给出答案。同时,用户还能请求针对特定主题的播客推荐。 这一功能与 Google 本周早些时候推出的“Ask YouTube”高度相似,本质上是将大语言模型的理解能力嵌入到音频消费场景中,让被动收听变为主动探索。Spotify 透露,**视频播客的观看量同比增长了 50%**,而问答功能有望进一步提升用户参与度和留存率。 ### 三、创作者生态:变现工具与订阅制 对于播客创作者,Spotify 开放了 **创作者赞助工具**,帮助其管理品牌合作。同时新增了**订阅制功能**,允许创作者对独家内容和体验收费。Instagram、Facebook 和 Snap 等社交平台早已提供类似产品,Spotify 正在追赶这一趋势,试图构建更完整的创作者经济闭环。 ### 行业视角 从“听播客”到“做播客”,再到“问播客”,Spotify 正在用 AI 重新定义音频体验。这不仅是技术能力的展示,更是对用户粘性和内容差异化战略的深度考量。随着生成式 AI 在音频领域的渗透加速,Spotify 有望在个性化内容推荐之外,开辟出“用户即创作者”的新增长路径。

TechCrunch12天前原文

Spotify 于周四在投资者日活动中宣布,将在其 **Spotify for Authors** 平台中集成 **ElevenLabs** 的 AI 语音技术,推出一款面向自助出版有声书的工具。该功能计划于 **今年 6 月** 以邀请制开启 Beta 测试,初期仅支持英语。值得注意的是,使用该工具生成的有声书 **不附带独家合同**,作者可自由将作品发布至其他平台。 这一举措建立在 Spotify 与 ElevenLabs 已有合作的基础上——此前作者已可通过 ElevenLabs 平台制作有声书并提交至 Spotify。Spotify 还与 Google Play Books 合作支持数字旁白内容,但 ElevenLabs 更富表现力和人性化的语音模型可能是此次升级的关键原因。有趣的是,ElevenLabs 本身已在 2025 年推出了自己的自助出版平台。 与此同时,Spotify 将 **Spotify for Authors** 平台的语言支持扩展至 **10 种新语言**,包括法语、加拿大法语、德语、荷兰语、拉丁西班牙语、瑞典语、芬兰语、冰岛语、丹麦语和挪威语。此外,公司计划今年升级 **Audiobook+** 套餐,提供更高的收听限额,并未来为学生和家庭增加新选项(具体定价和用量细节尚未公布)。 截至目前,Spotify 已拥有 **超过 100 万 Audiobook+ 订阅用户**,有声书业务年化经常性收入有望达到 **1 亿美元**。公司还推出了一项自然语言提问功能,帮助用户发现有声书。今年夏季,Spotify 将把基于提示生成播放列表的功能(当前适用于播客和音乐)扩展至有声书。 过去几年,Spotify 大幅加码有声书领域,已积累 **70 万本有声书** 目录。公司通过拓展国际市场、投资非英语作品、支持应用内购买、发布有声书排行榜,以及在美国和英国启动作者实体书销售计划等举措,使收听时长同比提升了 **60%**。超过一半的 Audiobook+ 用户来自 Spotify 的免费层级,这表明有声书正成为吸引和留存用户的有效手段。

TechCrunch12天前原文

Spotify 近日发布了一款名为 **Studio by Spotify Labs** 的独立桌面应用,以研究预览形式在 20 多个市场上线,旨在让用户通过 AI 生成个性化播客。该应用的核心功能是允许用户基于个人数据——如日历、邮件、日程等——创建每日简报或主题播客,甚至支持多步骤指令,例如“为我规划意大利自驾游的每日音频简报,推荐沿途晚餐地点,并以播客推荐结束”。所有生成的播客均保存在用户的 Spotify 库中,可跨设备同步,但不会公开分享。 这一举措直接对标 Google 的 **NotebookLM**,后者因率先推出基于源材料的播客生成功能而走红,并随后增加了基于 Google Discover 信息流的每日播客功能。与此同时,Adobe、ElevenLabs 以及 Hero、Huxe 等应用也纷纷跟进这一格式。Spotify 的差异化在于深度整合个人上下文——应用内置的 AI 智能体可联网抓取用户邮件和日程信息,从而生成真正“私人订制”的音频内容。 值得注意的是,Spotify 此前已为开发者推出命令行工具,供 Claude Code 或 Codex 等编码工具的用户生成播客并保存到库中;而新应用则面向非技术用户,降低了使用门槛。公司强调,目前仍处于早期预览阶段,AI 可能犯错或输出不可靠内容,用户需谨慎使用。 从行业视角看,Spotify 此举是其“全音频”战略的延伸——通过将 AI 播客嵌入个人数据流,它希望在知识消费场景中占据一席之地。与 NotebookLM 偏重学术或文档驱动的模式不同,Spotify 更强调生活场景的实用性与个性化,这或许能吸引更广泛的普通用户。然而,隐私与数据安全将是关键挑战:用户是否愿意将日历、邮件等敏感信息授权给一个娱乐平台?此外,AI 生成内容的准确性与时效性也需要持续优化。 简言之,Spotify 正在将“听”的边界从音乐、播客扩展到个人知识管理,与 Google 的竞争也从流媒体延伸至 AI 生产力工具。这场争夺“耳朵经济”的新战役,才刚刚开始。

TechCrunch12天前原文

微软宣布将逐步淘汰 SMS 短信验证方式,推动用户改用通行密钥(passkey)等更安全的认证方法。短信验证码因缺乏加密、易被拦截和 SIM 卡交换攻击而成为安全隐患。微软建议用户设置通行密钥,通过生物识别或设备 PIN 实现无密码登录,同时保留备用邮箱验证。这一举措顺应了行业向无密码认证转型的趋势,有助于提升账户安全性并简化登录流程。

ZDNet AI12天前原文
毛利语文本转语音模型:拒绝大科技价值观,守护土著语言主权

在全球人工智能浪潮中,大型科技公司主导着语音助手、翻译工具和文本转语音(TTS)模型的发展,但它们的价值观往往与土著社区的需求相冲突。最近,新西兰怀卡托大学AI研究所联合主任、计算机科学家Te Taka Keegan领导的项目,开发了一款面向毛利语的文本转语音模型。该模型并非简单套用大科技公司的技术框架,而是从数据收集到模型训练全程由毛利社区主导,确保符合毛利文化价值观和语言特性。 ## 为什么需要土著拥有的AI模型? 主流TTS模型通常依赖海量标注数据,这些数据多来自英语等主流语言,且训练过程往往忽视少数语言的语音、语法和文化背景。对于毛利语这类濒危语言,大科技公司的模型可能产生不自然的发音、误用敬语,甚至因训练数据不足而表现糟糕。更关键的是,数据主权问题——谁拥有语音数据?谁决定模型的使用方式? Keegan团队的做法是:**从社区收集高质量的毛利语语音数据**,由母语者参与标注和验证,确保模型能准确反映毛利语的韵律、重音和方言差异。模型本身也采用开源架构,避免被单一商业公司控制,社区可以自由部署、修改和扩展。 ## 技术路径与挑战 该模型基于**端到端TTS架构**,使用Transformer和WaveNet等技术,但针对毛利语音节结构(如长元音、双元音和声门塞音)进行了优化。训练数据来自数百位毛利语母语者,涵盖不同年龄段和地区方言,以提升模型的泛化能力。与传统模型不同,团队刻意避免使用自动语音识别(ASR)生成的伪标签,因为这类数据可能引入错误,损害语言质量。 挑战在于:毛利语是低资源语言,可用的公开数据远少于英语。团队通过社区合作、口述历史录音和语言振兴计划获取数据,并设计了**数据增强策略**(如音高调整、速度变化)来扩充训练集。此外,模型需要处理毛利语中特有的**语法结构**,例如动词前缀和名词所有格标记,这些在英语TTS中并不常见。 ## 土著AI模型的全球趋势 毛利语TTS项目并非孤例。全球范围内,多个土著社区正在开发自己的AI模型: - **加拿大**:因纽特语和克里语的语音助手,由土著非营利组织主导,重点保护方言多样性。 - **澳大利亚**:原住民语言TTS项目,结合传统故事叙述和现代语音合成,用于教育场景。 - **北欧**:萨米语自然语言处理工具,强调数据主权和社区许可协议。 这些项目的共同点是:**拒绝大科技公司的“一刀切”解决方案**,转而建立社区拥有的数据基础设施和模型。它们通常采用开源许可,确保技术利益回流社区,而不是被商业公司垄断。 ## 对AI行业的意义 毛利语TTS模型挑战了AI发展的主流叙事:技术必须由硅谷巨头定义。它证明,**低资源语言模型可以做到高质量,只要社区深度参与**。这为其他濒危语言提供了可复制的路径: 1. **数据主权优先**:社区控制数据收集、存储和使用。 2. **文化适配**:模型设计必须尊重语言的文化内涵(如敬语、禁忌词汇)。 3. **开源与可持续**:避免供应商锁定,允许社区长期维护。 当然,这类项目也面临资金和人才短缺问题。Keegan团队呼吁更多政府和基金会支持土著AI研究,并建议大科技公司提供技术基础设施,但将控制权交给社区。 ## 小结 毛利语TTS模型不仅是技术成果,更是文化自决的象征。它提醒我们:AI的价值观并非中性,而是由创造者决定。当社区掌握技术主权时,AI才能真正服务于多元文化,而不是强化主流语言的霸权。

IEEE AI12天前原文

5月19日,Anthropic在伦敦举办了为期两天的开发者活动“Code with Claude”,恰逢Google I/O大会同期举行。Anthropic员工强调这只是巧合,并非刻意竞争。活动现场,工程师Jeremy Hadfield询问在场开发者:“过去一周内,谁提交了完全由Claude编写的拉取请求?”近半数人举手。当被问及“谁提交了完全由Claude编写且自己未阅读代码的拉取请求?”时,多数手仍举着,伴随紧张的笑声。 这并非新闻——LLM驱动的工具如Anthropic的Claude Code和OpenAI的Codex已彻底改变软件开发方式。顶级科技公司如今乐于宣称开发者手写代码的比例极低。Hadfield表示:“Anthropic的大部分软件现在由Claude编写,Claude Code中的大部分代码也是Claude自己写的。”OpenAI、Google和Microsoft也有类似说法。 令人瞩目的是,这种新范式已变得如此平常,且普及速度惊人。这是Anthropic第二次举办开发者活动,同时也在旧金山和东京举行。去年此时,公司刚发布Claude 4,其编码能力有限。但随着Claude 4.6和4.7(分别于2月和4月发布)的推出,Claude Code已成为越来越多开发者愿意托付工作的工具。 Anthropic的目标是将自动化推向极致——不是让AI生成代码再由人类修正,而是让Claude自行检查和修正。Claude Code负责人Boris Cherny在主题演讲中表示:“默认不再是‘我要提示Claude’,而是‘我要让Claude自我提示’。”理想情况下,开发者甚至不应看到错误信息,一切将由Claude处理、测试和调整,直到代码正常运行。 这一转变对开发者角色影响深远。Anthropic强调,AI并非取代开发者,而是让他们专注于更高层次的设计与决策。然而,现场多数开发者承认未阅读AI生成的代码,引发对代码质量与安全性的担忧。活动展示了编程的未来——人机协作的新模式,但伴随责任与信任的挑战。

MIT Tech12天前原文

随着阵亡将士纪念日临近,各大品牌纷纷推出笔记本电脑优惠活动。本文整理了当前最值得关注的笔记本折扣,涵盖苹果、戴尔、联想等主流品牌,包括 MacBook Air M5、MacBook Pro M5、华硕 Vivobook 14、戴尔 Plus 16 和 HP EliteBook 6 G1a 等型号,最高可节省 600 美元。这些优惠来自亚马逊、百思买等可靠零售商,适合有升级或购机需求的消费者。

ZDNet AI12天前原文

阵亡将士纪念日即将到来,沃尔玛已经提前对热门科技产品进行了大幅降价。以下是目前最值得关注的几款优惠: - **沃尔玛+会员**:首月仅需1美元(节省12美元) - **三星Odyssey Neo G7 43英寸Mini LED 4K游戏显示器**:售价499美元(节省400美元) - **Ninja Professional Plus搅拌机**:售价79美元(节省16美元) - **TCL 55英寸QM7K Mini LED QLED 4K电视**:售价648美元(节省302美元) 这些优惠涵盖了从家庭娱乐到厨房电器的多种品类,折扣力度相当可观。例如,三星Odyssey Neo G7显示器降价幅度高达44%,而TCL电视也直降302美元。沃尔玛+会员的折扣则让用户能以极低成本体验会员服务。 需要注意的是,这些价格可能随时变动,建议有需求的消费者尽早下单。ZDNET将持续关注更多促销动态,为读者提供最新信息。

ZDNet AI12天前原文