AI 资讯

每日聚合最新人工智能动态

1861

Siri 终于有了自己的专属应用，WWDC 2026 迎来重大变革

新上线

在 WWDC 2026 上，苹果发布了全新 AI 化版本的 Siri，被称为该助手历史上最大、最戏剧性的变革。最引人注目的是，Siri 现在拥有了一款独立应用，成为用户与助手互动的全新中枢。这款应用本质上是一个用户与 Siri 历史对话的仓库，类似于 ChatGPT 或 Claude 等聊天机器人的功能。用户可以滚动浏览所有过往对话，并重新访问某次会话。打开历史对话时，应用会提供内容概览，避免用户通读全文。此外，该应用也是发起新对话的入口。 Siri 现在提供了多功能界面，支持文本输入、文档和图片上传，以及语音模式，用户可以直接与它交谈。该应用覆盖 iOS、macOS 和 iPadOS，所有对话通过 iCloud 私密同步，延续了苹果一贯的隐私保护策略。独立应用的推出显然是为了让用户在 Siri 能力日益强大的背景下，更有序地与之交互。这标志着苹果在 AI 助手领域迈出了关键一步，将 Siri 从一个被动语音助手转变为主动、可回溯的智能伙伴。随着 Apple Intelligence 的持续更新，Siri 的应用生态有望进一步扩展，为用户提供更连贯、更个性化的 AI 体验。

TechCrunch1个月前原文

1862

苹果新功能：用 iPhone 相机对着账单，Siri 帮你分账

新上线

苹果在 WWDC 2026 上推出了一项实用新功能：**Siri in Camera**。用户只需用 iPhone 相机对准账单，Siri 会自动识别并让每项菜品可被点击选择，然后根据各自点的东西通过 Apple Cash 分别发起付款请求。苹果软件副总裁 Sebastien Marineau-Mes 在发布会上演示了这一场景：“你和朋友聚餐后，用 iPhone 对着账单，选择自己点的东西，就能用 Apple Cash 分账。” 这项功能直击聚餐分账的痛点——轮流计算、尴尬催款、被迫为别人的消费买单。虽然 SplitWise 等第三方应用早已支持类似功能，但苹果的优势在于**原生集成**：分账请求直接通过 iMessage 发送，对方无需下载额外应用，体验更自然流畅。此外，Siri in Camera 还能用于估算食物营养信息，比如在餐厅拍下菜品即可查看热量等数据。从行业角度看，苹果正将 AI 能力嵌入最日常的场景——相机和支付。相比其他厂商强调的复杂多模态任务，苹果选择了“低门槛、高频率”的切入点，让 AI 解决真实社交中的微小尴尬。这或许比大模型“炫技”更能推动用户习惯改变。目前该功能仅限 Apple Cash 用户使用，且需在支持地区（如美国）可用。不过，随着 iOS 更新推送，未来有望覆盖更多支付方式。

TechCrunch1个月前原文

1863

苹果新Siri AI：更懂你，更个人化

新上线

在 **WWDC 2026** 上，苹果宣布对 Siri 进行重大改版，旨在让这款语音助手更智能、更个性化。新 Siri 将推出独立应用，并引入与 **Google Gemini** 的合作，以增强其底层模型能力。用户将能进行类似 ChatGPT 的聊天式交互，并访问历史对话。Siri 还能利用手机上的个人信息（包括当前屏幕内容）来回答问题，例如从备忘录中提取细节来撰写邮件或群聊草稿。这一更新标志着 Siri 从过去相对固定的功能模式，转向更具动态和上下文感知的 AI 助手。分析师指出，在大语言模型浪潮中，Siri 此前已落后于 Gemini、Claude 和 ChatGPT 等对手，此次改版旨在重新夺回竞争力。新功能预计将在今年晚些时候向消费者推送。 ## 从“工具”到“伙伴”的转变自 2011 年随 iPhone 4s 首次亮相以来，Siri 一直是智能手机语音助手的标杆，能完成查天气、设闹钟等基础任务。然而，随着生成式 AI 的爆发，Siri 的局限性日益凸显。苹果此次的应对策略是：**开放合作 + 深度集成**。与 Google Gemini 的合作意味着 Siri 将获得更强大的自然语言理解能力，而独立 Siri 应用的推出则让用户能像使用 ChatGPT 一样，随时开启连续对话。 ## 个人数据成为新引擎新 Siri 的核心亮点在于对个人数据的利用。当用户请求帮助时，Siri 可以跨应用调取信息——比如从“备忘录”中提取会议要点，或是根据当前屏幕内容提供建议。这种 **“屏幕感知”** 能力让 Siri 不再只是被动应答，而是主动理解上下文。不过，这也引发了隐私担忧。苹果强调，数据处理将在设备端优先进行，并遵循其一贯的隐私保护原则。 ## 行业竞争加剧当前，AI 助手赛道已十分拥挤：Google Gemini 深度绑定 Android 生态，Anthropic 的 Claude 主打安全可控，OpenAI 的 ChatGPT 则凭借通用性占据先机。苹果的差异化在于其 **庞大的硬件用户基础** 和 **封闭生态的整合优势**。如果新 Siri 能无缝调用 iPhone、iPad、Mac 上的数据，并保持流畅体验，它可能成为最懂用户的 AI 助手。但能否扭转过去数年的落后局面，还需看实际落地效果。 ## 展望苹果并未公布所有技术细节，但明确表示新 Siri 将“更主动、更个性化”。随着今年晚些时候的正式推送，用户将亲身体验这一变革。对于开发者而言，这也意味着新的 app 交互接口和机会。苹果能否凭借这次改版重新定义语音助手？我们拭目以待。

WIRED AI1个月前原文

1864

iOS 27 来了：如何免费下载开发者测试版

新上线

苹果在 WWDC 2026 上正式发布了 iOS 27，并已向开发者推送测试版。对于普通用户而言，正式版将在今年秋季作为免费更新推送，但具体可用性可能因运营商、地区和当地法规而异。 ## 如何抢先体验 iOS 27 开发者测试版想要提前尝鲜的用户，可以注册苹果开发者计划（每年 99 美元），然后通过“设置”>“通用”>“软件更新”中的“Beta 版更新”选项下载。不过，开发者测试版可能存在稳定性问题，建议在备用设备上安装。 ## iOS 27 的新特性尽管 iOS 27 的完整功能列表尚未公布，但 WWDC 2026 的主题演讲暗示了多项针对日常用户体验的改进。Siri 的升级、新的锁屏交互以及 AI 驱动的智能功能可能是重点。值得注意的是，本次 WWDC 也是 Tim Cook 作为 CEO 的最后一次主题演讲，增添了特殊意义。 ## 行业背景 iOS 27 的发布正值移动操作系统竞争加剧之际。Android 16 已引入更深入的 AI 集成，而苹果则通过隐私优先的策略巩固生态优势。开发者测试版的提前开放，有助于苹果在秋季正式版前收集反馈，优化性能。 > 小结：iOS 27 开发者测试版现已可用，但普通用户建议等待公测版或正式版。

ZDNet AI1个月前原文

1865

苹果酝酿已久的AI Siri大翻新终于来了

新上线

在承诺推出更智能Siri两年后，苹果终于在WWDC 2026上发布了全面改造的AI驱动助手。新Siri AI将从语音助手转型为AI伴侣，能够执行更复杂的任务，并配有专用Siri应用。新Siri可基于当前世界知识回答问题，还能访问用户设备上的信息并根据屏幕内容做出响应。苹果正将Siri打造成全功能对话式AI聊天机器人，与ChatGPT、Claude和Gemini等平台竞争。Siri会以文本卡片形式展示结果，并重新设计为在灵动岛中运行。用户可通过“Write with Siri”获得写作帮助，Siri能模仿用户与特定联系人的沟通风格。新Siri还支持更复杂的任务，如撰写消息，并能从网络、邮件、日历、通讯录等来源提取信息。此外，Siri拥有全新语音体验，可自定义语速和表现力，系统级听写功能也得到精度提升。Siri AI将于今年晚些时候以测试版形式推出。

TechCrunch1个月前原文

1866

亚马逊推出AI生成定制商品，一键设计T恤水杯

新上线

亚马逊正在将按需打印服务与AI生成设计深度结合，用户通过Alexa for Shopping输入文字提示，即可生成图像并印制在T恤、水杯、连帽衫等空白商品上，随后分享链接供他人购买。这项新功能将设计、购买、打印流程全部整合在亚马逊平台内，直接冲击了Redbubble、Printful、Shutterfly等传统定制印刷网站，也对其自身的第三方卖家生态构成威胁。此前亚马逊已提供Merch on Demand服务，允许用户上传图片、文字或剪贴画图标。现在借助Alexa的AI能力，用户可自动生成设计并进一步编辑。不过，所有设计仍需遵守亚马逊的内容政策，涉及商标和版权的设计会被拦截。例如，测试生成的纽约尼克斯队设计因“第三方内容担忧”被标记，无法购买。理论上，用户可以创建无限数量的无品牌产品。近年来，Etsy、TikTok Shop、eBay等平台已被大量AI生成设计淹没，消费者面对无穷无尽的中等质量选项。测试中通过Alexa生成的设计带有明显的AI特征：过于平滑的插图、大量陈词滥调以及混乱的文字。这不禁让人质疑：AI是否已毁了盗版周边市场？亚马逊此举将按需打印的竞争推向新高度。过去，定制商品需要依赖第三方卖家或专业印刷网站，如今平台自身成为设计、生产、销售的一站式中心。对于小商家而言，AI生成的泛滥可能进一步压低价格和独特性；而对于消费者，便捷性提升的同时，也可能面临创意同质化的困境。

The Verge1个月前原文

1867

英国押注十亿美元AI超算，欲摆脱对美国技术的依赖

新上线

英国政府宣布了一项**14.7亿美元**的计划，旨在减少对外国AI硬件的依赖。该计划的核心是建设一台国家AI超级计算机，其中**5.3亿美元**用于硬件采购，包括**2亿美元**专门用于采购推理芯片。采购将优先考虑英国本土初创公司，如**Olix**和**Fractile**，这两家公司正在开发新型推理芯片。该超算预计在**2030年**投入使用，供英国研究人员和初创企业使用。此举是英国更广泛“技术主权”战略的一部分，其紧迫性源于**美欧关系恶化**。英国科技大臣**Liz Kendall**表示：“过去40年的地缘政治格局已经破裂……AI主权关乎减少过度依赖、增强韧性。”她不认同“竞赛已输”的论调，认为挑战美国或中国的AI芯片主导地位为时未晚。此前，英国已建立“**AI增长区**”以降低数据中心建设壁垒，并启动了**6.75亿美元**的SovAI风险基金投资本土AI初创企业。虽然英国拥有**ARM**等芯片设计巨头，但在制造和先进封装环节仍依赖外部。该超算计划旨在为本土芯片设计提供试验场，加速从设计到部署的闭环。分析人士指出，这一战略面临**资金规模不足**和**时间窗口较长**的挑战。与美国的数千亿美元投入相比，英国的14.7亿美元显得有限。此外，超算到2030年才上线，可能错过当前AI发展的关键窗口。然而，该计划若能成功扶持本土芯片生态，将增强英国在AI供应链中的自主权，并为欧洲的“技术主权”运动提供范本。

WIRED AI1个月前原文

1868

用了30年Linux，我只有4个不满——其中2个让我换回MacBook

新上线

Linux 是我自 1997 年以来的默认操作系统，整体体验近乎完美，但并非没有瑕疵。以下是资深用户 Jack Wallen 在 30 年使用中积累的四个主要抱怨，其中两个甚至让他偶尔换回 MacBook。 ### 1. 硬件兼容性：永远的痛点尽管 Linux 内核支持大量硬件，但某些外设（如指纹识别器、特定无线网卡、高分辨率触控板）仍需要手动配置或根本不工作。相比之下，macOS 和 Windows 的“即插即用”体验更省心。 ### 2. 电源管理：笔记本续航的短板 Linux 在笔记本上的电源管理不如 macOS 高效。同样的硬件，MacBook 的电池续航往往比运行 Linux 的笔记本长 20%-30%。这直接导致他在长途旅行时选择 MacBook。 ### 3. 软件生态：专业应用缺失虽然开源替代品丰富，但 Adobe 全家桶、Microsoft Office 完整版、某些专业音频/视频工具仍无法原生运行。即使通过 Wine 或虚拟机，体验也打折扣。 ### 4. 桌面体验碎片化 Linux 桌面环境（GNOME、KDE、XFCE 等）各有优劣，但缺乏统一的设计语言和交互标准。配置选项虽多，但新用户容易迷失，老用户也常因更新导致配置失效而烦恼。 Wallen 强调，这些抱怨并不妨碍 Linux 作为服务器和开发环境的首选，但对于追求“开箱即用”和特定专业需求的桌面用户，macOS 或 Windows 有时更合适。 > **小结**：Linux 的强项在于自由、稳定和社区支持，但硬件兼容性、电源管理、软件生态和桌面碎片化仍是长期待解难题。如果你能接受这些折中，Linux 仍是极佳的选择。

ZDNet AI1个月前原文

1869

苹果 WWDC 2026 发布 Siri AI：新一代 Apple Intelligence 终于落地

新上线

在 WWDC 2026 上，苹果正式发布了 Siri AI，这是两年前首次预告但迟迟未兑现的“更智能 Siri”的最终形态。苹果将其称为“全新版本的 Siri”，强调其更会对话、能力更强，并具备可定制语速、表现力和口音的表达性语音。Siri AI 系统级可用，能读取屏幕内容并与应用交互，同时通过设备端处理或苹果私有云计算保障隐私。 **跨设备覆盖与全新交互方式** Siri AI 将覆盖 iPhone、iPad、Mac、Apple Watch 和 Vision Pro。在 iPhone 上，用户可从灵动岛向下滑动唤醒；在 Mac 上可通过 Spotlight 访问；Vision Pro 用户只需注视浮动的 Siri 可视化球体即可直接对话，无需说“Hey Siri”。 **独立 App 与 iCloud 同步** Siri 首次拥有独立应用，界面类似 ChatGPT、Claude 等聊天机器人，支持文本或语音对话，并保存历史记录。对话通过 iCloud 同步，用户可在不同设备间无缝切换。 **技术底座：Apple Foundation Models + Google 合作** Siri AI 基于苹果自研的 Foundation Models，且苹果透露与 Google 合作构建。它能跨应用执行任务，例如根据屏幕内容回答问题。这标志着苹果在 AI 助手领域的二次发力，试图弥补此前 Apple Intelligence 进展缓慢的遗憾。 **行业意义** 此次发布正值 AI 助手竞争白热化阶段，苹果凭借隐私保护、生态整合和差异化交互（如 Vision Pro 的视线唤醒）试图后来居上。但能否真正兑现“更智能”的承诺，仍需市场检验。

The Verge1个月前原文

1870

Meta 智能眼镜应用悄然移除面部识别系统，WIRED 报道引发连锁反应

新上线

在 WIRED 独家报道揭露 Meta 在其智能眼镜配套应用中悄悄嵌入未发布的面部识别系统后，Meta 迅速从最新版应用中移除了相关代码。据 WIRED 对最新版本代码的分析，Meta AI 应用（Meta 智能眼镜的配套应用，已安装于超过 5000 万部手机）已删除了此前发现的未激活面部识别组件——该系统内部代号为 NameTag。报道发布当天，该版本仍包含多个明确命名为面部识别的代码库，而周五发布的版本已完全清除这些组件。Meta 传播副总裁 Andy Stone 此前表示，该功能“纯属探索”，且“尚未做出任何最终决定”。但 WIRED 的深入分析发现，NameTag 系统的核心部分早在 1 月就已内置到 Meta AI 应用中，尽管 Meta 公开宣称未就面部识别做出最终决定。 NameTag 系统设计用于将眼镜捕捉的人脸转换为独特的生物特征签名（即“人脸指纹”），并与设备本地存储的人脸指纹数据库进行比对。未能识别的人脸会被裁剪、索引并本地存储，以备后续处理。这一功能最早于 2 月被《纽约时报》曝光，内部文件显示 Meta 考虑最早于今年推出，并提及在“动态政治环境”中发布，以分散隐私倡导者的注意力。 WIRED 报道后，Meta 高管最初予以否认。Stone 称该功能“不存在”，首席技术官 Andrew Bosworth 更指责报道“极具误导性”和“绝对不诚实”。然而，代码的迅速删除似乎印证了报道的准确性。目前 Meta 未解释移除原因，也未说明该功能是否会在未来回归。这一事件再次引发对科技巨头在隐私敏感领域激进探索的担忧，尤其是在智能眼镜这类可穿戴设备日益普及的背景下。

WIRED AI1个月前原文

1871

解锁欧洲AI灵活性：跨区域推理指南，满足欧盟数据处理与模型访问需求

新上线

随着全球对最新生成式AI模型和高性能加速计算的需求持续高涨，AWS客户需要一种能够跨多个区域利用模型可用性和计算容量的工具，同时满足自身安全与隐私要求。**Amazon Bedrock** 推出的 **跨区域推理（Cross-Region Inference, CRIS）** 正是为此而生。该功能能够自动将推理请求路由至多个AWS区域，从而在确保数据合规的前提下，提升模型访问的灵活性与可用性。 ## 跨区域推理：弹性与合规的平衡对于欧洲用户而言，数据主权与隐私法规（如GDPR）是部署AI时必须优先考虑的因素。传统上，企业可能被迫将推理工作负载限制在单一区域，但这往往导致模型选择受限、容量瓶颈以及延迟问题。Amazon Bedrock的CRIS功能通过智能路由机制解决了这一矛盾：当某个区域的服务负载过高或模型不可用时，请求会被自动转发至其他可用区域，整个过程对用户透明，且数据始终在AWS的安全边界内流动。 ## 关键能力与使用场景 - **模型可用性最大化**：CRIS支持在多个区域间动态分配推理请求，确保即使某个区域的特定模型暂时不可用，用户也能通过其他区域获得相同服务。这对于依赖最新模型（如Anthropic Claude 3、Meta Llama 3等）的应用尤为重要。 - **性能优化**：通过地理接近性路由和负载均衡，CRIS能够显著降低推理延迟。例如，一家总部位于德国的金融科技公司，其客户分布在整个欧洲，利用CRIS可将请求就近路由至法兰克福、爱尔兰或巴黎等区域，从而获得更快的响应速度。 - **成本控制**：用户无需为每个区域单独预置计算资源，CRIS按实际使用量计费，有效避免了资源闲置。同时，AWS的跨区域数据传输费用也经过优化，进一步降低总体拥有成本。 ## 欧洲地区的实践考量在实际部署中，企业需要先明确数据驻留要求。对于必须将数据留在特定国家或区域内的场景（如医疗记录或政府数据），CRIS允许用户通过配置“区域偏好”来限制路由范围。例如，可以设置仅允许在欧盟内部区域之间进行路由，而禁止将数据传出欧洲经济区。此外，AWS还提供了详细的审计日志，便于企业追踪每次推理请求的实际处理位置。 ## 行业影响与未来展望跨区域推理的推出，标志着AWS在**混合云与边缘计算**之外，又为AI工作负载提供了一种新的弹性范式。对于正在经历AI落地的欧洲企业而言，它降低了因区域限制而放弃最佳模型的风险。随着生成式AI从实验走向生产，类似CRIS这样的基础设施能力将成为企业选择云平台的关键考量因素之一。

AWS ML1个月前原文

1872

现在可以合上笔记本了：在 Amazon Bedrock AgentCore 上托管编码代理

新上线

## 从“不关机”到“安心合盖” 你是否也曾为了不让终端里的编码代理中断，而小心翼翼地保持笔记本屏幕常亮？从会议室到地铁，从午餐到深夜，开发者们正陷入一种“合盖焦虑”——因为合上笔记本，意味着正在运行的 Claude Code、Codex、Kiro 或 Cursor 等代理进程可能就此中断。这种尴尬的根源在于：我们错误地将“最近的机器”当成了“最合适的机器”。Amazon Bedrock AgentCore Runtime 试图打破这一惯性——它给每个代理会话分配一个独立的 Linux 微虚拟机（microVM），拥有持久化工作区、真实 shell 和确定性命令执行能力。但真正让 AgentCore 脱颖而出的，是它围绕代理运行构建的一整套基础设施。 ## 不只是沙箱，更是一套运行体系大多数沙箱产品都能提供隔离环境，但 AgentCore 把“隔离”扩展到了身份、工具和可观测性三个层面： - **身份层（Identity）**：代理以触发它的用户身份行动，而不是共享一个匿名或高权限账号。这意味着每次代码提交、API 调用都带着正确的身份上下文。 - **网关层（Gateway）**：通过统一的 **Model Context Protocol (MCP)** 端点，将 GitHub、Jira、Slack 以及企业自有服务暴露给 Claude Code、Codex、Kiro 等代理。真实的令牌（token）始终保存在网关之外，代理只获得按需授权的访问路径。 - **可观测性（Observability）**：代理的每一步操作——命令执行、文件读写、API 调用——都会自动落入 **Amazon CloudWatch**，与团队已有的监控体系无缝对接。有了这三层，开发者终于可以放心合上笔记本：代理不再依赖本地环境运行，而是托管在云端的安全、持久且可审计的环境中。 ## 为什么笔记本不是好宿主？将编码代理运行在本地笔记本上，至少面临四个问题： 1. **安全风险**：代理共享你的 shell、文件系统、令牌、VPN 和 SSH 密钥。一次带有恶意注入的 README 文件读取，就可能泄露整个开发环境。 2. **资源竞争**：代理与你的 IDE、浏览器、容器争抢 CPU 和内存，尤其是在运行多个代理时。 3. **持久性差**：合盖、休眠、网络切换都可能导致代理中断，无法长时间执行复杂任务。 4. **协作困难**：代理的工作状态只存在于你的机器上，团队无法统一查看或审计。 AgentCore 的微 VM 架构从根本上解决了这些问题：每个会话拥有独立文件系统、端口和进程空间，且会话状态持久化——你可以合上笔记本去吃晚饭，第二天回来继续上一次的任务。 ## 实战：四个代理同场竞技为了展示 AgentCore 的能力，团队做了一个有趣的实验：将同一个 GitHub Issue 同时交给 **Claude Code、Codex、Kiro 和 Cursor**，每个代理运行在独立的 AgentCore 环境中。评价标准有三个： - **延迟**：从接收任务到输出结果的总耗时 - **成本**：每次任务的美元开销 - **一次通过率**：生成的代码能否在首次测试中通过由于每个环境都是隔离的，代理之间不会互相干扰——不会共享文件、端口或凭证。这意味着可以安全地并行运行多个代理，比较它们的表现，甚至让它们协作解决同一个问题的不同部分。 ## 拥抱“远程代理”时代 AgentCore 的推出，标志着编码代理从“本地玩具”向“生产级服务”的转变。当代理不再绑定在某个开发者的笔记本上，团队就能以更系统化的方式管理、审计和优化代理工作流。对于已经在使用 Claude Code、Codex 或 Cursor 的团队，迁移到 AgentCore 意味着： - 安全边界从单台机器扩展到 AWS 基础设施 - 代理行为可追溯、可审计 - 资源按需分配，不再与本地应用争抢 - 团队可以共享代理工作区，实现异步协作当然，这并非要完全抛弃本地运行——对于原型验证或短任务，本地依然便捷。但当任务需要长时间运行、涉及敏感数据或需要团队协作时，是时候把笔记本合上了。

AWS ML1个月前原文

1873

规模化决策更优解：数学优化如何超越直觉判断

新上线

在AI技术飞速发展的今天，企业决策者常常面临一个尴尬的困境：数据越来越多，但真正能转化为高效决策的工具却依然稀缺。直觉和经验固然重要，但当业务规模扩大、变量激增时，人类大脑的局限性便暴露无遗。**数学优化**，作为AI家族中一个相对低调却威力巨大的成员，正悄然成为解决这一难题的关键武器。 ## 数学优化是什么？与机器学习的区别简单来说，数学优化是在给定约束条件下，寻找目标函数最优值的过程。它不同于机器学习通过数据学习模式进行预测，而是直接求解“在资源有限的情况下，如何做到最好”的问题。例如，一个物流公司需要决定卡车路线、装载顺序和配送时间，以最小化燃油成本——这就是典型的优化问题。数学优化与机器学习是互补关系。机器学习擅长预测（例如，预测明天某个地区的包裹量），而数学优化则负责在预测结果的基础上做出最优决策（例如，根据预测的包裹量调度车辆和人员）。两者结合，能形成从数据到行动的完整闭环。 ## 真实案例：从供应链到能源管理 AWS创新中心与多家企业合作，将数学优化应用于实际场景，取得了显著成效。 - **供应链优化**：一家全球零售巨头利用数学优化重新设计其配送网络。通过考虑仓库位置、运输成本、需求波动和库存策略，系统在数分钟内生成了传统方法需要数周才能完成的方案，**物流成本降低了15%**，同时服务水平提升。 - **能源调度**：某电力公司使用优化模型平衡可再生能源（如太阳能、风能）的波动性输入与用户需求。模型实时调整发电机组启停和储能充放电策略，**弃风弃光率下降20%**，且电网稳定性显著改善。 - **航空业收益管理**：一家航空公司借助优化算法动态调整票价和座位分配，根据历史数据预测需求，实时优化定价策略，**年收入增长超过8%**。 ## 为什么直觉会失效？传统上，企业依赖资深专家的经验进行决策。但当业务涉及成百上千个变量和约束时，人类大脑难以同时权衡所有因素。例如，一个简单的生产排程问题，如果涉及10台机器、50个订单和5种原材料，可能的组合方案数量就远超宇宙原子总数。直觉在这种情况下只能给出“大致可行”的方案，却远非最优。数学优化则通过严谨的数学模型和高效算法（如线性规划、整数规划、启发式算法），在合理时间内找到最优解或接近最优的解。它不依赖“感觉”，而是基于数据和约束进行系统化搜索。 ## 在AI生态中的定位数学优化常被归类于**运筹学**领域，但如今它与机器学习的融合日益紧密。AWS提供了一系列服务来支持优化应用，包括Amazon SageMaker（用于构建ML模型）和AWS Optimization Framework（提供优化求解器接口）。企业可以构建端到端的智能决策系统：数据→预测模型→优化模型→行动指令。随着边缘计算和实时决策需求的增长，数学优化的应用场景将进一步扩大。例如，自动驾驶车辆的路径规划、工厂车间的机器人调度、金融市场的交易策略等，都需要在毫秒级做出最优决策。 ## 小结数学优化不是要取代人类的直觉，而是在复杂场景下为决策者提供科学依据。它让企业从“凭经验”转向“凭数据”，实现规模化、精准化的决策。如果你还在为供应链成本、资源利用率或收益管理发愁，不妨看看数学优化这个低调而强大的工具。

AWS ML1个月前原文

1874

Amazon SageMaker AI 与全同态加密：实现端到端加密的机器学习推理

新上线

在 AI 推理场景中，数据隐私保护一直是企业上云的核心关切。当敏感数据离开本地环境进入云端模型时，如何确保即使在推理过程中数据也不被解密？亚马逊云科技近期发布的新方案给出了一个实用答案：借助全同态加密（FHE）与 Amazon SageMaker AI 的深度集成，实现真正的端到端加密推理。此前，AWS 曾在一篇博文中展示了如何在 SageMaker 端点上实现基于 FHE 的推理，但当时采用的是底层库 SEAL，需要从零手工构建线性回归算法，门槛较高。而这次的新方案则转向了 **concrete-ml**——一个构建在 SEAL 之上的高级库，它大大简化了开发流程。 ### FHE 为何重要？全同态加密允许在加密数据上直接进行计算，而无需先解密。这意味着，企业可以将加密后的客户数据发送到云端，SageMaker 模型在不解密的情况下完成推理，最终返回加密结果，只有客户自己才能解密。整个过程模型提供商无法接触原始数据，从而彻底杜绝了数据泄露风险。 ### 新方案的两大提升 1. **开发效率**：concrete-ml 提供了高层次的 API，开发者无需深入密码学细节，只需像训练普通模型一样编写代码，库会自动处理加密编译。例如，一个简单的逻辑回归模型，用 concrete-ml 只需几十行代码即可完成训练和加密部署。 2. **模型灵活性**：相比之前仅支持线性回归，concrete-ml 支持多种模型架构，包括**决策树、神经网络、支持向量机**等，覆盖了更广泛的实际业务场景。 ### 性能与权衡 FHE 带来的隐私保护并非没有代价。加密计算的复杂度远高于明文计算，推理延迟通常会增加数个数量级。concrete-ml 通过**编译优化**（如将浮点运算转化为整数运算、利用 SIMD 指令等）来缓解这一问题，但在高吞吐场景下仍需谨慎评估。AWS 建议将 FHE 推理用于**低频、高敏感度**的任务，如金融风控、医疗诊断、隐私数据处理等。 ### 部署流程开发者只需在 SageMaker 中训练一个标准模型，然后使用 concrete-ml 将其编译为 FHE 兼容的版本，最后打包为 SageMaker 端点。客户端通过 AWS SDK 发送加密请求，端点执行推理并返回加密结果。整个过程与普通 SageMaker 部署高度一致，学习曲线平滑。 ### 行业影响随着全球隐私法规日益严格（如 GDPR、CCPA、中国《个人信息保护法》），FHE 推理正从学术研究走向商业落地。AWS 此次的更新，意味着主流云厂商开始提供**开箱即用的加密推理能力**，这将加速金融、医疗、政务等强监管行业的 AI 部署。不过，FHE 的算力开销仍是主要瓶颈，未来硬件加速（如 Intel HEXL、FPGA）可能是突破方向。对于有隐私合规需求的团队，现在可以更低门槛地试用端到端加密推理，无需组建密码学专家团队。但务必根据实际业务延迟要求做好基准测试，避免隐私保护过度影响用户体验。

AWS ML1个月前原文

1875

Amazon Quick ARNs 深入解读：跨账户迁移与命名空间权限实战指南

新上线

## 为什么 ARN 是跨账户迁移和权限管理的核心？在 Amazon Quick（原 QuickSight）的日常运维中，你可能会遇到这样的场景：将仪表板从开发账户迁移到生产账户后，权限没有自动继承；或者向财务团队共享仪表板时，对方反复遇到“访问被拒绝”的错误；又或者为多租户设置了命名空间，但同一个用户名在一个命名空间下正常，在另一个命名空间却无法登录。这些问题的根源，往往在于对 **Amazon Resource Name（ARN）** 的理解不够深入。ARN 是 AWS 中每个资源的唯一标识符，类似于现实世界的“邮政地址”——它包含了资源所在的分区、服务、区域、账户 ID、资源类型和资源 ID 等关键信息。只有掌握了 ARN 的构成，你才能快速定位问题，设计出可靠的跨账户迁移策略和权限体系。 ## ARN 的结构：一个“地址”隐喻为了更好地理解 ARN，我们可以把它类比成一个完整的邮政地址： - **aws**（星球）：AWS 分区，通常为 `aws`，中国区为 `aws-cn`，美国政务区为 `aws-gov-us`。 - **quicksight**（国家）：服务标识符，注意尽管服务已更名为 Amazon Quick，但 ARN 中仍保留 `quicksight` 以兼容现有 IAM 策略和自动化脚本。 - **us-east-1**（州）：AWS 区域。 - **123456789012**（城市）：AWS 账户 ID。 - **dashboard**（街道）：资源类型，例如 `dashboard`、`dataset`、`user` 等。 - **04f736b4-bd1b-…**（门牌号）：唯一资源 ID。一个完整的 ARN 示例如下： ``` arn:aws:quicksight:us-east-1:123456789012:dashboard/04f736b4-bd1b-... ``` 当资源从一个账户迁移到另一个账户时，账户 ID 会改变，这就像你搬到了新的城市，地址自然也会变化。因此，跨账户迁移后，原有的权限策略需要重新绑定到新的 ARN 上。 ## 命名空间与权限的关联 Amazon Quick 支持通过 **命名空间（Namespace）** 实现多租户隔离。每个命名空间相当于一个独立的用户域，用户和资源在命名空间内是隔离的。在 ARN 中，命名空间通常作为资源路径的一部分出现，例如： ``` arn:aws:quicksight:us-east-1:123456789012:namespace/default/user/bob ``` 这表示在 `default` 命名空间下的用户 `bob`。如果你在另一个命名空间（如 `finance-ns`）中也有用户 `bob`，那么这两个用户本质上是不相关的，拥有不同的 ARN，因此权限策略必须分别指定。 ## 实战建议：如何利用 ARN 提升运维效率 1. **快速诊断权限问题**：当用户报告“访问被拒绝”时，首先检查其 ARN 中的账户 ID 和命名空间是否与资源 ARN 匹配。如果账户 ID 不同，说明资源可能来自另一个账户，需要先设置跨账户信任关系。 2. **设计跨账户迁移流程**：迁移仪表板或数据集时，需要同步更新所有引用该资源的 IAM 策略和权限。建议使用 AWS Resource Access Manager（RAM）或编写脚本自动替换 ARN 中的账户 ID。 3. **多租户架构的最佳实践**：为每个租户分配独立的命名空间，并在资源 ARN 中显式包含命名空间路径。这样，不同租户的资源天然隔离，权限管理更加清晰。 ## 小结 ARN 是 Amazon Quick 资源管理的基石。无论是跨账户迁移、权限调试还是多租户设计，对 ARN 结构的深刻理解都能让你事半功倍。下次遇到权限问题时，不妨先拆解一下 ARN 的各个部分——它可能会直接告诉你问题出在“城市”（账户）还是“街道”（资源类型）上。

AWS ML1个月前原文

1876

NotebookLM 升级 Gemini 3.5：内置“云端电脑”与智能来源搜索，科研效率倍增

新上线

Google 于近日对 AI 笔记应用 **NotebookLM** 进行了“全面”升级，核心亮点包括底层模型换用 **Gemini 3.5**、新增“云端电脑”支持代码运行，以及通过 Google 搜索直接帮助用户发现研究素材。 ### 更聪明的 AI 大脑 NotebookLM 现在基于 Google 最新的 **Gemini 3.5** 模型运行，这意味着它能提供“更准确、更可靠”的回答。对于用户上传的笔记、PDF、YouTube 视频等材料，AI 的理解与推理能力将显著提升，减少幻觉与事实错误。 ### 从“导入资料”到“探索发现” 过去，使用 NotebookLM 需要先手动导入笔记或来源。现在，你只需在聊天界面直接提问，比如“生成一份关于量子计算的最新进展报告”，NotebookLM 会自动调用 **Google 搜索**，在网络上寻找相关来源并推荐给你。你可以预览并选择性地导入这些来源，极大简化了研究启动流程。 ### 每个笔记本都有一台“云端电脑” 最引人注目的新功能是 NotebookLM 与 Google 的 agentic 编码平台 **Antigravity** 的集成。每个笔记本现在都连接到一个“安全的云端电脑”，这意味着 NotebookLM 可以**编写并运行代码**来辅助分析。例如，它能直接生成数据可视化图表（PNG/SVG）、通过 Nano Banana 生成图片（PNG/JPG/GIF）、甚至导出 Excel、PowerPoint 或 CSV 文件。这让 NotebookLM 从一个纯文本分析工具，升级为具备计算与输出能力的多功能科研助手。 ### 可用性与未来计划目前，这些更新主要面向 **Google AI Ultra 套餐** 订阅用户以及 **Workspace 商业客户**。Google 表示未来会逐步扩展到更多用户群体。 ### 小结从模型升级到功能拓展，NotebookLM 正在从一个“AI 笔记助手”进化为一个“AI 研究工作站”。特别是云端电脑的加入，让用户无需离开应用即可完成数据计算与可视化输出，这有望在学术研究、市场分析、报告撰写等场景中大幅提升效率。

The Verge1个月前原文

1877

无需麦克风，大规模评估你的 Amazon Nova Sonic 语音智能体

新上线

语音智能体正在重塑企业与客户的互动方式，从预约、订单查询到账户管理，自然对话成为新常态。然而，测试这些智能体却面临巨大挑战：与文本聊天机器人不同，语音智能体支持双向音频流、非确定性响应、多轮上下文保持和实时工具调用，传统的手动测试——让人对着麦克风说话再听结果——不仅缓慢、不一致，而且无法规模化。为解决这一痛点，AWS 推出了 **Nova Sonic Test Harness**，一个开源的自动化测试框架。它兼具两大功能：一是作为快速迭代工具，帮助团队高效调试系统提示和工具配置；二是作为全面的评估框架，支持大规模验证语音智能体的质量。该框架能够自动运行完整的多轮对话，利用 **LLM-as-judge** 技术进行评估，甚至能检测模型音频输出与文本输出不匹配的“音频幻觉”现象——整个过程无需任何麦克风。 ### 为什么语音到语音测试与众不同？文本模型的测试通常依赖结构化输入输出，而语音智能体面临三大独特难题： - **非确定性响应**：同一问题可能得到不同回答，难以断言对错。 - **多轮上下文依赖**：对话历史影响后续行为，需覆盖完整流程。 - **实时工具调用**：如查询数据库、调用 API，需验证工具执行正确性。手动测试 50 个对话场景 × 3 种用户画像，每次修改提示后都需重复，耗时巨大。Nova Sonic Test Harness 通过以下方式解决： 1. **自动模拟对话**：框架使用文本或音频输入驱动 Amazon Nova Sonic，无需真实麦克风。 2. **LLM-as-judge 评估**：利用大语言模型评判对话质量，覆盖任务完成度、自然度、合规性等维度。 3. **音频幻觉检测**：对比模型输出的文本与转录后的音频内容，识别不一致。 4. **可扩展报告**：支持批量运行，生成结构化结果，便于回归测试。 ### 实际应用场景 - **提示工程迭代**：修改系统提示后，一键运行测试集，对比评分变化。 - **工具配置验证**：新增工具时，自动检查智能体是否正确调用。 - **上线前回归测试**：部署前运行数百个场景，确保无退化。 ### 如何开始？ Nova Sonic Test Harness 已在 GitHub 开源，支持快速部署。用户只需定义测试场景（如“预订航班”），框架即可自动执行并输出评估报告。 ### 小结语音智能体的规模化测试不再是瓶颈。Nova Sonic Test Harness 为开发者提供了自动化、可重复的评估手段，加速从开发到上线的迭代周期。对于构建语音应用的团队而言，这不仅是效率工具，更是质量保障的基础设施。

AWS ML1个月前原文

1878

亚马逊推出AI设计定制商品功能，一键生成T恤、马克杯等

新上线

亚马逊近日在购物应用中推出了一项新功能，允许用户通过AI助手Alexa生成设计图案，并将其印制在T恤、卫衣、水杯等商品上。这一功能通过亚马逊的按需打印服务Merch on Demand实现，用户只需在应用中描述创意，AI即可生成设计，并支持编辑和分享。商品由亚马逊负责生产和配送，通过Prime快递送达。目前该功能仅在美国可用，用户只需支付商品本身费用，无需额外设计费。此举降低了定制商品的设计门槛，对Redbubble、Bonfire等在线商品平台构成直接竞争。

TechCrunch1个月前原文

1879

WWDC 2026 前瞻：Siri 大改版、Apple Intelligence 与 iOS 27 等重磅更新

新上线

距离苹果全球开发者大会（WWDC）越来越近，今年的主题演讲预计将带来一系列重大更新，涵盖 AI 战略、操作系统升级以及开发者工具。其中最受关注的莫过于 Siri 的彻底革新——苹果正试图让这个长期被诟病的语音助手真正具备竞争力。 ### Siri 的“二次革命” 消息人士透露，苹果计划在 WWDC 2026 上推出一个“完全重构”的 Siri，整合更强大的**大语言模型**能力，使其能够像 ChatGPT 或 Google Gemini 一样处理复杂对话、执行多步骤任务。新 Siri 将不再局限于预设指令，而是能理解上下文，例如“帮我找上周五的照片，并发送给张三”。这一变化被视为苹果在 AI 领域追赶竞争对手的关键一步。 ### Apple Intelligence 平台升级 **Apple Intelligence** 作为苹果的 AI 统一平台，预计将获得显著增强。开发者将能够通过新的 API 将 AI 功能直接集成到应用中，例如实时翻译、智能摘要和图像生成。此外，苹果可能推出**端侧模型**的升级版本，在保护隐私的同时提升响应速度。 ### iOS 27：更智能的系统级集成伴随新 Siri 和 Apple Intelligence 的升级，**iOS 27** 将迎来多项系统级 AI 功能。例如，邮件和消息应用可能内置智能回复与自动分类；照片应用将支持更精准的物体识别与编辑建议；系统设置中可能加入“AI 控制中心”，让用户管理各应用的 AI 权限。 ### 其他可能亮点 - **macOS 14**：强化与 iOS 的 AI 协同，如跨设备任务接力。 - **watchOS 11**：引入 AI 健康分析，如运动姿势纠正。 - **Vision Pro 更新**：基于 AI 的空间计算优化，提升手势识别精度。 ### 开发者工具与新框架苹果预计会推出 **Swift AI 框架**，简化开发者将机器学习模型集成到 App 的流程。Xcode 可能内置 AI 代码补全与调试助手，进一步降低开发门槛。 ### 行业影响苹果在 AI 领域的激进投入，标志着其从“保守跟随”转向“主动竞争”。若 Siri 的焕新能兑现承诺，将直接挑战亚马逊 Alexa 和谷歌助手，并巩固苹果生态的粘性。不过，隐私保护与 AI 能力的平衡仍是关键挑战。距离 WWDC 还有数月，但爆料已勾勒出一个更智能、更开放的苹果生态。对于开发者和用户而言，这或许是最值得期待的一届开发者大会。

TechCrunch1个月前原文

1880

ChatGPT 新“锁定模式”如何防止数据被盗（以及它还有什么作用）

新上线

OpenAI 正在为 ChatGPT 用户推出一种新的“锁定模式”，旨在通过限制网络请求来防范提示注入攻击导致的数据窃取。该功能最初面向企业、教育等高级用户，现已向所有用户开放，但会牺牲实时网页浏览等能力。 ## 锁定模式：为敏感数据筑起防火墙随着 AI 聊天机器人融入日常工作，安全威胁也日益凸显。其中，**提示注入（Prompt Injection）** 攻击尤为危险：攻击者通过植入恶意指令，诱使 AI 访问外部文件或服务，进而窃取用户个人数据。针对这一风险，OpenAI 在 ChatGPT 中推出了 **“锁定模式”（Lockdown Mode）**。该模式的核心机制是**限制出站网络请求**，即阻止 ChatGPT 主动连接互联网或外部文件服务。这样一来，即使攻击者成功植入了恶意提示，也无法将实时敏感信息外传。 ## 适用人群与可用性锁定模式最初于 2026 年 2 月面向 **ChatGPT Enterprise、Edu、Healthcare 和 Teachers** 订阅者推出，如今已扩展至 **Free、Go、Plus、Pro 和 Business** 等所有计划。这意味着无论是个人用户还是企业团队，只要处理敏感信息，都可以启用这一额外保护层。不过，OpenAI 强调该模式并非万能。它**无法阻止提示注入攻击本身**——攻击者仍可能利用缓存内容或已上传文件中的漏洞。Lockdown 模式的作用是切断攻击者“盗取数据”的通道，而非预防攻击发生。 ## 权衡：安全性与功能性的博弈启用锁定模式后，用户将面临一些明显的功能限制： - **无法进行实时网页浏览**：ChatGPT 只能访问缓存的网页内容，因此搜索结果可能不是最新的。 - **禁止访问外部文件或服务**：任何需要联网的功能，如实时数据查询、第三方工具调用等，都将被禁用。这意味着，对于需要最新资讯或动态数据的场景（如新闻分析、实时股票查询），锁定模式可能并不适用。它更适合那些对数据安全要求极高、且不依赖实时网络信息的任务，例如处理机密文档、内部知识库问答等。 ## 行业背景与启示锁定模式的推出反映了 AI 安全领域的一个现实：**没有银弹**。随着提示注入攻击手法不断进化（例如间接注入、多轮诱导），防御方案也需要在便利性与安全性之间做出取舍。OpenAI 选择“限制网络能力”作为切入点，是一种务实但非彻底的解决方案。对于用户而言，理解这一模式的边界至关重要。如果你经常处理敏感数据，开启锁定模式无疑能降低数据外泄风险；但如果你需要 ChatGPT 实时联网协作，则需权衡其带来的不便。 **小结**：ChatGPT 的锁定模式为敏感数据保护提供了一层有效但有限的防御。它通过牺牲部分联网功能，换取了更高等级的数据安全。在 AI 安全威胁日益复杂的今天，这种“功能换安全”的设计或许会成为行业常态。

ZDNet AI1个月前原文