AI 资讯

每日聚合最新人工智能动态

221

Meta 因用户强烈反对移除 Instagram 争议性 AI 功能

新上线

Meta 近日悄然下架了 Instagram 上一项颇具争议的 AI 功能——该功能允许用户通过 @提及公开账号，利用其照片生成新图像。这一功能于本周早些时候随一系列 AI 工具一同推出，但上线后迅速引发用户和业内人士的强烈批评。 ## 功能初衷与争议焦点该功能属于 Meta 新推出的 **Muse Image** AI 图像生成器的一部分，由 Meta 旗下的 **Meta Superintelligence Labs** 开发。其设计初衷是让用户能够引用公开 Instagram 账号的内容作为创作灵感，只需在提示词中输入 @账号名即可。然而，Meta 并未设计通知机制——当用户的照片被他人用于 AI 生成时，原账号不会收到任何提醒。这种“沉默的引用”让许多用户感到隐私被侵犯，尤其担心自己的肖像被滥用。 ## 迅速反转的决策 TechCrunch 此前曾专门撰写指南，教用户如何关闭该功能。在舆论压力下，Meta 于周五发布博客文章，正式宣布移除该功能。公司在博文中表示：“我们的初衷是提供一个有用的创意工具，并让用户控制自己的公开内容是否被以这种方式引用。我们听到了反馈，这个功能未能达到预期，因此它不再可用。” Puck News 的 Dylan Byers 最早报道了这一决定。他指出，Meta 的退让不仅源于普通用户的反弹，还受到了来自 **CAA 等人才经纪机构**的压力——这些机构担心旗下艺人的形象被滥用。 ## 行业背景与反思自 AI 与社交媒体深度整合以来，滥用现象屡见不鲜，其中 **生成女性名人裸照** 等恶意使用尤为突出。平台虽尝试设置护栏，但效果往往有限。Meta 此次功能的失败，再次暴露了 AI 功能在隐私保护设计上的短板：当技术赋予用户强大的创作能力时，若缺乏对原始创作者权益的尊重和保护，必然引发信任危机。 ## 后续影响目前，Meta 尚未透露是否会推出替代方案或对功能进行改进。但这一事件无疑为其他社交平台敲响警钟：在部署 AI 生成工具时，**用户知情权与同意机制** 必须前置。否则，再先进的 AI 能力也可能因伦理失范而迅速夭折。

TechCrunch5天前原文

222

Meta紧急关停Instagram功能：用户可随意用他人照片生成AI深度伪造

新上线

Meta 本周早些时候推出的一项 Instagram 新功能，在短短几天内就因巨大的舆论压力而被迫下架。该功能允许用户通过 @ 提及任何公开 Instagram 账户，直接利用其内容生成 AI 图像，而无需账户所有者授权。这一设计立即引发了隐私、肖像权滥用和深度伪造风险的广泛担忧。 Meta 在关于其新 Muse Image AI 模型的博文更新中承认：“我们的初衷是提供一个有用的创意工具，并让用户控制自己的公开内容是否以这种方式被引用。但我们听到了反馈，该功能未能达到预期，因此决定将其移除。” 此前，用户虽可通过层层设置选择退出，但这并未平息批评。国家性剥削中心执行主任 Haley McNamara 严厉指出：“这不仅明显侵蚀了我们对自身肖像的权利……更是 #性勒索和其他诈骗者的现成工具！追求高风险设计，然后将责任转嫁给个人去费力选择退出，这是不可接受的。” 美国演员工会也建议其成员选择退出，并发布了详细的操作指南。此次事件再次凸显了 AI 生成内容在社交平台上的伦理边界问题。当技术能力与用户权益发生冲突时，企业的“先上线再补救”策略正面临越来越高的风险。Meta 的快速反转也表明，在深度伪造和 AI 滥用日益敏感的当下，公众和监管机构的监督力量不容小觑。

The Verge5天前原文

223

苹果起诉OpenAI，指控其窃取硬件机密

新上线

苹果公司正式对OpenAI提起诉讼，指控其工程师窃取了苹果的硬件机密，以推进这家AI初创公司的硬件计划。这一事件不仅揭示了科技巨头之间日益激烈的竞争，也再次将AI行业的人才流动与知识产权保护问题推向风口浪尖。 ## 诉讼核心：前苹果员工的“系统性盗窃” 根据苹果提交的诉状，该公司发现“OpenAI员工（此前在苹果工作）存在窃取苹果商业秘密的模式”。除了OpenAI，苹果还将**IO Products**——即乔纳森·伊夫的硬件初创公司（于2025年被OpenAI收购）——以及两名具体员工列为被告：**OpenAI首席硬件官Tang Tan**和**2025年1月从苹果跳槽至OpenAI的Chang Liu**。苹果发言人向9to5Mac表示：“在苹果，我们的团队不断开发突破性技术，以创造世界上最好的产品和服务，保护他们的工作和知识产权是我们非常重视的事情。最近，有重要证据表明，OpenAI雇佣的个人不当获取了苹果关于未发布技术、流程和产品的机密信息。我们将永远捍卫团队的辛勤工作和创新，并正在采取一切适当措施。” OpenAI的Drew Pusateri则回应称：“我们对他人的商业机密没有兴趣。我们仍专注于构建赋予所有人力量的创新技术。” ## 具体指控：离职后仍持续窃密诉状对**Chang Liu**的指控尤为详细。苹果称，Liu在离开苹果后仍访问了苹果系统，并下载了“数十份苹果机密硬件相关文件”，包括未发布产品的详细信息、工程演示、技术规格和专有项目数据。更严重的是，Liu还被指控指导一名即将加入OpenAI的前苹果同事如何复制机密文件并“避开苹果安全团队的麻烦”，他甚至建议通过**Line Messenger**进行通信以避免被检测。苹果指出：“Liu先生对其合同的实质性违反，与……（原文此处中断）”。这一行为模式显示了系统性、有组织的商业机密窃取。 ## 行业影响与深层思考这起诉讼正值AI硬件竞争白热化之际。OpenAI在收购Jony Ive的硬件公司后，明显在加速硬件布局，而苹果作为硬件巨头，其核心技术无疑是最宝贵的资产。从行业角度看，此案可能产生深远影响： - **人才流动的合规红线**：科技公司间的人才跳槽本就频繁，但此案警示，员工在离职前后必须严格遵守保密协议，任何“顺手带走”的行为都可能引发法律后果。 - **AI与硬件的融合挑战**：OpenAI从软件走向硬件，必然需要大量硬件人才，但苹果的起诉表明，这种跨界竞争可能触碰到知识产权的高压线。 - **企业合规的加强**：未来，公司可能会更严格地审查新员工的背景，并加强离职员工的权限管理，以防止类似事件。目前，苹果尚未对The Verge的置评请求做出回应。这场诉讼的走向，将不仅影响苹果与OpenAI的关系，也可能为整个科技行业树立关于商业机密保护的新判例。 ## 小结苹果此次诉讼并非孤立事件，而是科技巨头在AI时代争夺顶尖人才与技术优势的缩影。随着AI公司不断从传统硬件巨头挖角，类似的冲突可能会更加频繁。对于从业者而言，这无疑是一记警钟：商业机密是企业的生命线，而法律的长臂终将触及每一个越界行为。

The Verge5天前原文

224

苹果起诉OpenAI，指控其窃取公司机密

新上线

苹果公司近日向法院提起诉讼，指控人工智能研究公司OpenAI窃取其商业机密。这一消息在Hacker News上引发热议，获得107分和13条评论。 ## 案件背景据起诉文件称，苹果声称OpenAI通过不正当手段获取了其核心技术信息，涉及人工智能、机器学习等领域的机密数据。苹果认为这些技术是公司长期研发投入的成果，未经授权被OpenAI使用，构成知识产权侵权。 ## 行业影响这起诉讼凸显了AI行业日益激烈的竞争态势。随着大模型技术的爆发，科技巨头之间的技术壁垒和知识产权纠纷愈发频繁。苹果与OpenAI此前并无直接合作，此次诉讼可能反映了两者在AI人才、技术路线上的潜在摩擦。 ## 后续关注目前案件尚未进入实质审理阶段。OpenAI方面暂未公开回应。业界分析认为，若苹果胜诉，可能对OpenAI的模型训练数据来源和技术合规性产生深远影响，甚至改变AI开源生态的边界。值得注意的是，这是苹果近年来少有的直接起诉AI公司的案例，其背后是否涉及更广泛的行业规则博弈，值得持续关注。

Hacker News1135天前原文

225

苹果起诉OpenAI，指控其指使前员工窃取商业机密

新上线

苹果公司于上周五向美国加州北区联邦地区法院提起诉讼，指控OpenAI及其高管指使前苹果员工窃取商业机密，涉及iPhone等未发布产品的技术细节。诉讼特别点名OpenAI首席硬件官Tang Tan（谭坦）和高级系统电气工程师Chang Liu，称Tan在招募苹果员工时要求候选人携带苹果硬件组件，并指导离职员工规避安全流程。Liu则被指控在离职后未归还苹果笔记本电脑，并下载了包含未公开技术规格、工程演示和专有项目数据的机密文件。苹果称，这些行为是OpenAI系统性窃取苹果机密战略的一部分，旨在加速其AI硬件开发——OpenAI正被传将推出首款硬件产品，可能直接挑战iPhone。苹果于今年2月致函OpenAI表达关切，但未获回应。OpenAI尚未公开回应。此案凸显科技巨头在AI浪潮下的人才与知识产权争夺日趋白热化。

TechCrunch6天前原文

226

Red Hat 推出“RHEL 永久支持”服务：只要付费，永不停止

新上线

Red Hat 近日宣布推出 **Red Hat Enterprise Linux (RHEL) Long-Life Add-On**，俗称“RHEL Forever”。这一新服务允许客户在支付年费的前提下，无限期地获得对特定 RHEL 版本的支持，包括关键安全补丁、紧急 bug 修复和 24x7 技术支持。该计划主要面向金融、电信、医疗和政府等高度监管、资产周期长的行业，满足其对系统稳定性和长期支持的苛刻需求。此前，Red Hat 已在 2026 年红帽峰会上推出长达 14 年的扩展生命周期支持，但显然部分客户仍不满足。RHEL Forever 作为现有 RHEL Premium 订阅的附加项，提供“终极层级”的生命周期支持，客户只需每年续约即可持续获得官方支持。这种“付费即永生”的模式彻底打破了传统 Linux 发行版的固定支持期限，为企业级用户提供了前所未有的灵活性。值得注意的是，该服务没有统一定价，需要客户与 Red Hat 协商具体费用。这一定制化定价策略既反映了服务的高价值，也暗示了潜在的高昂成本。对于仍在使用已停止支持的 CentOS 的企业而言，RHEL Forever 可能是一个理想的迁移选择——尽管代价不菲。

ZDNet AI6天前原文

227

苹果起诉OpenAI，指控其窃取硬件机密

新上线

苹果公司于本周五向加州圣何塞联邦法院提起诉讼，指控OpenAI及其硬件主管唐坦（Tang Tan）窃取商业机密，包括未发布的零件、原型机、保密设计以及秘密项目文件。唐坦曾在苹果任职24年，负责iPhone产品设计，后于2024年加入OpenAI担任硬件主管。苹果在诉状中称，OpenAI鼓励从苹果离职或考虑离职的员工携带专有技术，并指导他们如何规避苹果的数据安全协议。唐坦甚至被指控帮助培训新员工，让他们在面试OpenAI时携带苹果的机密部件。“OpenAI的硬件业务建立在最不稳固的基础上，其核心非法依赖于盗用的商业机密，已从根上腐烂。”苹果在诉状中写道。 OpenAI发言人Drew Pusateri回应称：“我们对他公司的商业机密没有兴趣，我们专注于构建赋能全球的创新技术。”苹果发言人Hannah Smith则表示：“苹果将永远捍卫我们团队的辛勤工作和创新，并将采取一切适当措施。” 这场诉讼被业界视为硅谷自2017年Waymo诉Uber窃取硬件设计案以来最重大的知识产权纠纷。当时Waymo指控Uber挖走其工程师并带走数千份机密文件，最终Uber同意支付2.45亿美元和解。值得注意的是，苹果与OpenAI此前曾为合作伙伴。2024年，双方达成里程碑式协议，在iPhone、MacBook和iPad上集成ChatGPT。但近年来关系逐渐紧张，苹果转而更多依赖Google的Gemini AI技术构建内部AI模型。随着AI消费设备市场竞争加剧，双方未来可能面临更直接的对决。据苹果透露，OpenAI已雇佣超过400名前苹果员工。此次诉讼不仅关乎硬件机密，更可能重塑两家科技巨头在AI时代的竞争格局。

WIRED AI6天前原文

228

苹果起诉OpenAI，指控其窃取商业机密

新上线

据Hacker News热门消息，苹果公司近日正式对OpenAI提起诉讼，指控这家AI研究公司窃取其商业机密。这一事件迅速引发科技界广泛关注，在Hacker News上获得75分的高热度，并已有3条评论讨论该诉讼的潜在影响。 ## 诉讼核心争议苹果在诉状中声称，OpenAI在开发其AI模型过程中，非法获取并使用了苹果的专有技术信息。这些信息涉及苹果在AI领域的核心研发成果，可能包括硬件与软件协同优化、隐私保护机制等关键技术细节。苹果认为，OpenAI的行为构成了不正当竞争，并严重损害了其知识产权权益。 ## 行业背景与潜在影响这起诉讼正值AI行业竞争白热化之际。苹果一直以其封闭生态和硬件端AI能力见长，而OpenAI则凭借ChatGPT等产品在通用AI领域占据领先地位。若苹果胜诉，可能迫使OpenAI调整其模型训练数据来源，甚至影响其未来技术路线。反之，若OpenAI成功辩护，则可能为AI公司基于公开或逆向工程获取技术信息提供法律先例。 ## 市场反应与后续展望目前，两家公司均未公开回应具体指控细节。法律专家指出，商业机密案件举证难度较高，苹果需证明其采取了合理保密措施，且OpenAI确实通过不当手段获取信息。与此同时，该诉讼也可能加剧科技巨头与AI初创公司之间的知识产权紧张关系。未来数月，此案的进展将成为观察AI产业法律边界的重要窗口。

Hacker News776天前原文

229

请别停掉 Gemini 2.5 Flash：开发者社区为何集体请愿保留经典模型

新上线

近日，Hacker News 上一则题为“Please don't discontinue Gemini 2.5 Flash”的帖子引发热议，获得 104 分和 72 条评论。开发者们纷纷表达了对 Google 计划停用该模型的担忧，并分享了他们在实际使用中遇到的困境。 ## 社区声音：性能与延迟的不可替代性一位名为 Nick_D 的用户在 Google AI 开发者论坛发帖，称其团队的工作流高度依赖 **Gemini 2.5 Flash**。内部基准测试显示，即使调整提示词以适配新模型，**Gemini 3 Flash** 的表现仍不如 2.5 Flash。他呼吁团队不要停用这一模型。另一位用户 Ruthvik 补充道，延迟和性能最接近的 **3.1 Flash Lite** 也远不及 2.5 Flash，且存在“思维泄露”问题。他认为 2.5 Flash 是目前最全能、最可靠的模型，Google 的大量流量和用量很可能来自这个版本。 ## 地域部署与成本难题来自澳大利亚的开发者 Joshua_Simpson 指出，**2.5 Flash 是唯一在澳大利亚部署的低延迟模型**，其完成时间仅 300-400 毫秒，非常适合语音代理场景。而 **3.5 Flash** 的完成时间高达 600-700 毫秒，且未在澳大利亚部署，实际延迟接近 700-800 毫秒，完全无法用于语音交互。他强调，在这一地区，没有其他模型能在低延迟应用中达到 2.5 Flash 的质量水平。成本问题同样突出。用户 tylertreat 提到，从 **Gemini 2.5 Flash 升级到 3.5 Flash，成本增加了约 3 倍**。他质疑：Flash 系列本应定位为低延迟、高性价比的模型，但新一代 Flash 在价格上已偏离了这一初衷。 ## 行业背景：模型迭代中的“性能倒退”隐忧在 AI 大模型快速迭代的背景下，新版本往往在基准测试上取得分数提升，但实际应用中的“体验倒退”并不罕见。开发者社区对 Gemini 2.5 Flash 的请愿，反映出 **用户对模型更新中“性能-延迟-成本”三角平衡的敏感**。尤其对于语音代理、实时推理等场景，毫秒级的延迟差异和成本翻倍足以决定产品的可行性。 ## 小结目前 Google 尚未对停用计划作出正式回应。但社区的声音表明，**保留旧模型并非抗拒创新，而是对特定场景下“最佳实践”的坚持**。在 AI 工具日益同质化的今天，开发者希望厂商在推出新模型时，能同时考虑迁移成本、地域部署和实际使用体验，而非简单以“版本号”论英雄。对于 Google 而言，如何在推进 Gemini 3 系列的同时，平衡现有用户的依赖与需求，将是一项考验。

Hacker News1356天前原文

230

Hugging Face CEO：开源AI比以往任何时候都重要

新上线

开源AI正在蓬勃发展。Hugging Face CEO Clem Delangue 在TechCrunch的Equity播客中表示，该公司已发展成为类似“AI界的GitHub”的平台，AI开发者可以分享和下载开源模型与数据集，目前约有一半的《财富》500强企业正在使用其服务。Delangue观察到一种反复出现的模式：企业最初依赖前沿API，但随着规模扩大，成本压力促使它们转向开源模型。 ## 开源与闭源的博弈在Anthropic暂停Fable发布的背景下，Delangue强调了开源与闭源之争的重要性。他担心少数大公司可能最终控制一切，而开源是防止AI技术被垄断的关键。 ## 中国实验室的崛起值得注意的是，目前美国下载的大部分开源模型来自中国实验室。Delangue认为这是一个需要解决的问题，但不应因此不信任开源本身。开源社区应该加强自身建设，而不是关闭大门。 ## 资本效率优先 Hugging Face在融资策略上选择了资本效率，而非硅谷常见的巨额融资路线。Delangue透露，公司去年拒绝了Nvidia的一笔大额投资。这一决策反映了公司对独立性和长期发展的考量。 ## 机器人领域的开源紧迫性 Delangue认为，机器人技术比聊天机器人或编码工具更需要开源和透明。因为机器人将深入家庭生活，看到大量私人信息，开源可以确保其安全性和可控性。 ## 结语 Delangue的观点表明，开源AI不仅是技术选择，更是关乎权力分配和公共利益的战略问题。随着AI应用日益广泛，开源模式的开放性和协作性将变得更加关键。

TechCrunch6天前原文

231

SK海力士创纪录融资265亿美元，美国商务部长敦促在美建厂

新上线

AI芯片热潮催生了华尔街史上最大规模的外国公司IPO。韩国存储芯片巨头SK海力士宣布，通过美国上市融资265亿美元，创下非美国公司IPO新纪录。与此同时，美国商务部长霍华德·卢特尼克在活动中表示，已与SK海力士及三星就在美建厂展开讨论，旨在减少对韩国存储芯片的依赖。 ## 华尔街最大外国IPO诞生 SK海力士此次发行1.779亿份美国存托凭证（ADR），每份定价149美元，相当于首尔市场股价的十分之一。该交易超过阿里巴巴2014年250亿美元的IPO，成为史上最大外国公司美国上市。股票于7月10日在纳斯达克开始交易，临时代码SKHYV，7月13日转为正式代码SKHY。上市首日开盘价较发行价上涨14%，且盘中继续走高。尽管ADR定价较首尔市场近三日均价溢价2.7%，但需求仍超过供应七倍以上。 ## 韩国折价不适用于SK海力士长期以来，韩国公司因治理结构复杂、股东回报低、地缘政治风险等因素，估值普遍低于全球同行，这一现象被称为“韩国折价”。但SK海力士显然未受此影响，原因在于其核心产品——高带宽内存（HBM），这是AI GPU的关键组件。目前，英伟达将SK海力士作为主要供应商之一，使其成为AI芯片热潮的最大受益者。 ## 募资用途：扩建韩国工厂与采购EUV光刻机根据文件，募资将用于三个方向：一是建设韩国新晶圆厂，以应对AI带来的全球存储芯片短缺；二是建设韩国新封装设施；三是采购EUV光刻机，用于制造下一代芯片。这些投资将进一步巩固其在存储芯片领域的领先地位。 ## 美国商务部长施压在美建厂美国商务部长卢特尼克在美光科技的活动上表示，已与三星和SK海力士就在美建厂进行洽谈。他强调，不希望韩国继续主导这项重要技术，暗示美国将推动存储芯片本土化生产。这一表态与《芯片与科学法案》鼓励半导体制造回流美国的政策方向一致。 ## 行业影响与展望 SK海力士的IPO成功和建厂压力，折射出AI时代存储芯片的战略地位。作为英伟达的核心供应商，其产能扩张直接关系到AI算力供应链的稳定。而美国要求海外芯片巨头在美建厂，则反映出全球半导体供应链的深度重构。未来，SK海力士、三星和美光之间的竞争，以及各国政策博弈，将深刻影响存储芯片产业格局。

TechCrunch6天前原文

232

SpaceX 申请再发射 10 万颗星链卫星，带宽提升 100 倍

新上线

SpaceX 已向美国联邦通信委员会（FCC）提交申请，计划部署 10 万颗第三代（Gen3）星链卫星，以实现超低延迟、多千兆对称宽带服务。若获批，现有近 1.1 万颗卫星的星座将扩大近十倍。SpaceX 承诺新网络将带来 100 倍于当前系统的带宽，但实际性能仍有待验证。目前星链最高套餐实测下载速度约 145-170 Mbps，上传不足 40 Mbps，远低于光纤宽带。新卫星单颗重超 2 吨，需要更强大的发射能力。该计划有望显著改善农村等宽带匮乏地区的互联网接入，但也引发了天文学界和太空环保人士的担忧。

ZDNet AI6天前原文

233

Sony 1000X The Collexion vs. Bowers & Wilkins Px8 S2：两者皆惊艳，但舒适度有高下

新上线

当索尼与Bowers & Wilkins两大音频巨头同时推出旗舰级头戴式耳机，消费者面临的不再是简单的“买哪个”，而是“哪个更适合我”。本文将从设计、音质、舒适度和功能等维度，深度对比索尼1000X The Collexion与B&W Px8 S2，帮你做出明智选择。 ## 设计：奢华路线，各有千秋索尼1000X The Collexion采用了**铝制外壳与柔软皮革**，整体质感向高端奢侈品看齐。而B&W Px8 S2则延续了品牌一贯的**简约优雅**，使用**Nappa皮革与记忆海绵**，头梁和耳罩的触感更细腻。两者都提供多种配色，但B&W在细节上更显精致，比如金属转轴和编织线材。 ## 音质：索尼均衡，B&W更“Hi-Fi” 索尼1000X The Collexion支持**LDAC与DSEE Extreme**，声音风格偏向**通透自然**，低频有弹性但不轰头，人声清晰，适合流行和古典。B&W Px8 S2则搭载**40mm碳纤维振膜单元**，声音**细节更丰富、声场更开阔**，尤其在古典和爵士乐中能展现乐器分离度，但低频量感稍少。如果你追求“原音重现”，B&W更胜一筹；如果喜欢带感节奏，索尼更讨喜。 ## 舒适度：决定胜负的关键在长时间佩戴测试中，**B&W Px8 S2明显更舒适**。其**265克**的重量比索尼的**290克**更轻，加上更柔软的耳垫，即使连续使用4小时也不易疲劳。索尼的夹持力稍大，耳罩内部空间也略小，对戴眼镜的用户不太友好。 ## 功能与续航：索尼的生态优势索尼配备了**行业顶级的主动降噪（ANC）**，支持自适应模式和环境音透传。续航**30小时**，并支持**多点连接**。B&W Px8 S2的降噪效果稍弱，但足以过滤办公室噪音，续航**25小时**，同样支持蓝牙5.2和aptX Adaptive。索尼还提供**360临场音效**和DSEE升频，对安卓用户更友好；B&W则通过**B&W Music App**提供EQ调节和流媒体集成。 ## 小结如果你**最看重舒适度和Hi-Fi音质**，B&W Px8 S2是更好的选择。如果你**需要顶级降噪、更长的续航和索尼生态功能**，1000X The Collexion更值得考虑。两者都是优秀产品，但舒适度上的差异可能会成为你最终决策的关键。

ZDNet AI6天前原文

234

我抛弃 Google Drive 转用自建云存储——后悔没早点这么做

新上线

## 从 Google Drive 到 Nextcloud：一次迟来的迁移我曾是 Google Drive 的忠实用户，多年来用它备份重要文件、分享资料，甚至习惯了按月付费。但渐渐地，一些隐忧开始浮现：用户被无故封禁的报道、Google 对 AI 扫描的愈发强调，以及逐年累积的存储费用，让我重新审视这种依赖单一服务的风险。 ### 为什么选择 Nextcloud？在寻找替代方案时，我发现了 **Nextcloud**——一款免费、开源的云存储软件，支持 iOS、Android、Windows、Linux 等几乎所有平台。它的核心卖点是 **自托管**：你可以将文件存放在自己的私有服务器上（比如旧笔记本电脑或外接硬盘），从而完全掌控数据。自托管听起来可能让人望而却步，但实际设置并不复杂。只要按照官方提供的分步指南操作，即使像我这样中等技术水平的用户也能轻松上手。一旦部署完成，Nextcloud 的界面和操作逻辑与 Google Drive 或 OneDrive 几乎无异，学习成本极低。 ### Nextcloud 的优势 - **数据主权**：所有文件存储在你的硬件上，不存在被服务商锁定或审查的风险。 - **无隐性成本**：软件本身免费，只需承担硬件和电费，长期来看比订阅制更划算。 - **功能完整**：支持文件夹组织、文件分享、版本历史、协同编辑等主流功能。 - **隐私保护**：没有 AI 扫描和广告追踪，你的文件只属于你自己。 ### 迁移后的体验我建立了分类清晰的文件夹体系（宠物医疗、车辆保养、孩子重要文档等），并通过桌面客户端实现自动同步。唯一的代价是初期配置需要一点耐心，但换来的是对数字资产的绝对控制。如果你也厌倦了云服务商的“软性绑架”，不妨试试 Nextcloud。它可能不会像商业产品那样“即插即用”，但那份掌控感值得付出。

ZDNet AI6天前原文

235

视频星期五：机器人世界杯

新上线

本周的机器人视频精选，聚焦于机器人领域的重大进展——**首届11对11全尺寸人形机器人足球赛**在RoboCup上成功举行。这一里程碑事件标志着人形机器人团队协作与自主决策能力迈上新台阶。 ### 赛事亮点 - **历史性突破**：两支由全尺寸人形机器人组成的队伍完成了完整的11对11足球比赛，这是RoboCup自1997年创办以来的首次。 - **技术挑战**：机器人需在动态环境中实时感知、规划路径、传球射门，并保持平衡与协作，对运动控制、计算机视觉和人工智能提出了极高要求。 - **未来愿景**：RoboCup的长期目标是到2050年打造一支能战胜人类世界杯冠军的机器人足球队，本次比赛是迈向该目标的关键一步。 ### 行业背景人形机器人在体育赛事中的应用不仅展示了硬件与算法的进步，也推动了**多智能体协同**、**强化学习**和**实时决策**等核心技术的发展。此外，这些技术可迁移至救灾、医疗护理和工业自动化等实际场景。 ### 其他精彩视频除足球赛外，本周还汇集了多款机器人演示： - **仿生机器人**在复杂地形中行走的改进算法 - **无人机编队**表演与避障能力 - **家用机器人**执行精细操作的新突破 ### 小结从实验室到赛场，机器人正逐步融入人类娱乐与竞技领域。这场足球赛不仅是技术的狂欢，更预示着一个机器人协作能力爆发的时代。

IEEE AI6天前原文

236

欧盟警告Meta：禁用自动播放和无限滚动，否则面临巨额罚款

新上线

## 欧盟《数字服务法》再出重拳：Meta 的自动播放和无限滚动或成历史欧盟正对科技巨头施加前所未有的监管压力。根据最新消息，欧盟委员会已正式向 Meta 发出警告，要求其旗下 Facebook 和 Instagram 等平台必须**禁用自动播放视频和无限滚动功能**，否则将面临巨额罚款。这一行动的依据是欧盟具有里程碑意义的《数字服务法》（DSA）。 ### 为什么是自动播放和无限滚动？自动播放视频和无限滚动是社交媒体平台最常用的“粘性”设计。前者在用户浏览时自动播放内容，后者则通过持续加载新内容让用户难以停止滑动。欧盟监管机构认为，这些设计利用了人类心理的弱点，**刻意延长用户在线时间**，从而增加广告曝光和数据收集机会。DSA 明确要求平台不得使用“欺骗性或操纵性”界面，这类功能很可能被认定为违反规定。 ### Meta 面临的实际风险如果 Meta 未能在规定时间内做出调整，欧盟有权对其处以**全球年营业额最高 6% 的罚款**。以 Meta 2023 年约 1350 亿美元的收入估算，罚款金额可能超过 80 亿美元。此外，欧盟还可以要求 Meta 在整改期间暂停部分服务，这对其广告业务将是沉重打击。 ### 行业影响与连锁反应这一警告不仅针对 Meta。欧盟此前已对 TikTok、X（原 Twitter）等平台提出类似要求。TikTok 的“无限滚动”和“自动播放”同样被点名，而 X 的“算法推荐”也曾受到审查。可以预见，**整个社交媒体的交互设计范式可能面临重构**。对于用户而言，这或许是一个好消息：更少的无意识刷屏、更可控的信息消费。但对依赖“注意力经济”的科技公司来说，失去这些“成瘾机制”意味着需要寻找新的增长模式。Meta 已在测试“时间管理工具”和“休息提醒”，但监管压力可能会迫使其做出更根本的改变。 ### 下一步：合规期限与博弈欧盟尚未公布 Meta 的具体整改期限，但根据 DSA 的执法流程，监管机构通常会给予 3 到 6 个月的缓冲期。Meta 可以选择提起诉讼，但历史上科技巨头在 DSA 相关案件中胜诉率极低。更可能的情况是，Meta 将逐步推出“欧盟特供版”应用，在保留核心功能的同时移除争议设计。这一事件也提醒全球其他监管机构：**用户界面设计不再是产品团队的自由裁量权，而是需要符合法律红线**。未来，各国可能效仿欧盟，对“黑暗模式”（Dark Patterns）进行更严格的限制。

Ars Technica6天前原文

237

在 Amazon SageMaker AI 上使用无服务器模型定制微调 NVIDIA Nemotron 3 模型

新上线

模型定制将通用 AI 模型转化为专业化企业资产。通过微调基础模型，企业可以教会 AI 理解自身独特的工作流、术语和领域知识，同时严格遵循品牌风格并减少幻觉。对于企业而言，这不仅是优化，更是创造专有知识产权——微调模型将组织的独特智慧和最佳实践编码到其架构中，构建难以被现成公开前沿模型复制的竞争优势。同时，在目标任务上微调较小的开源模型，往往能匹配甚至超越更大规模专有模型的性能，同时显著降低成本，并将敏感数据保留在安全、私有的基础设施内。 Amazon SageMaker AI 提供丰富的开源模型选择和微调技术。如今，SageMaker AI 推出了针对 **NVIDIA Nemotron 3** 模型的无服务器模型定制功能，首发支持 **Nemotron 3 Nano（300亿总参数，30亿活跃参数）** 和 **Nemotron 3 Super（1200亿总参数，120亿活跃参数）**。通过监督微调、基于可验证奖励的强化学习和基于 AI 反馈的强化学习，用户无需预置或管理任何基础设施，即可将这些高性能开源模型适配到特定领域和工作流中。 ## NVIDIA Nemotron 3 模型架构亮点 NVIDIA Nemotron 3 系列基于 **混合 Mamba-Transformer 混合专家架构**，原生支持高达 **100万 token 的上下文长度**。该架构交错使用三种互补的层类型：Mamba-2 层用于高效的线性时间序列处理，Transformer 注意力层用于精确的关联召回，以及混合专家层用于扩展模型容量。这种设计在长序列处理效率和复杂推理能力之间取得了平衡。 ## 无服务器微调技术 SageMaker AI 为 Nemotron 3 提供了三种微调方法： - **监督微调**：使用标注数据直接调整模型参数，适用于分类、摘要等任务。 - **基于可验证奖励的强化学习**：通过可自动验证的奖励信号优化模型行为，适用于数学推理、代码生成等有明确正确答案的场景。 - **基于 AI 反馈的强化学习**：利用 AI 评判模型输出质量，适用于需要主观判断的任务，如创意写作、对话生成。 ## 如何在 SageMaker Studio 中开始用户可以直接在 SageMaker Studio 中通过可视化界面或 API 启动无服务器微调作业。步骤如下： 1. 选择 Nemotron 3 模型（Nano 或 Super）。 2. 上传领域数据集（支持常见格式如 JSON Lines）。 3. 选择微调方法（SFT、RLVR 或 RLAIF）并配置超参数。 4. 启动作业，SageMaker AI 自动管理计算资源。 5. 微调完成后，模型可直接部署为无服务器端点。这种无服务器模式显著降低了入门门槛，使更多企业能够以较低成本实现模型定制，同时保持数据安全。 ## 行业意义 Nemotron 3 的混合架构和无服务器微调能力，为企业在长上下文处理（如法律文档分析、代码库理解）和成本效率之间提供了新选择。结合 SageMaker AI 的托管服务，企业可以快速迭代领域模型，而无需深究底层基础设施。

AWS ML6天前原文

238

Henry Schein One 借助 Amazon SageMaker AI 实现牙科 X 光片实时质量审核

新上线

在牙科行业，影像质量直接决定保险理赔是否获批。据统计，高达 **20%** 的初始保险索赔被拒，其中影像缺失或质量低下是主因之一。然而，传统的质量评估流程往往是事后人工审核——临床医生在拍摄后数小时甚至数天才查看 X 光片，发现问题时索赔已被拒或治疗无法推进。若影像模糊、错位或不完整，患者不得不返回诊所重拍，增加了成本、延误和各方的不满。 Henry Schein One 通过构建 **Image Verify** 系统解决了这一痛点。该系统基于 **Amazon SageMaker AI**，在牙科 X 光片拍摄的瞬间进行实时质量评估，覆盖数千个诊所。从概念到部署，Image Verify 在数月内便推广至 **10,000 多个活跃站点**，已处理超过 **1,100 万张 X 光片**，且每周新增约 **150 万张**。目前，Henry Schein One 正将该系统扩展至全球 **40,000 个站点**，覆盖四个地区。 ## 挑战：大规模实时影像质量审核 Henry Schein One 之前的影像审核方案运行在另一个云平台上，但无法满足临床工作流对延迟和成本效率的要求。在 AWS 上重建并非简单的迁移，而需要设计一个能同时满足五项严格要求的系统： - **延迟**：质量评估必须在 **3 秒内** 完成，以无缝融入临床工作流。 - **准确性**：多个机器学习模型需评估清晰度、对齐度和完整性等不同维度，避免误报损害临床信任。 - **规模**：系统需同时服务数万个站点，日处理量达数十万张。 - **成本效率**：大规模 GPU 推理若不精心优化，成本将难以承受。 - **全球覆盖**：医疗场景具有本地化特征，但平台必须在多个区域保持一致的性能表现。 ## Image Verify 的解决方案 Henry Schein One 利用 **Amazon SageMaker AI** 构建了端到端的影像质量验证流水线。系统在 X 光片拍摄后立即触发推理，调用多个专用模型分别评估不同质量指标，并在 **亚秒级** 内返回结果。如果检测到质量问题，系统会实时提示操作人员，从而在患者离开前完成重拍，避免了后续的理赔纠纷。 ### 关键设计亮点 - **多模型并行推理**：针对不同质量维度（如清晰度、解剖结构完整性）部署独立模型，并通过 SageMaker 的模型编排能力实现并行推理，确保整体延迟在 3 秒以内。 - **成本优化**：通过 **GPU 实例自动缩放** 和 **批量推理**，在高峰期保持性能，在低谷期降低成本。此外，利用 **Amazon Elastic Inference** 或 **SageMaker 推理加速器** 进一步降低单位推理成本。 - **全球部署**：采用多区域架构，利用 **AWS 全球基础设施** 将推理端点部署在靠近诊所的区域，确保低延迟并符合数据本地化法规。 ## 成果与展望 Image Verify 上线后，Henry Schein One 的影像质量审核流程从“事后补救”转变为“即时预防”。诊所端重拍率显著下降，保险索赔通过率提升，患者体验得到改善。目前系统每周处理 **150 万张** X 光片，并持续增长。未来，Henry Schein One 计划将该平台扩展至 **40,000 个站点**，并探索在正畸、种植等更复杂牙科影像中的应用。这一案例表明，**实时 AI 推理** 在医疗影像领域具有巨大价值——不仅提升运营效率，更直接改善临床结果和患者满意度。对于希望构建类似系统的企业，关键在于平衡延迟、准确性和成本，而 **Amazon SageMaker AI** 提供了灵活的基础设施和工具来应对这些挑战。

AWS ML6天前原文

239

在 AWS 上为智能体 AI 构建语义层：Stardog 与 Amazon Bedrock AgentCore 实战

新上线

企业数据分析正从“自助 BI”迈向“智能体分析”（Agentic Analytics）时代。然而，数据分散在不同系统中，同一概念定义不一，导致 AI 智能体容易给出矛盾答案。本文介绍如何在 AWS 上利用 Stardog 语义 AI 应用（覆盖 Amazon Aurora 和 Amazon Redshift）构建语义层，并通过 Amazon Bedrock AgentCore 运行 Strands Agents，实现无需 ETL 的客户 360 度查询。 ## 为什么需要语义层？传统报表到自助 BI 的进化并未解决根本问题：数据工程师仍需为每个问题预建模型，分析师仍是瓶颈。生成式 AI 智能体能自主规划、编写查询、评估结果并迭代，但前提是底层数据语义一致。例如，CRM 中的“客户”与计费系统的“客户”并非同一记录，北美团队的“收入”计算方式也可能与欧洲不同。若直接让智能体访问碎片化数据，即便 SQL 语法正确，也可能返回错误或矛盾的答案。 ## Stardog 语义层如何工作？ Stardog 在现有数据库（如 Aurora 和 Redshift）之上构建统一的语义层，通过知识图谱映射不同数据源中的实体和关系。它支持： - **虚拟集成**：无需 ETL，实时查询跨源数据。 - **语义推理**：自动理解“客户”“订单”等概念的关联，消除歧义。 - **兼容 AWS 计算**：可部署在 Amazon EKS、ECS 或 Lambda 上。 ## Amazon Bedrock AgentCore 的角色 AgentCore 是一个托管服务，整合了身份认证、托管和工具凭证管理。本文中，Strands Agents 通过 AgentCore 访问语义层，回答“客户 360”类问题——例如“某客户过去一年的总消费额”，该问题需要同时查询 Aurora 中的交易记录和 Redshift 中的分析数据。 ## 实践价值这种架构的核心优势在于： 1. **降低数据准备成本**：无需为每个新问题预先建模。 2. **提升答案可靠性**：语义层确保跨系统数据一致性。 3. **加速落地**：借助 Bedrock 的基础模型（如 Claude、Llama）和 AgentCore 的托管能力，开发者可快速构建可信的企业级 AI 智能体。 ## 小结智能体 AI 的瓶颈不在模型能力，而在数据语义的统一。Stardog + Amazon Bedrock AgentCore 的组合提供了一条务实路径：在现有 AWS 数据基础设施上构建语义层，让 AI 智能体从“能写 SQL”升级为“能理解业务含义”。

AWS ML6天前原文

240

Amazon Quick Automate 原生案例管理：规模化智能体工作流的关键

新上线

在 AI 智能体从概念验证走向企业级生产环境的过程中，规模化运营的挑战远不止于智能体本身。Amazon Quick Automate 通过原生集成**案例管理**，将每个工作项视为一个贯穿全生命周期的“案例”，为智能体工作流提供状态追踪、异常处理、人工介入（HITL）和动态扩展等关键能力。 ## 从概念验证到规模化生产：智能体面临的运营挑战一个 AI 智能体在概念验证（POC）阶段可以轻松处理一张发票、审核一项理赔或分类一个工单。但当工作项数量达到**数千甚至数百万**时，企业需要面对一系列新的问题：如何追踪每个工作项在多智能体、多系统中的状态？如何定位失败节点与原因？如何让人类在必要时介入？又如何根据需求动态扩展基础设施？这些正是 Amazon Quick Automate 通过**原生案例管理**要解决的核心痛点。 ## 案例管理：为智能体工作流注入结构与可见性在 Quick Automate 中，**每个工作项都被定义为一个“案例”**，并贯穿其从创建、处理到关闭的完整生命周期。这种设计带来了几个关键优势： - **全流程可见性**：案例状态实时更新，团队可以清晰看到每个工作项在哪个步骤、由哪个智能体处理，以及处理结果。 - **异常处理与重试**：当智能体处理失败时，系统可以自动标记案例状态，触发重试或转人工处理。 - **人工介入（HITL）**：在需要判断、审批或复杂决策的场景下，案例可以进入“等待人工”状态，由人类操作员处理后再返回自动化流程。 - **动态扩展**：通过“案例创建者-处理器”模式，系统可以根据输入负载自动创建多个案例，并分配给多个处理器并行执行，实现弹性伸缩。 ## 核心模式：案例创建者与处理器 Quick Automate 引入了一种简洁但强大的设计模式——**案例创建者-处理器**。创建者负责侦听输入源（如消息队列、数据库、API 调用），为每个新工作项生成一个案例；处理器则持续轮询待处理案例，执行智能体工作流并更新案例状态。这种解耦架构使得系统可以轻松应对流量高峰：当输入激增时，创建者快速生成大量案例，而处理器集群可以自动扩展，并行处理这些案例，从而保证吞吐量。 ## 真实场景：企业级流程中的案例管理实践以一个典型的**保险理赔**流程为例： 1. **案例创建**：当理赔申请提交后，Quick Automate 自动创建一个案例，包含申请人信息、事故描述、证据文件等。 2. **智能体处理**：AI 智能体自动提取关键信息、验证保单有效性、评估损失金额。如果智能体对某项数据存疑（例如发票金额异常），案例状态变为“需人工审核”。 3. **人工介入**：人类审核员查看案例详情，确认或修正智能体的判断，然后提交反馈。案例状态更新为“已审核”，触发后续自动处理。 4. **多智能体协作**：案例可能依次经过欺诈检测智能体、赔付计算智能体、支付智能体，每个步骤都记录在案例历史中。 5. **案例关闭**：当所有步骤完成，案例状态变为“已关闭”，所有审计日志、决策路径和人工注释都保留在案例中，方便后续追溯。 ## 企业级能力：不止于自动化除了核心的案例生命周期管理，Quick Automate 还提供了细粒度访问控制、活动日志、版本管理、异常处理等企业级功能。这意味着团队可以安全地将智能体工作流部署到生产环境，同时满足合规与审计要求。 ## 总结 Amazon Quick Automate 的原生案例管理能力，将 AI 智能体从“单点任务执行者”升级为“企业级流程参与者”。通过为每个工作项提供结构化的生命周期管理，它解决了规模化运营中的**可见性、可靠性、可追溯性**三大核心问题。对于正在将智能体从实验室推向生产环境的企业来说，这或许是比智能体本身更值得关注的基础设施。

AWS ML6天前原文