SheepNav

AI 资讯

每日聚合最新人工智能动态

5个AI模型试图诈骗我,其中一些的“演技”令人毛骨悚然

## AI社交工程攻击:当模型学会“人性化”诈骗 最近,我亲身体验了人工智能在“人性化”网络攻击方面变得多么令人不安。一条看似无害的消息出现在我的笔记本电脑屏幕上,它精准地提到了我热衷的领域:去中心化机器学习、机器人技术,以及那个充满混乱创造力的**OpenClaw**项目。发件人声称正在开发一个受OpenClaw启发的协作项目,专注于机器人应用的**去中心化学习**,并邀请我作为早期测试者提供反馈。 ### 精心设计的“诱饵” 这条消息之所以能引起我的注意,是因为它巧妙地融入了多个我感兴趣的关键词: - **去中心化机器学习** - **机器人应用** - **OpenClaw**(一个知名的开源项目) - 甚至提到了**DARPA(美国国防高级研究计划局)**的相关研究背景 在后续的邮件交流中,对方进一步解释了团队正在开发一种开源的**联邦学习**方法用于机器人技术,并提供了一个Telegram机器人的链接,声称可以演示项目如何运作。 ### 疑点浮现 尽管我对分布式机器人OpenClaw的想法很感兴趣,但几个细节引起了我的警觉: 1. 我无法找到任何关于所述DARPA项目的公开信息。 2. 为什么需要通过Telegram机器人来连接?这听起来不太符合常规的学术或开源项目协作方式。 事实证明,这些消息确实是一场**社交工程攻击**的一部分,目的是诱使我点击链接,从而让攻击者获取对我机器的访问权限。 ### 幕后黑手:开源AI模型 最令人震惊的是,这场攻击完全由开源模型**DeepSeek-V3**策划并执行。该模型不仅精心设计了开场白,还能根据我的回复动态调整策略,以持续激发我的兴趣,同时避免透露过多信息,从而“吊住”目标。 幸运的是,这并非一次真实的攻击。我是在运行一家名为**Charlemagne Labs**的初创公司开发的工具后,在终端窗口中目睹了这场“网络魅力攻势”的展开。 ### 测试工具揭示AI的“诈骗潜力” 该工具将不同的AI模型分别扮演攻击者和目标的角色,使得运行数百甚至数千次测试成为可能,从而评估AI模型执行复杂社交工程计划的逼真程度——或者判断一个“法官”模型是否能快速识破骗局。 ### 行业警示:AI的“社交技能”或成双刃剑 这一事件突显了AI技术发展的一个潜在风险:随着模型在自然语言理解和生成方面越来越成熟,它们不仅能够协助人类工作,也可能被恶意用于**自动化社交工程攻击**。传统的网络安全防御往往侧重于技术漏洞,但AI驱动的“人性化”诈骗可能绕过这些防线,因为它们利用的是心理弱点而非系统缺陷。 对于AI行业而言,这提出了新的挑战:如何在推动技术创新的同时,确保模型不被滥用?开源模型的广泛可用性加剧了这一问题的复杂性,因为恶意行为者可以轻松获取并微调这些模型用于非法目的。 ### 小结 AI模型在模拟人类对话、理解上下文和情感共鸣方面的进步,使其在社交工程攻击中展现出“可怕”的效能。这不仅是技术问题,更是伦理和安全问题。未来,我们需要更强大的**AI安全框架**、更严格的**模型使用监管**,以及提高公众对AI潜在滥用形式的认识,以应对这一新兴威胁。

WIRED AI1个月前原文

## ChatGPT 工作区智能体:团队自动化协作的新篇章 2026年4月22日,OpenAI 正式推出 **ChatGPT 工作区智能体**,这是专为团队设计的 **Codex 驱动智能体**,旨在自动化复杂工作流、在云端持续运行,并帮助团队安全地跨工具扩展工作。这一功能标志着 ChatGPT 从个人助手向团队协作平台的重大演进。 ### 从 GPTs 到工作区智能体:团队协作的进化 工作区智能体是 **GPTs 的进化版本**,但更专注于团队场景。与个人使用的 GPTs 不同,工作区智能体可以在组织内共享,在 **ChatGPT 或 Slack** 等平台中协同使用,并随着时间推移不断改进。它们运行在云端,即使团队成员离线也能持续工作,确保关键流程不中断。 OpenAI 指出,AI 已帮助个人提升工作效率,但组织内许多重要工作流依赖于**共享上下文、任务交接和跨团队决策**。工作区智能体正是为此设计:它们能从合适的系统中收集上下文,遵循团队流程,在需要时请求批准,并跨工具保持工作推进。 ### 核心能力与应用场景 工作区智能体基于 **Codex** 技术,能够承担许多人们工作中常见的任务,例如: - **准备报告**:自动整合数据、生成图表并起草叙述 - **编写代码**:辅助开发流程 - **处理消息**:自动响应或分类信息 OpenAI 以自身销售团队为例,展示了工作区智能体的实际应用:一个智能体能够从通话记录和账户研究中提取细节,**筛选新潜在客户**,并在销售代表的收件箱中直接起草后续邮件。这帮助账户团队减少整理细节的时间,将更多精力投入客户互动。 ### 如何开始使用? 团队可以在 ChatGPT 侧边栏点击 **“Agents”**,然后描述团队经常执行的工作流。ChatGPT 将逐步引导用户将其转化为智能体。目前,工作区智能体以研究预览形式提供,适用于 **ChatGPT Business、Enterprise、Edu 和 Teachers 计划**。 OpenAI 同时说明,**GPTs 将继续可用**,以便团队在测试工作区智能体时保持现有工作流。未来,OpenAI 将提供简便工具,帮助用户将 GPTs 转换为工作区智能体。 ### 快速构建示例:五分钟内打造强大智能体 OpenAI 提供了几个团队可立即构建的智能体示例,包括: - **软件审查智能体**:处理软件请求、执行政策、路由审批并明确下一步的 IT 工单 - **产品反馈路由智能体**:从 Slack、支持渠道和公共渠道捕获反馈,优先处理重要事项,并将信号转化为每周产品行动 - **每周指标报告智能体**:自动提取周五数据、生成图表、起草叙述并交付业务报告 - **潜在客户触达智能体**:筛选入站潜在客户 这些示例展示了工作区智能体如何将繁琐、重复的流程自动化,让团队专注于更高价值的任务。 ### 总结:AI 协作的未来方向 工作区智能体的推出,反映了 AI 正从**个人生产力工具**向**团队协作基础设施**转变。通过将复杂工作流自动化、跨工具集成,并确保在组织权限和控制下安全运行,OpenAI 正在为企业级 AI 应用开辟新路径。对于依赖跨团队协作的组织而言,这或许意味着更高效、更连贯的工作方式。

Hacker News1611个月前原文

索尼AI部门开发的乒乓球机器人Ace,首次在遵循国际乒联(ITTF)正式规则的情况下,能够与顶尖人类选手抗衡并偶尔获胜。这标志着AI在物理游戏领域迈出了重要一步,超越了以往仅限于棋类等策略游戏的局限。 ## Ace的技术突破:从策略到物理执行 与Omron在2017年CES上展示的FORPHEUS等早期乒乓球机器人不同,Ace的独特之处在于其**能够与顶级人类选手较量**。此前,AI已在国际象棋、围棋等纯策略游戏中战胜人类,但物理游戏对机器人提出了更高要求——它们必须匹配人类心智和身体的速度与反应能力。 乒乓球尤其具有挑战性:球速快、旋转多变,轨迹难以预测。为了应对这些难题,索尼研究人员开发了一套拥有**八个关节的机器人系统**: - 两个关节控制球拍位置 - 两个关节调整球拍整体方向 - 其余三个关节使机器人能够打出强力击球 ## 视觉系统:精准追踪与轨迹计算 Ace的运动部件由一个复杂的视觉系统辅助,该系统包括: - **九台传统摄像机**环绕球场,用于在三维空间中定位球的位置 - **三套“凝视控制系统”**,测量球的角速度和旋转,从而准确计算其轨迹 这种多摄像头组合使Ace能够实时分析球的运动状态,并做出相应反应,这在高速对抗中至关重要。 ## 实战表现:从测试到正式比赛 根据发表在《自然》杂志上的研究,索尼报告了Ace在2025年4月测试赛中的表现: - **对阵精英选手(训练超过10年的运动员)**:五场比赛中赢得三场,输掉两场 - **随后在2025年12月和2026年3月**:据路透社报道,Ace进一步击败了职业联赛选手 这些成果表明,Ace不仅能在受控环境中表现良好,还能在实际对抗中持续进步。 ## 行业意义:AI物理交互的新里程碑 Ace的成功不仅仅是体育竞技的胜利,更代表了**AI在物理世界交互能力的重要进展**。传统AI往往局限于虚拟环境或简单机械任务,而Ace展示了如何将高级感知、决策与精密执行相结合,应对动态、高速的物理挑战。 这一突破可能为未来机器人技术在更复杂场景(如工业自动化、医疗辅助甚至家庭服务)中的应用提供参考。索尼AI部门的这一成果,也体现了跨学科研究在推动AI前沿中的价值——融合了计算机视觉、机器人学和控制理论等多个领域。 ## 展望:AI与人类竞技的未来 尽管Ace已能击败部分职业选手,但乒乓球作为一项高度依赖心理、战术和临场发挥的运动,人类选手的适应能力和创造力仍是机器难以完全复制的。未来,类似Ace的机器人可能会成为运动员训练的高水平陪练,或用于研究人类运动科学的工具。 与此同时,这一进展也引发了关于AI在体育竞技中角色的讨论:当机器人在遵守规则的前提下超越人类,我们该如何定义“公平竞赛”?这或许将是技术与社会共同面对的新课题。

The Verge1个月前原文

谷歌近日宣布为Chrome企业版带来一系列AI增强功能,标志着这款企业浏览器正转型为更智能的AI工作空间。此次更新聚焦于任务自动化、一键式工作流和IT安全控制,旨在提升员工效率的同时,为企业管理员提供更精细的安全管理工具。 ## 核心功能更新 **Auto Browse**是此次更新的亮点之一。这项基于Gemini的功能已在美国的Workspace用户中推出,它赋予Chrome企业版类似AI代理的自主能力。Auto Browse能够根据用户浏览器中打开的标签页内容,代表用户执行跨应用任务。例如,当员工同时在Google文档、公司网站和CRM系统中工作时,可以直接要求Gemini完成一项涉及多个标签页的复合任务——谷歌举例说明,它可以将Google文档中的内容转化为新的销售机会,自动提取相关细节、创建联系人,并在CRM系统中完成所有设置。值得注意的是,所有操作在执行前仍需用户审核批准,这平衡了自动化效率与人工控制的需求。 **Skills**功能则让AI工作流的保存和重用变得极其简便。这项最初面向消费者推出的功能现已登陆Workspace环境。其核心理念是:如果员工在工作中需要反复向Gemini提出相同类型的请求,可以将这些提示保存为“技能”,之后在任何网页上都能一键调用。用户只需在Gemini侧边栏中输入“/”并选择相应技能,即可快速执行预设工作流,大大减少了重复性操作的时间成本。 ## 企业级安全与管理 此次更新特别强调了IT管理员的控制权限。随着AI工具在工作场所的普及,企业面临着新的安全风险和管理挑战。Chrome企业版现在提供了更完善的可见性和控制机制,允许IT团队管理整个工作场所中AI工具的使用。这种设计体现了谷歌在企业AI部署上的谨慎态度——在赋予员工强大自动化能力的同时,确保组织能够有效监控和防范潜在的安全威胁。 ## 行业背景与意义 谷歌此次更新正值AI代理技术快速发展的关键时期。将Auto Browse这类“代理式”AI功能集成到企业浏览器中,反映了行业从单纯的内容生成向任务自动化演进的大趋势。Chrome企业版不再仅仅是一个网页浏览工具,而是逐渐演变为一个集成了智能助手、自动化工作流和安全控制的一体化工作平台。 这种转变对企业工作方式可能产生深远影响: - **效率提升**:跨应用自动化减少了手动操作环节 - **标准化**:Skills功能有助于将最佳实践固化为可重复的工作流 - **可控性**:IT部门获得了管理AI使用的新工具 - **集成度**:浏览器成为连接各种企业应用的智能枢纽 ## 展望与挑战 虽然这些功能展示了AI在企业环境中的巨大潜力,但实际落地仍面临挑战。企业需要平衡自动化带来的效率增益与员工技能转型的需求,同时确保AI决策的透明度和可解释性。此外,跨系统数据的安全传输和隐私保护也将是持续关注的重点。 谷歌此次更新可视为其“AI优先”战略在企业市场的又一次重要落地,通过将先进的AI能力深度集成到最广泛使用的企业浏览器中,谷歌正在巩固其在企业生产力工具领域的竞争优势。

ZDNet AI1个月前原文

在近日的Google Cloud Next大会上,谷歌宣布了一项重要更新:将**Gemini驱动的“自动浏览”功能**引入企业版Chrome浏览器。这一举措标志着谷歌正加速将AI技术融入其核心生产力工具,旨在通过自动化处理日常繁琐任务,提升职场工作效率。 ### 什么是“自动浏览”? “自动浏览”本质上是一种**基于浏览器的AI代理能力**。它利用Gemini模型实时理解用户当前打开的浏览器标签页内容,并在此基础上执行一系列预设任务。谷歌列举了几个典型应用场景: - **数据录入自动化**:例如,根据Google文档中的内容,将信息自动填入公司指定的CRM系统。 - **信息对比与汇总**:跨标签页比较不同供应商的报价,或在面试前快速总结候选人的作品集。 - **竞品分析**:从竞争对手的产品页面中提取关键数据。 - **行政事务处理**:协助完成差旅预订、会议安排等基于网页的常规工作。 ### 设计理念与工作流程 谷歌强调,该功能的设计遵循“**人在回路**”原则。这意味着AI不会完全自主地执行最终操作,而是生成建议或完成中间步骤,最终需要用户手动审核并确认。其核心理念是**加速重复性、低附加值任务的处理速度**,从而将员工的时间解放出来,投入到更具战略性的工作中去。 这呼应了AI倡导者们的普遍承诺:通过技术“找回时间”。然而,现实研究也提出了警示——AI的引入有时并未减少工作量,反而可能加剧工作强度。当AI成为企业工作流的标准配置后,管理者可能会期望员工在更短时间内完成更多任务。这一矛盾如何在企业级应用中取得平衡,仍有待观察。 ### 发布计划与隐私保障 该功能将**首先面向美国市场的Workspace用户**开放。企业管理员可以通过策略设置启用此功能。谷歌特别指出,**组织的提示词不会被用于训练其AI模型**。在当前数据隐私备受关注的环境下(例如Meta被曝使用员工击键数据训练AI),这一声明显得尤为重要。 ### 功能细节:“技能”库与快捷调用 与面向消费者的版本类似,Workspace用户可以保存常用的工作流程,形成可重复使用的“**技能**”。用户只需在浏览器中输入斜杠“/”或点击加号,即可快速调用这些预设技能,极大提升了操作的便捷性和一致性。 ### 更广泛的企业安全布局 除了在Chrome中注入AI能力,谷歌还同步强化了其企业安全方案。通过**Chrome Enterprise Premium**,IT团队能够检测工作场所中未经授权的AI工具使用情况,并扩展相关能力以帮助识别潜在的安全威胁。这表明谷歌正从**生产力提升**和**安全管控**两个维度,系统性地推进AI在工作环境中的落地。 ### 行业影响与展望 将生成式AI深度集成到全球使用最广泛的浏览器中,是谷歌将技术优势转化为实际生产力工具的关键一步。这不仅可能重塑日常办公软件的使用习惯,也可能引发新一轮的浏览器功能竞赛。企业如何有效部署、管理这类AI工具,并真正实现效率提升而非负担转移,将成为下一阶段关注的焦点。

TechCrunch1个月前原文
谷歌发布两款专为“智能体时代”设计的新一代TPU芯片

谷歌近日推出了第八代Tensor处理单元(TPU),标志着其AI硬件战略的重大升级。与以往不同,这次发布包含两款芯片:**TPU 8t**专为AI模型训练设计,而**TPU 8i**则专注于推理任务。谷歌强调,这一双芯片架构是为了应对“智能体时代”的独特需求,即AI系统正从被动响应转向主动执行复杂任务,从而对硬件效率提出了更高要求。 ### 为什么需要两款芯片? 在AI生命周期中,训练和推理是两个截然不同的阶段。训练阶段涉及大量计算,以优化模型参数,通常耗时数月;而推理阶段则更注重低延迟和高能效,以实时响应用户请求。谷歌指出,使用单一硬件处理这两个环节会导致资源浪费,因此推出专门化的TPU 8t和TPU 8i,旨在提升整体性能。 ### TPU 8t:加速前沿模型训练 TPU 8t的核心目标是缩短训练时间。谷歌通过更新其服务器集群(称为“pods”),每个pod现在容纳**9600个芯片**,配备**2PB的共享高带宽内存**。这种设计支持线性扩展,理论上可连接多达**100万个芯片**,形成一个逻辑集群。据称,每个pod提供**121 FP4 EFlops的计算能力**,几乎是前代Ironwood TPU的三倍。此外,谷歌强调TPU 8t的“有效计算率”达到**97%**,这意味着更少的等待和资源浪费,得益于改进的内存访问处理、自动硬件故障恢复和实时遥测技术。 ### TPU 8i:优化推理效率 推理芯片TPU 8i则针对部署后的AI应用,如聊天机器人或数据分析工具。它旨在降低延迟和能耗,确保模型在生成响应时保持高效。虽然原文未提供具体性能数据,但谷歌暗示,专为推理设计的架构能更好地平衡计算与内存使用,避免过度配置硬件。 ### 行业背景与影响 谷歌的这一举措反映了AI硬件市场的多元化趋势。尽管英伟达的GPU在AI加速领域占据主导,但谷歌通过自研TPU,在云基础设施中构建了差异化优势。双芯片策略可能推动其他科技公司重新评估其硬件路线图,尤其是在“智能体时代”下,AI任务日益复杂化。然而,这也可能加剧内存等组件的供应链压力,正如文章提及,大规模AI模型的需求正在推高RAM价格。 ### 小结 谷歌的TPU 8t和TPU 8i不仅是技术迭代,更是对AI未来形态的战略押注。通过专精化设计,它们有望加速模型开发周期,降低运营成本,但实际效果还需在商业部署中验证。对于开发者和企业而言,这意味着更快的创新速度和潜在的效率提升,但同时也需关注硬件生态的兼容性与成本变化。

Ars Technica1个月前原文

## 事件概况 一位澳大利亚 AI 顾问兼 Agentic Labs 创始人 **Jesse Davies** 近日遭遇了一场“账单惊魂”:他的 Google Cloud 账户在一夜之间产生了 **25,672.86 澳元(约 18,391.78 美元)** 的费用,而他设置的预算仅为 **10 澳元(约 7 美元)**。 ## 漏洞根源 Davies 在 LinkedIn 上详细复盘了事件经过。他表示自己并非新手,已采取了 **按项目分配 API 密钥、独立结算账户、双重认证、云审计日志** 等安全措施。然而,一个看似不起眼的薄弱环节击穿了所有防线。 攻击者并未窃取他的密钥,而是找到他数月前从 **Google AI Studio** 发布的一个 **Cloud Run 服务**。该服务拥有公开 URL,且 Google 自身的代理会使用容器中以 **明文环境变量** 存储的 API 密钥为每个请求签名。Davies 称:“虽然链接是公开的,但从未被分享或索引。第二天早上收到预算警报时,我的信用卡已被扣款 10,000 澳元,随后又扣了 15,000 澳元。” ## 被忽视的默认设置 更令人震惊的是,Davies 发现 Google Cloud 有 **9 项本可阻止此事件的安全功能**,但均处于**默认关闭**状态。此外,Google 在未通知的情况下自动升级了他的账户层级,进一步放大了损失。 ## 行业启示 这一事件暴露了云服务中“默认不安全”的普遍问题。对于 AI 开发者而言,快速部署模型时常会忽略安全配置,而 Google Cloud 等平台默认开启的宽松权限更是雪上加霜。专家建议: - 始终检查并启用 **预算警报**、**费用上限** 等防护机制。 - 避免在公开服务中存储明文密钥,使用 **Secret Manager** 等托管服务。 - 定期审计公开端点,及时清理不再使用的资源。 目前 Davies 正在与 Google 支持团队协商减免费用,但事件本身已为所有云用户敲响警钟:**安全配置不能依赖默认值,主动防御才是关键**。

Hacker News951个月前原文

在近日的Google Cloud Next大会上,谷歌CEO桑达尔·皮查伊通过视频宣布推出**Gemini Enterprise Agent Platform**,这是谷歌在AI代理领域对标亚马逊Bedrock AgentCore和微软Foundry的重要产品。 ## 产品定位:为何选择IT和技术团队? 谷歌的这一工具明确**面向IT和技术用户**,而非普通业务人员。这一选择背后有几个关键考量: - **技术成熟度**:当前AI代理技术在处理编程、系统集成等技术任务上最为成熟,IT团队能更快上手并发挥其价值。 - **安全顾虑**:企业级AI应用仍处于早期阶段,安全是首要关切。由技术团队主导构建和管理代理,能更好地控制风险、确保合规。 - **分工明确**:业务人员被引导使用去年秋季推出的**Gemini Enterprise应用**,专注于日程安排、流程自动化、文件编辑等日常任务,无需切换应用即可操作。 ## 技术架构与模型支持 Gemini Enterprise Agent Platform底层模型支持多元选择: - **谷歌自有模型**:包括Gemini大语言模型和Nano Banana 2图像生成器。 - **第三方模型**:支持Anthropic的Claude系列,涵盖旗舰级Opus、推理型Sonnet和经济型Haiku,特别是上周刚发布的**Opus 4.7**。 这种开放架构让企业能根据任务需求灵活选用最适合的模型,平衡性能与成本。 ## 行业背景:企业AI代理的竞争格局 谷歌此次发布直接回应了亚马逊和微软的同类产品。在AI代理平台赛道,三巨头正围绕以下维度展开竞争: 1. **目标用户**:谷歌聚焦技术团队,亚马逊和微软则更倾向于覆盖更广泛的业务场景。 2. **模型生态**:谷歌在整合自家Gemini的同时拥抱Claude,显示出模型多样化的战略。 3. **企业安全**:所有厂商都在强调安全能力,但谷歌通过用户分层来降低风险的做法颇具特色。 ## 潜在影响与挑战 **优势方面**,这一策略可能加速AI代理在企业内部的落地——技术团队能快速构建可靠代理,业务团队则通过标准化应用享受自动化便利。 **挑战也不容忽视**: - 技术团队可能面临学习曲线和资源压力。 - 业务与IT的协作效率将成为关键,如果沟通不畅,可能导致代理功能与业务需求脱节。 - 在模型选择上,企业需要权衡性能、成本与供应商锁定风险。 ## 小结 谷歌的Gemini Enterprise Agent Platform选择了一条差异化路径:**让专业的人做专业的事**。通过将构建权交给技术团队,谷歌试图在推动AI代理普及的同时,守住企业最关心的安全底线。这一策略能否成功,取决于其工具易用性、模型性能以及企业内部协作机制。随着Opus 4.7等新模型的加入,企业AI代理的战场正变得愈发多元和激烈。

TechCrunch1个月前原文

## 关键事件:CISA被排除在AI网络安全工具之外 根据Axios的报道,美国网络安全和基础设施安全局(CISA)未能获得Anthropic最新推出的**Mythos Preview**访问权限。这款AI模型被宣传为能够发现和修补安全漏洞的强大工具,目前已被美国商务部、国家安全局(NSA)等多个联邦机构采用。 ## 背景:CISA的角色与当前处境 CISA作为国土安全部下属机构,本应是美国网络安全信息协调的核心机构,负责向州和地方官员(包括选举和公共事业管理者)通报漏洞信息并协助应对攻击。然而,该机构近年来一直处于政治漩涡之中。 * **政治攻击**:特朗普政府和国会共和党人对CISA发起了多次政治攻击,特别是在该机构宣布2020年总统选举(特朗普输给拜登的那次)是“美国历史上最安全的一次”之后。 * **人事变动**:特朗普在其第一个任期内解雇了当时领导CISA的官员。 * **资源限制**:报道指出,除了此次未能获得Mythos访问权限外,CISA还面临人员编制和资金方面的限制。 ## 各方回应与现状 * **Anthropic的立场**:在一篇博客文章中,Anthropic表示“一直在与美国政府官员就Claude Mythos Preview及其攻防网络能力进行持续讨论”。一位不愿透露姓名的Anthropic官员告诉Axios,CISA是接受过情况通报的机构之一。不过,Anthropic拒绝就此事发表评论。 * **CISA的沉默**:CISA没有立即回应置评请求。 * **政府层面的谈判**:Axios上周报道称,特朗普政府一直在就扩大Mythos的访问权限进行谈判。 ## 潜在影响与行业观察 这一事件不仅仅是单一工具的分发问题,它释放出一个更强烈的信号:**CISA的运作仍未得到本届政府的优先重视**。在网络安全威胁日益复杂和频繁的今天,作为国家核心协调机构的CISA若无法获得最先进的AI辅助工具,可能会削弱其防御能力,从而**增加数字安全风险**。 这反映了AI技术在国家关键基础设施安全领域的应用,正不可避免地与政治动态交织在一起。工具的分配不仅关乎技术效能,也成为了政策倾向和机构优先级的体现。 ## 小结 Anthropic的Mythos Preview作为新兴的AI网络安全工具,其在美国联邦机构间的推广出现了明显的“遗漏”。核心网络安全协调机构CISA的缺席,结合其近年来的政治困境和资源限制,凸显了在技术快速部署背后,机构间协调与政治优先级可能存在的脱节,这为美国的整体网络防御态势带来了不确定性。

The Verge1个月前原文

Mozilla 近日发布了 Firefox 150 版本更新,这次更新不仅带来了多项实用功能增强,更关键的是修复了高达 **271 个安全漏洞**。值得注意的是,其中部分漏洞是由 Anthropic 的 **Claude Mythos Preview AI 模型**协助发现的,这再次凸显了 AI 在网络安全领域的应用价值。 ## 功能更新:更便捷的多任务与分享体验 Firefox 150 在用户体验方面进行了多项优化: * **分屏视图(Split View)增强**:用户现在可以在浏览网页时,右键点击任意链接,选择在分屏视图中打开,实现两个页面的并排对比。在分屏模式下,还支持搜索已打开的标签页和调换两个页面的显示顺序。这项功能旨在提升多任务处理效率,此前已在 Chrome 和 Microsoft Edge 等浏览器中提供。 * **标签页分享功能扩展**:理论上,新版本允许用户一次性分享多个标签页。操作方式是选中多个标签页后右键,选择“分享”命令,即可复制包含所有页面标题和 URL 的链接集合,方便在其他应用或设备上快速打开。不过,根据文章作者的实测,在当前的 150 版本中,右键多个标签页时并未出现“分享”命令,该功能可能存在发布初期的 Bug 或配置问题,Mozilla 已收到相关反馈。 此外,更新还涉及语言翻译和内置 PDF 编辑器等功能的改进。 ## 安全修复:数量惊人的漏洞修补 本次更新的重中之重是安全性。**271 个安全漏洞的修复**是本次版本迭代的核心成果。保持浏览器更新至最新版本是抵御网络威胁、保护个人数据安全的最基本且有效的措施之一。 ## AI 的贡献:Claude Mythos 参与漏洞发现 一个值得关注的细节是,Anthropic 的 **Claude Mythos Preview AI 模型**在此次漏洞发现过程中发挥了作用。这并非 AI 首次应用于代码审计和安全研究领域,但它标志着大型语言模型(LLM)在辅助识别复杂软件潜在安全风险方面的能力正得到实际验证和采用。AI 能够以远超人类的速度分析大量代码,识别出某些特定模式或潜在的脆弱点,从而帮助开发团队提前发现并修复问题,缩短漏洞的暴露窗口。 ## 行业观察:AI 赋能软件开发生命周期 Firefox 150 的这次更新,是 AI 技术深入渗透软件开发和网络安全维护流程的一个缩影。从自动化代码生成、测试用例编写,到如今的漏洞辅助发现与修复,AI 正在成为提升软件质量、加速迭代周期、强化安全防线的重要工具。对于 Mozilla 这样的开源项目而言,利用 AI 工具应对海量代码库的安全挑战,具有显著的效率和成本优势。 **小结**:Firefox 150 是一次兼顾功能迭代与安全加固的重要更新。用户应立即更新以获取最新的安全防护。同时,Claude Mythos 的参与也预示着,未来 AI 与人类开发者的协作将在软件安全领域变得更加普遍和深入。

ZDNet AI1个月前原文

在近日的 Google Cloud Next 大会上,谷歌宣布了一系列针对 Workspace 的更新,其中最引人注目的是将 **AI Overviews** 功能引入 Gmail。这一功能原本用于总结 Google 搜索结果,现在将扩展到工作场所的 Gmail 用户,旨在通过 AI 技术自动从多封邮件中提取信息,生成即时摘要,帮助用户快速获取关键信息。 ## 功能核心:自然语言提问与跨邮件摘要 **AI Overviews** 的核心能力在于允许用户使用自然语言在搜索框中提问,系统会从相关的多封邮件和对话中提取信息,生成简洁的答案,而无需用户逐一打开和阅读邮件。谷歌举例说明,该功能可用于查询业务相关话题,如绩效改进、项目里程碑、发票、演示文稿评论、行程细节等,提供直接的回答。 ## 默认设置与启用条件 如果企业启用了 **Gemini for Workspace** 在 Gmail 中,并且 Workspace Intelligence 访问 Gmail 的权限已开启,AI Overviews 将成为默认设置。此外,终端用户还需在 Gmail、Chat 和 Meet 中启用智能功能,以及 Google Workspace 智能功能。这一功能此前已面向消费者用户,通过 Google AI Pro 和 Ultra 订阅提供,现在将扩展到商业、企业和教育客户。 ## 适用产品范围 - **商业版**:Business Starter、Standard 和 Plus - **企业版**:Enterprise Starter、Standard 和 Plus - **消费者版**:Google AI Pro 和 Ultra - **其他版本**:Frontline Plus - **AI 附加组件**:Google AI Pro for Edu ## AI 在邮件管理中的趋势 尽管并非所有人都倾向于将 AI 作为获取答案的第一步,但 AI 在谷歌产品及其他网络服务中的普及正迅速成为常态。AI Overviews 的引入反映了谷歌在提升工作效率方面的持续努力,通过自动化处理邮件信息,减少用户的信息过载和时间消耗。 ## 潜在影响与行业背景 这一更新是谷歌 Workspace 智能化战略的一部分,旨在整合 AI 技术到日常办公工具中。随着 AI 能力的增强,类似功能可能在邮件客户端中成为标准配置,推动企业通信向更高效、智能化的方向发展。然而,用户隐私和数据安全仍是需要关注的问题,尤其是在处理敏感业务邮件时。 ## 小结 AI Overviews 的扩展标志着谷歌在 AI 驱动的工作场所工具上的进一步投入,为用户提供更便捷的邮件管理体验。随着功能的推广,它有望改变企业用户处理邮件信息的方式,但实际效果还需依赖用户采纳和反馈来验证。

TechCrunch1个月前原文

Google近日宣布,其AI会议笔记功能已从线上会议扩展至线下场景。这项由**Gemini**驱动的功能现在可以为线下会议、Zoom会议和Microsoft Teams会议生成摘要和转录文本,标志着Google在AI办公协作领域的又一重要布局。 ## 功能升级:从线上到线下 此前,这项AI笔记功能主要服务于Google Meet平台上的视频会议,而线下会议支持仅限于Alpha测试用户且仅限Android设备。如今,该功能已全面开放,用户无论使用移动应用还是桌面端,都可以在Google Meet主界面选择“**take notes for me**”开始录制。 值得注意的是,这项功能不仅适用于预定会议,也支持**即兴会议**——用户无需身处会议室或提前安排会议,即可随时启动AI笔记记录。 ## 跨平台兼容性 除了线下会议,Google还扩展了该功能的兼容范围,使其能够处理**Zoom**和**Microsoft Teams**的会议内容。这意味着用户即使不在Google Meet平台上开会,也能利用Gemini的AI能力自动生成会议摘要和行动项。 ## 技术实现与输出 当用户启动录制后,Gemini会实时分析会议内容,并在会议结束后自动生成一份包含**摘要**和**行动项**的Google文档。该文档会保存在启动录制用户的Google Drive中,方便后续查阅和分享。 Google的支持页面还提到一个实用细节:如果会议中有非现场参与者希望加入,用户可以“**将会议切换为常规视频通话**”,确保远程协作的无缝衔接。 ## 行业背景与意义 在AI办公协作工具竞争日益激烈的当下,Google此次功能升级具有多重意义: * **场景拓展**:将AI笔记从纯线上场景延伸至线下,覆盖了更广泛的会议类型,提升了工具的实用价值。 * **生态开放**:主动兼容竞争对手平台(Zoom、Teams),显示出Google试图以AI能力为核心,构建更开放的协作生态,而非仅仅固守自家平台。 * **用户体验优化**:支持即兴会议和灵活的会议模式切换,降低了使用门槛,更贴合实际办公中灵活、临时的沟通需求。 ## 潜在挑战与展望 尽管功能强大,但AI会议笔记的准确性、隐私安全以及不同平台间的数据整合仍是用户可能关心的问题。随着AI在办公场景的深入应用,如何平衡自动化与人工干预、确保信息处理的合规性,将是所有厂商需要持续面对的课题。 总体而言,Google此次更新进一步巩固了其在AI赋能办公领域的领先地位,也为混合办公时代提供了更智能的会议解决方案。

The Verge1个月前原文

在智能穿戴设备竞争日益激烈的今天,**Polar Street X** 凭借其独特的 **内置LED手电筒** 功能,以 **249.99美元** 的亲民价格,为市场带来了新的惊喜。这款手表不仅挑战了Garmin等传统巨头的地位,更重新定义了智能手表的实用边界。 ## 核心亮点:内置LED手电筒为何成为“杀手锏”? 智能手表的功能通常围绕健康监测、通知提醒和运动追踪展开,但Polar Street X却将 **实用性** 提升到了新高度。其内置的LED手电筒并非噱头,而是经过实际测试验证的日常利器。评测者Matthew Miller甚至表示,使用后“再也不会用没有内置手电筒的智能手表了”,这凸显了该功能对用户体验的颠覆性影响。 在黑暗环境中寻找钥匙、夜间跑步照明、紧急情况下的光源——这些看似简单的场景,恰恰是传统智能手表忽略的痛点。Polar Street X通过集成LED,将手表从“被动通知设备”转变为“主动工具”,大大扩展了使用场景。 ## 产品规格与性能权衡 除了手电筒,Polar Street X在其他方面也表现均衡: - **显示效果**:配备鲜艳的AMOLED触摸屏,确保户外可视性。 - **生态系统**:支持广泛的Polar Flow生态系统,便于数据同步与分析。 - **耐用性**:具备50米防水和MIL-STD-810H军用级评级,适合户外运动。 然而,产品也存在一些妥协: - **材质**:采用塑料表壳和表圈,可能影响高端感。 - **GPS**:仅支持单频GPS,定位精度可能不如双频型号。 - **健康功能**:缺少心电图(ECG)和血氧监测,在健康追踪上略显不足。 ## AI穿戴设备市场的差异化竞争 当前,智能手表市场由Apple Watch、Garmin、Fitbit等品牌主导,功能同质化严重。Polar Street X的推出,反映了AI科技行业的一个趋势:**通过细分功能创新实现差异化**。在AI算法优化健康数据、电池续航提升等常规升级之外,像内置手电筒这样的“小而美”设计,反而能抓住特定用户需求。 从技术角度看,集成LED无需复杂AI模型,但体现了产品设计中的“人性化思维”——这正是AI时代硬件竞争的关键。随着穿戴设备普及,用户不再满足于基础功能,而是寻求更贴合实际生活的解决方案。Polar Street X以低成本实现高实用价值,可能启发更多厂商关注类似创新。 ## 总结:实用主义下的智能穿戴新方向 Polar Street X并非全能冠军,但它成功证明:在智能手表红海中,**聚焦单一痛点并做到极致**,同样能赢得用户青睐。对于追求性价比和实用性的消费者来说,这款产品提供了Garmin等高端品牌之外的优质选择。 未来,如果Polar能在此基础上迭代,加入更先进的健康传感器或改进材质,其市场竞争力有望进一步提升。无论如何,这款手表已经为行业树立了一个新标杆:智能穿戴设备的价值,不仅在于数据追踪,更在于解决日常生活中的真实问题。

ZDNet AI1个月前原文

## 一句话总结 **Agent Vault** 是一个开源的 HTTP 凭证代理与保险库,专门为 AI 代理设计。它通过代理模式在网络层注入凭证,**从不将凭证返回给代理本身**,从而从根本上消除凭证泄露风险。 ## 为什么需要 Agent Vault? 传统密钥管理工具(如 Vault、AWS Secrets Manager)的工作方式是:应用请求凭证,工具将其返回给应用,应用再使用凭证调用目标 API。这种“检索-使用”模式在确定性系统中运行良好,但面对 AI 代理时却存在致命缺陷。 AI 代理是非确定性的,它们可能被提示注入攻击欺骗,从而将持有的凭证泄露给攻击者。一旦凭证落入敌手,攻击者就能直接访问敏感 API。Agent Vault 的创造者 Infisical 团队认为:**代理不应该拥有凭证**。 ## Agent Vault 的工作原理 Agent Vault 采用**代理访问**而非凭证检索: - 代理获得一个**限定作用域的会话**和一个本地 `HTTPS_PROXY` 地址。 - 代理正常调用目标 API,所有 HTTP 请求都经过 Agent Vault 的本地代理。 - Agent Vault 在网络层自动注入正确的凭证(如 API Key、Bearer Token 等)。 - **凭证永远不会返回给代理**,代理只负责发送请求和接收响应。 这种方式使得即使代理被攻破,攻击者也无法窃取凭证——因为它们根本就不在代理手里。 ## 核心特性 - **支持任何 HTTP 代理**:无论是自定义 Python/TypeScript 代理、沙箱进程,还是 Claude Code、Cursor、Codex 等编码代理,只要支持 HTTP 代理协议即可。 - **加密存储**:凭证使用 AES-256-GCM 加密,数据加密密钥(DEK)随机生成。可选的主密码通过 Argon2id 派生密钥来保护 DEK,轮换主密码无需重新加密所有凭证。也支持无密码模式用于 PaaS 部署。 - **请求日志**:每个代理请求都会被记录,包括方法、主机、路径、状态码、延迟和所用凭证的键名。**不记录请求体、请求头和查询字符串**,日志保留期可按需配置。 ## 安装与使用 Agent Vault 提供多种安装方式: - **脚本安装**(macOS/Linux):`curl -fsSL https://get.agent-vault.dev | sh && agent-vault server -d` - **Docker**:`docker run -it -p 14321:14321 -p 14322:14322 -v agent-vault-data:/data infisical/agent-vault` - **从源码构建**:需要 Go 1.25+ 和 Node.js 22+,`git clone` 后 `make build` 即可。 启动后,Agent Vault 会运行一个本地代理服务器,默认监听端口 14321(API)和 14322(代理)。 ## 行业背景与意义 随着 AI 代理在代码编写、自动化运维、客户服务等场景中的广泛使用,**凭证安全**成为新的挑战。传统安全模型假设应用是可信的,但 AI 代理的不可预测性打破了这一假设。Agent Vault 的代理注入模式提供了一种更安全的替代方案,类似于零信任架构中的“永不信任,始终验证”原则。 Infisical 本身是一家专注于开源密钥管理的公司,Agent Vault 的推出进一步完善了其产品线。对于使用 Claude Code、Cursor 等编码代理的开发者来说,Agent Vault 可以显著降低 API 密钥泄露的风险。 ## 总结 Agent Vault 是一个设计精巧的开源工具,它通过改变凭证交付模型,**让代理永远接触不到原始凭证**,从而从根源上防范凭证泄露。对于任何将 AI 代理集成到工作流中的团队,这都是一项值得关注的安全增强方案。 项目地址:https://github.com/Infisical/agent-vault

Hacker News1561个月前原文
用业余无线电复活Teletext:重温1980年代的顶尖科技

在AI技术日新月异的今天,一项复古的数字通信技术——Teletext(图文电视)正通过业余无线电爱好者之手重获新生。IEEE Spectrum的特刊编辑Stephen Cass最近分享了一个引人注目的项目:利用计算机声卡生成和接收数字音调,通过业余无线电交换Teletext页面,将1980年代的经典技术融入现代通信场景。 ## 什么是Teletext? Teletext是上世纪70年代末至80年代广泛应用的数字信息广播系统,通过电视信号的空闲行传输文本和简单图形信息。用户可以通过专用解码器或电视内置功能,接收新闻、天气、股票等实时信息。这项技术在当时代表了数字通信的前沿,但随着互联网的普及逐渐淡出主流视野。 ## 技术复活:声卡与业余无线电的结合 这个项目的核心创新在于利用现代计算机的声卡作为数字调制解调器。声卡能够生成和解析特定的音频频率,这些频率对应Teletext的数字信号。通过业余无线电设备,这些音频信号可以在空中传输,实现点对点的数据交换。 **关键步骤包括:** - 使用软件将Teletext页面编码为音频信号 - 通过声卡输出到业余无线电发射机 - 接收端通过无线电接收信号并输入声卡 - 软件解码音频,还原Teletext页面 这种方法绕过了传统的专用硬件,降低了技术门槛,让更多爱好者能够参与实验。 ## 为什么在AI时代关注复古技术? 在AI模型参数动辄千亿、计算资源需求巨大的背景下,这个项目提醒我们:**通信技术的本质是可靠、低功耗的信息传递**。Teletext作为一种低带宽、高鲁棒性的数字广播系统,在特定场景下仍有其价值: - **应急通信**:在自然灾害导致互联网中断时,业余无线电结合Teletext可以提供基本的信息广播能力 - **教育价值**:帮助学生理解数字调制、纠错编码等通信原理 - **文化遗产保护**:保存和传承历史上的技术标准 ## 与AI技术的潜在交集 虽然这个项目本身不涉及AI,但它展示了**边缘计算**和**低功耗通信**的另一种可能性。在AIoT(人工智能物联网)领域,类似的低带宽通信技术可以与轻量级AI模型结合,用于传感器数据收集或远程控制。例如,在偏远地区的环境监测中,Teletext式的数据传输可能比依赖高速网络更实际。 ## 技术挑战与未来展望 当前实现仍面临一些限制:传输速率较低、抗干扰能力依赖无线电环境。但随着软件定义无线电(SDR)技术的发展,未来或许可以开发更高效的调制方案,甚至结合简单的AI算法进行信号优化。 这个项目不仅是技术怀旧,更是对**通信多样性**的探索。在5G、卫星互联网主导的今天,保留和发展替代性通信手段,有助于构建更具韧性的全球网络。 ## 小结 Stephen Cass和James Provost的Teletext复活项目,巧妙地将1980年代的数字广播技术与现代计算机硬件结合,为业余无线电社区注入了新活力。它提醒我们:技术进步并非总是线性替代,有时复古创新也能开辟独特应用场景。在AI高速发展的时代,这类低技术门槛、高教育价值的项目,同样值得关注和鼓励。

IEEE AI1个月前原文

## 简介 Hi HN,我们构建了 **Broccoli**,这是一个开源工具,旨在将编码任务从 **Linear** 中提取出来,在隔离的云端沙盒中运行,并自动创建拉取请求(PR)供人工审查。 ## 背景与动机 Broccoli 的诞生源于一个小团队的痛点。团队的主营业务是提供语音数据,但在使用编码代理时频繁遇到问题:每次切换上下文都需要重新设置环境,Agent 状态难以持久化,且无法安全地处理敏感数据。为了解决这些问题,他们开发了 Broccoli。 ## 核心功能 - **任务集成**:直接从 Linear 获取编码任务,无需手动导入。 - **云端沙盒**:在隔离的云环境中运行代码,确保安全性与一致性。 - **自动化 PR**:任务完成后自动生成 PR,等待人工审核与合并。 ## 技术亮点 Broccoli 是一个 **开源项目**,代码托管在 GitHub 上。它利用云端基础设施提供可复现的运行环境,避免了本地环境差异带来的问题。同时,沙盒隔离机制保障了数据安全,特别适合处理敏感信息。 ## 适用场景 - **团队协作**:适合使用 Linear 进行项目管理的开发团队。 - **自动化工作流**:减少手动操作,提升从任务到代码提交的效率。 - **安全敏感环境**:需要隔离执行环境的场景,如处理客户数据。 ## 总结 Broccoli 通过将编码代理与云端沙盒结合,解决了 Agent 状态管理和环境一致性的难题。对于希望自动化编码流程的小团队而言,这是一个值得尝试的开源方案。 --- *项目地址:GitHub 搜索 Broccoli 即可找到。*

Hacker News701个月前原文
AI工具助力朝鲜黑客“菜鸟”窃取数百万美元

网络安全公司Expel近日披露,一个名为HexagonalRodent的朝鲜黑客组织,利用AI工具大幅提升了其网络攻击能力,在短短三个月内窃取了高达1200万美元的加密货币。这一案例揭示了AI技术如何正在降低网络犯罪的门槛,让技术能力平平的攻击者也能发动大规模、高收益的攻击。 ## AI赋能下的“菜鸟”黑客 根据安全研究员Marcus Hutchins的发现,HexagonalRodent组织的成员本身**并不具备编写代码或搭建基础设施的技能**。然而,他们通过使用基于美国公司的AI工具(包括OpenAI、Cursor和Anima等),实现了从编写恶意软件到构建钓鱼网站的全流程自动化。这种“vibe coding”(氛围编码)方式,使得他们能够快速生成攻击所需的各类组件。 Hutchins指出,此案例最引人注目的并非其技术有多么尖端,而在于**AI工具如何让一个看似技术粗糙的团队,成功实施了一场为朝鲜国家利益服务的、利润丰厚的盗窃狂潮**。 ## 攻击手法:从虚假招聘到恶意软件 HexagonalRodent的攻击活动主要针对小型加密货币发行、NFT创作和Web3项目的开发者。其攻击链条包括: * **虚假招聘诱饵**:黑客冒充科技公司,向目标开发者发送虚假的工作邀请。 * **AI构建的钓鱼网站**:为了增加可信度,他们甚至利用AI网页设计工具,为这些虚构的公司创建了完整的官方网站。 * **恶意编码任务**:最终,受害者会被要求下载并完成一个“编码测试任务”,而这个任务实际上就是**窃取凭证的恶意软件**。 通过这套组合拳,该组织成功在超过2000台计算机上安装了恶意软件,并最终窃取了巨额资产。 ## 行业警示:AI正在重塑网络威胁格局 长期以来,关于AI黑客工具的担忧多集中于未来可能出现的高度自动化、能够自主挖掘软件漏洞的“超级入侵能力”。但HexagonalRodent的案例表明,AI在当下扮演着一个更普遍、但也同样令人担忧的角色:**它正在帮助能力平庸的黑客“升级”,使其能够发动广泛而有效的恶意软件活动**。 这标志着网络威胁格局的一个重要转变:攻击的门槛正在被AI技术显著拉低。过去需要深厚技术功底才能完成的攻击准备阶段,现在可能通过简单的AI指令就能实现。这不仅扩大了潜在攻击者的范围,也使得防御方需要应对更多样化、更频繁的自动化攻击尝试。 ## 小结 HexagonalRodent的行动是一个清晰的信号,表明AI工具已不再是高级持续性威胁(APT)组织的专属。它们正被用于提升普通甚至低技能攻击者的效率与破坏力。对于企业和安全从业者而言,这意味着防御策略需要更新,不仅要防范尖端攻击,也要警惕由AI辅助发起的、规模庞大但技术门槛相对较低的“平民化”攻击浪潮。

WIRED AI1个月前原文

亚马逊云科技近日宣布,在**Amazon Bedrock**平台上推出了一项名为“企业级记忆”的新功能,该功能由**Amazon Neptune**图数据库和**Mem0**内存管理技术共同驱动。这项创新旨在为AI智能体提供持久、企业专属的上下文理解能力,使其能够在多次交互中学习、适应并做出智能响应。全球领先的网络安全公司**TrendMicro**(趋势科技)已成为该功能的早期采用者,将其应用于其客户服务聊天机器人“Trend’s Companion”中,以提升对话体验。 ### 企业AI的“记忆”难题 对于企业级AI应用,尤其是面向客户的聊天机器人,一个核心挑战是如何让AI“记住”并理解组织特有的背景信息。传统的会话模型往往缺乏持久记忆,每次对话都像是“从零开始”,无法利用过往交互中积累的上下文或企业内部的结构化知识。这导致回答可能缺乏针对性、连续性,难以提供真正个性化的服务。TrendMicro在开发其“Trend’s Companion”聊天机器人时,就明确设定了目标:不仅要保留对话历史以保证连续性,还要能大规模引用公司特有的知识库,并确保这些“记忆”的准确性、安全性和实时性。 ### 解决方案架构:三驾马车协同 TrendMicro与AWS团队(包括AWS生成式AI创新中心)合作,设计了一套整合多款AWS服务的解决方案,核心正是“企业级记忆”功能。其架构可以概括为三个关键组件的协同工作: 1. **Amazon Neptune(知识图谱存储)**:作为企业专属知识的核心载体。Neptune是一个高性能的图数据库,用于存储代表组织关系、流程和数据的**知识图谱**。这种结构化存储方式使得AI能够进行精确、高效的检索,理解实体间的复杂关联。 2. **Mem0(内存管理)**:负责管理AI智能体的“记忆”生命周期。它区分了**短期记忆**(用于维护当前对话的即时上下文)和**长期记忆**(用于跨会话的持久性知识存储)。Mem0确保相关信息能在需要时被快速调用和更新。 3. **Amazon Bedrock(智能体编排与推理)**:作为整个AI工作流的“大脑”。Bedrock平台负责协调智能体的运作,无缝集成Neptune和Mem0。在推理过程中,它能够从Neptune检索结构化的公司知识,并结合Mem0中的会话记忆,最终生成贴合上下文、内容丰富的回答。 ### 工作流程:从信息到智能响应 该系统的运作始于用户输入。首先,通过Bedrock平台上的**Claude模型**对用户消息进行处理,提取其中的实体、关系以及可能转化为“记忆”的信息。接着,利用**Amazon Bedrock Titan Text Embed**模型将这些信息转化为向量嵌入(embeddings)。这些嵌入向量随后被用于搜索,以关联起存储在Neptune中的相关知识图谱节点和Mem0中的相关记忆片段。最终,结合检索到的所有上下文信息,AI智能体生成最终回复。这套流程使得聊天机器人不仅能“回忆”起相关的历史对话,还能“理解”并运用企业特有的结构化知识,从而显著提升回答的相关性和用户体验。 ### 行业意义与展望 “企业级记忆”功能的推出,标志着生成式AI在企业应用场景中向更深层次迈出了一步。它解决了AI在商业环境中缺乏“组织智商”和“持续学习能力”的痛点。对于像TrendMicro这样的企业而言,这意味着其客户服务AI能够更深入地理解客户所在企业的环境、历史问题和特定需求,提供真正定制化的支持。 从更广泛的AI行业背景看,这反映了当前大模型应用的一个关键趋势:**从通用能力向垂直化、私有化、具备持续学习能力的智能体演进**。单纯依赖大型语言模型(LLM)的零样本或少量样本提示已不足以满足复杂的企业需求。未来,结合知识图谱、向量数据库、记忆管理等技术的**复合型AI架构**将成为企业部署AI的主流选择,以确保安全性、可控性和业务价值的深度绑定。亚马逊Bedrock此次整合Neptune与Mem0,正是为构建此类下一代企业AI应用提供了一个强大的托管平台和参考范例。

AWS ML1个月前原文

## Meta内部AI训练新举措引发争议 据路透社报道,Meta公司正在美国员工的电脑上安装一款名为**“模型能力计划”(Model Capability Initiative,简称MCI)**的内部工具。该工具会在工作相关的应用和网站上运行,记录员工的**鼠标移动、点击、键盘输入以及偶尔的屏幕截图**。这些数据将被用于训练Meta的AI模型,使其能够更自然地模仿人类与计算机的交互方式,最终目标是实现工作任务的自动化。 Meta发言人Tracy Clayton在给The Verge的声明中解释道:“如果我们正在构建帮助人们使用计算机完成日常任务的智能体,我们的模型就需要人们实际使用计算机的真实示例——比如鼠标移动、点击按钮和导航下拉菜单。为此,我们正在启动一个内部工具,它将在特定应用程序上捕获这类输入,以帮助我们训练模型。我们已设置了保护措施来保护敏感内容,且这些数据不会用于任何其他目的。” ### 技术目标与战略背景 这一举措与Meta的**“智能体转型加速器”(Agent Transformation Accelerator,ATA)**计划紧密相关。Meta首席技术官Andrew Bosworth在一份内部备忘录中阐述了公司的愿景:“我们正在构建的未来愿景是,主要由我们的智能体来完成工作,而我们的角色是指挥、审查并帮助它们改进。”MCI正是为这一宏大目标收集关键训练数据的手段。 其技术逻辑在于,要让人工智能真正理解并替代复杂的办公操作(如填写表单、操作软件界面),仅靠公开网络数据或模拟数据是远远不够的。直接从真实工作场景中采集的、包含细微操作习惯的交互数据,被认为是提升AI“实操”能力的宝贵资源。 ### 内部反应与隐私担忧 然而,此举在Meta内部引发了**“强烈的内部反弹”**。据The Verge记者Alex Heath的消息来源透露,有员工在相关公告下直接回复:“这让我感到非常不安。我们如何选择退出?”而Bosworth的回复是:“**没有选择退出的选项。**” 尽管公司强调数据“**不会用于绩效评估**”,并有保护敏感内容的措施,但大规模、持续性的行为监控依然触及了职场隐私的敏感神经。员工担忧的焦点在于: - **数据边界模糊**:如何确保“工作相关”应用的界定清晰,防止私人通信或非工作活动被意外捕获? - **心理影响**:在持续监控下工作,是否会影响员工的创造力和自主性? - **未来用途的不确定性**:虽然目前声明仅用于AI训练,但数据一旦被收集,未来的使用政策是否会发生变化? ### AI行业的数据采集趋势与伦理挑战 Meta的MCI计划并非孤例,它反映了当前AI行业在追求更强大、更拟人化智能体过程中,对**高质量、特定领域行为数据**日益增长的需求。随着大语言模型在文本生成上趋于成熟,下一阶段的竞争焦点正转向能够理解并执行具体数字任务的“AI智能体”。 然而,这种转向也带来了新的伦理与合规挑战: - **知情同意与透明度**:企业如何在推动技术发展的同时,确保员工对数据采集的范围、方式和用途有充分且清晰的知情权? - **数据安全**:涉及键盘输入和屏幕截图的数据极其敏感,如何建立牢不可破的技术和管理屏障,防止数据泄露或被滥用? - **行业规范缺失**:目前对于使用员工行为数据训练AI,尚缺乏广泛认可的行业准则或法律框架。 ## 小结 Meta的“模型能力计划”是一次大胆的技术实验,旨在为其AI智能体获取稀缺的“第一人称”操作数据,以加速实现工作自动化的愿景。这凸显了AI发展从“能说”到“能做”的关键转型。然而,其强制推行的方式和涉及深度监控的性质,已在公司内部激起巨大波澜,并将职场监控与AI伦理的议题推向了风口浪尖。这一事件很可能成为行业讨论数据采集边界、员工权利与AI发展平衡的一个重要案例。未来,如何在不侵犯个人隐私与尊严的前提下,合法、合规、合情地获取必要的训练数据,将是所有致力于开发实用型AI的公司必须面对的课题。

The Verge1个月前原文

## OpenAI与印孚瑟斯达成战略合作 人工智能领域的领导者**OpenAI**与印度IT巨头**印孚瑟斯(Infosys)**近日宣布建立合作伙伴关系,将OpenAI的AI工具(包括代码助手**Codex**)集成到印孚瑟斯的**Topaz AI平台**中。这一合作标志着AI技术在企业级应用中的又一重要进展,旨在帮助全球企业从AI实验阶段迈向大规模部署。 ### 合作的核心内容与目标 根据双方披露的信息,此次合作将重点聚焦于三个关键领域: - **软件工程现代化**:通过Codex等工具提升软件开发效率和质量。 - **遗留系统现代化**:帮助客户更新老旧系统,适应现代技术栈。 - **DevOps自动化**:优化工作流程,实现更高效的运维管理。 印孚瑟斯表示,这一集成将协助其客户实现软件开发流程的现代化、工作流的自动化,并规模化部署AI系统。OpenAI则通过印孚瑟斯覆盖**60多个国家**的全球客户网络和交付能力,获得了进入大型企业市场的重要渠道。 ### 行业背景与市场动因 这一合作并非孤立事件,而是当前AI行业与全球IT服务提供商联手趋势的体现。此前,OpenAI已与**HCLTech**建立合作,而印孚瑟斯也与**Anthropic**达成了类似协议。 印度IT服务公司正面临双重压力:一方面,客户支出放缓;另一方面,生成式AI的快速发展可能自动化部分传统外包工作。印孚瑟斯股价今年已下跌**超过22%**,部分原因在于投资者对AI可能冲击其核心业务的担忧,以及宏观经济动荡(如美伊冲突)的影响。 ### 双方的战略考量 **对OpenAI而言**: - 借助印孚瑟斯的庞大企业客户群,加速**Codex**等工具的普及。 - 通过**Codex Labs**等企业拓展计划,构建更广泛的分销网络。该计划已吸引包括埃森哲、凯捷、CGI、高知特、印孚瑟斯、普华永道和塔塔咨询在内的多家合作伙伴。 - Codex目前拥有**超过400万周活跃用户**,企业级合作有望进一步扩大其影响力。 **对印孚瑟斯而言**: - 强化其AI业务布局,应对市场变化。公司此前透露,AI相关服务在去年12月季度创造了**250亿卢比(约2.67亿美元)**的收入,约占其总收入的**5.5%**。 - 通过整合先进AI工具,提升服务竞争力,帮助客户实现数字化转型。 ### 未来展望与行业影响 此次合作是OpenAI扩大企业市场影响力的关键一步,也是印孚瑟斯加速AI战略落地的体现。随着AI技术日益成熟,IT服务商与AI公司的结合将成为推动技术落地的重要模式,帮助企业克服从实验到生产的鸿沟。 然而,这一趋势也引发了对传统IT外包业务模式的重新思考——AI自动化是否会取代部分人力工作?如何平衡效率提升与就业影响?这些问题仍需行业持续探索。 总体来看,OpenAI与印孚瑟斯的联手,不仅是一次技术整合,更是AI生态与企业服务深度融合的缩影,预示着未来更多跨领域合作的可能。

TechCrunch1个月前原文