SheepNav

AI 资讯

每日聚合最新人工智能动态

## 简介 在AI编码Agent工具日益复杂的今天,一个名为**Pu.sh**的开源项目反其道而行之——仅用**400行Shell脚本**就实现了一个完整的编码Agent框架。该项目由开发者创造,最初只是对`pi-autoresearch`的尝试,却意外地演变成一个轻量级、可交互的Agent工具。 ## 核心特性 Pu.sh的核心理念是**极简与可移植**。它不依赖任何重量级运行时,如npm、pip或Docker,只需系统中预装的`curl`、`awk`和一个API密钥即可运行。用户可以通过一行命令快速启动: ```bash curl -sL pu.dev/pu.sh -o pu.sh && chmod +x pu.sh ./pu.sh ``` 这种设计使其非常适合在资源受限或需要快速部署的场景中使用。开发者称其为“一个足够小巧、能装进口袋的‘垃圾炮’”,强调其便携性和即用性。 ## 发展历程 项目最初的第一版只有**6KB**的Shell代码,虽然能完成一次性任务,但无法进行交互式使用。开发者惊讶于其基本功能的有效性,随后在**不引入任何新依赖**的自我约束下,逐步添加功能,最终将代码量控制在400行左右。这一过程体现了Shell脚本的灵活性和在特定场景下的强大表现力。 ## 行业背景与意义 当前AI Agent领域,主流框架如LangChain、AutoGPT等往往依赖复杂的Python生态或容器化部署,虽然功能强大,但入门门槛较高。Pu.sh的出现提供了一种**轻量级替代方案**,尤其适合以下场景: - **快速原型验证**:无需安装任何包管理器,即刻测试Agent能力。 - **边缘设备或最小化环境**:如嵌入式系统、CI/CD流水线或临时服务器。 - **教育演示**:用最少的代码展示Agent工作流程,帮助理解核心原理。 当然,Shell脚本的局限性也显而易见:缺乏高级数据结构和类型安全,复杂逻辑较难维护。但Pu.sh的定位并非替代重型框架,而是在特定场景下提供一种“够用”且“极简”的选择。 ## 使用与展望 用户只需将脚本下载并赋予执行权限,即可开始与Agent交互。项目的口号“no npm · no pip · no docker”直击当前开发者对复杂依赖管理的痛点。未来,随着Shell生态的演进和项目社区的贡献,Pu.sh或许能成为Agent工具链中一个独特而实用的成员。 对于追求极简和可移植性的开发者来说,Pu.sh无疑是一个值得关注的项目。

Hacker News921个月前原文

亚马逊已正式确认,其年度夏季Prime Day大促活动将从传统的7月提前至2026年6月举行。这一调整打破了多年来7月举办的惯例,标志着亚马逊电商策略的重大转向。 ## 时间线变动 根据亚马逊官方公告,Prime Day将在6月回归,但具体日期尚未公布。此前,彭博社等媒体已报道相关传闻,如今得到证实。此次提前旨在抢占夏季消费先机,避开7月其他零售商促销活动的竞争。 ## 对消费者的影响 - **更早的优惠**:消费者将比往年更早享受到大幅折扣,尤其是在电子产品、家居用品和时尚品类。 - **购物规划调整**:以往在7月集中购物的习惯需要提前至6月,建议用户关注亚马逊官方通知,以便第一时间抢购。 - **会员福利**:Prime Day仅限Prime会员参与,非会员可考虑订阅服务以获取入场资格。 ## 行业背景 亚马逊选择6月举办Prime Day,可能基于以下原因: 1. **避开7月促销潮**:7月有美国独立日促销,且其他零售商(如沃尔玛、Target)也会推出类似活动,提前举办可减少竞争。 2. **夏季消费旺季**:6月是夏季开始,消费者对空调、户外用品等需求上升,折扣能有效刺激购买。 3. **供应链优化**:提前大促有助于亚马逊分散物流压力,避免7月高峰期的配送拥堵。 ## 后续关注 目前,亚马逊尚未公布具体日期和优惠细节。预计未来几周将有更多信息释放,包括热门产品预告、独家折扣和提前抢购资格。建议消费者订阅亚马逊通知,或关注ZDNET等科技媒体的后续报道。 **小结**:Prime Day的提前是亚马逊应对市场竞争和消费趋势的重要举措。对于消费者而言,这意味着更早的购物机会和潜在的价格优势。保持关注,准备在6月开启购物狂欢。

ZDNet AI1个月前原文

法律AI领域的竞争正在升温。瑞典初创公司 **Legora** 在完成 **5.5亿美元D轮融资** 后仅一个月,又获得了 **5000万美元的D轮扩展融资**,投资方包括英伟达的企业风投部门 NVentures、Atlassian 等。这使得 Legora 的估值达到 **56亿美元**,而其主要竞争对手、美国公司 Harvey 的估值为 **110亿美元**。Legora 的年度经常性收入(ARR)已突破 **1亿美元**,平台上线仅18个月,就被 **1000多家律所** 和内部法务团队采用,覆盖50个市场。Harvey 则声称拥有 **1300家机构客户**,覆盖 **10万名律师**,包括 Hengeler Mueller、Latham & Watkins 等全球律所,以及 T-Mobile、Bridgewater 等企业的法务部门。两家公司都在积极拓展对方的本土市场:Legora 在美国开设了多个办公室,而 Harvey 也在向欧洲扩张。这场法律AI领域的“双雄对决”,正在重塑法律服务的未来。 ## 资本与客户的较量 Legora 和 Harvey 的融资规模和客户基础均显示出法律AI市场的巨大潜力。Legora 的投资方包括 NVentures、Atlassian、Andreessen Horowitz、Coatue 等,而 Harvey 则获得了 Sequoia、Kleiner Perkins 等机构的支持。Legora 的客户包括 Bird & Bird、Cleary Gottlieb、Linklaters 等顶级律所;Harvey 则拥有 Hengeler Mueller、Latham & Watkins 等知名客户。两家公司均宣称其AI平台能显著提升律师的工作效率,从文档审阅到法律研究,覆盖多个应用场景。 ## 全球化布局与竞争策略 Legora 将美国视为关键扩张市场,已在多地设立办公室;Harvey 则加速欧洲布局。双方不仅在客户争夺上寸步不让,还通过广告宣传展开舆论战。这种“双向渗透”策略,使得竞争愈发激烈。随着AI技术在法律行业的渗透率提升,Legora 和 Harvey 的竞争将决定未来法律AI市场的格局。

TechCrunch1个月前原文

大语言模型(LLM)的输出常存在不准确、不合规或表述生硬等问题,而**强化微调(RFT)** 正成为解决这些痛点的首选方案。其中,**以LLM为裁判的强化学习(RLAIF)** 凭借其灵活性和可解释性,正逐步取代传统的硬编码奖励函数。本文基于亚马逊Nova模型实践,深入解析RLAIF的实现路径与关键步骤。 ## 为什么选择LLM-as-a-judge? 传统的强化微调依赖**可验证奖励(RLVR)**,即通过代码规则(如子串匹配)打分,虽然直接但难以捕捉语义细微差别。而**LLM-as-a-judge**(也称RLAIF)则让一个独立的语言模型作为裁判,从**正确性、语气、安全性、相关性**等多个维度对候选输出进行综合评估。这种方法的优势在于: - **灵活性高**:无需为每个任务重新训练裁判模型,可跨领域复用。 - **可解释性强**:裁判会给出具体理由(如“回答A引用了同行评审研究”),帮助开发者快速定位失败模式。 - **减少隐藏偏差**:静态规则容易忽略上下文,而LLM裁判能感知领域特定细节。 ## 实施LLM-as-a-judge的六个关键步骤 ### 1. 选择裁判架构 裁判架构分为两类: - **基于评分标准(Rubric-based)**:按预设维度(如完整性、安全性)逐项打分,最后汇总总分。适合有明确评价指标的任务。 - **基于偏好(Preference-based)**:直接比较两个回答,输出“A优于B”的判断。适合主观性较强的场景,如创意写作。 ### 2. 设计评估提示词 裁判模型的提示词需清晰定义评价维度、评分规则和输出格式。例如,对于客服场景,可要求裁判从“问题解决率”“礼貌程度”“信息准确度”三个维度打分,并输出0-5分。 ### 3. 构建高质量参考数据 虽然RLAIF减少了人工标注需求,但仍需少量人类标注数据作为校准基准,确保裁判评分与人类判断一致。通常需要数百到数千条样本。 ### 4. 训练或微调裁判模型 如果使用通用裁判(如GPT-4),可直接调用API;若需领域定制,可在开源模型(如Llama、Amazon Nova)基础上微调,使其更熟悉特定术语和规范。 ### 5. 迭代优化奖励信号 将裁判评分输入强化学习算法(如PPO),更新主模型参数。关键是要监控奖励信号的稳定性,避免裁判打分出现“模式坍塌”——即一直给高分或低分。 ### 6. 评估与对齐验证 最终需要对比RLAIF微调前后的模型输出,通过人工评估或自动化指标(如BLEU、ROUGE)验证对齐效果。同时检查裁判是否引入新偏见,例如偏爱较长回答或特定措辞。 ## 实践案例:Amazon Nova模型中的RLAIF 亚马逊Nova团队在内部测试中发现,使用LLM-as-a-judge进行强化微调后,模型在**事实准确性**和**安全性**上提升了约30%,同时减少了“幻觉”输出。关键在于裁判模型本身需要与主模型同源或经过校准,否则可能放大偏差。 ## 小结 RLAIF通过“以模型评模型”的方式,大幅降低了强化微调的人工成本,同时保留了多维评估的细腻度。尽管实施步骤较多,但每一步都有成熟工具链支持(如LangChain、RLHF库)。对于追求模型对齐质量且预算有限的团队,这无疑是当前最务实的路径之一。

AWS ML1个月前原文
Meta 终止与肯尼亚数据标注公司合作,此前员工曝目睹雷朋 Meta 用户私密视频

Meta 近日终止了与肯尼亚数据标注公司 Sama 的合同,约 1108 名工人受影响。据 BBC 报道,此举发生在 Sama 员工向媒体曝光他们曾审核到雷朋 Meta 智能眼镜拍摄的用户私密视频(如更衣、如厕、性行为)后不到两个月。Meta 称终止合作是因为 Sama“未达到我们的标准”,但 Sama 否认收到任何不达标通知,并表示始终满足运营、安全和质量要求。这一事件再次引发对科技公司数据标注工作环境和用户隐私保护的关注。

Ars Technica1个月前原文
AI助力科学家尝试将遗传密码从20种氨基酸削减至19种

遗传密码是生命的基础,几乎所有生物都使用相同的20种氨基酸构建蛋白质。但科学家们一直好奇,更早期的生命是否只用了更少的氨基酸。近日,哥伦比亚大学和哈佛大学的研究团队借助AI工具,成功改造了核糖体的一部分,使其能够在不依赖异亮氨酸的情况下正常工作——这标志着人类首次尝试从遗传密码中移除一种氨基酸。 ### 为什么削减氨基酸? 大多数合成生物学工作致力于扩展遗传密码,例如引入非天然氨基酸以创造新功能。但本研究反其道而行之,试图减少氨基酸种类。研究动机源于对生命起源的探索:在最后一个共同祖先之前,生物体可能尝试过多种遗传密码,并使用蛋白质和催化RNA的混合体来运行代谢。虽然催化RNA已被广泛研究,但我们对减少氨基酸后的蛋白质化学性质知之甚少。AI工具的成熟使重新设计蛋白质以使用更少氨基酸变得比几年前现实得多。 ### 选择异亮氨酸的理由 异亮氨酸是三种高度相似的氨基酸之一(另两种是亮氨酸和缬氨酸)。它们都具有由碳和氢组成的支链结构,疏水性强,常位于蛋白质内部以避开水环境。因此,从逻辑上推断,移除其中之一是合理的。研究人员还通过分析大肠杆菌基因组发现,在相关物种的蛋白质中,异亮氨酸是最常被其他氨基酸替换的,这进一步支持了选择。 ### 研究成果与意义 团队运用AI工具重新设计了核糖体中的一段关键蛋白区域,使其不再需要异亮氨酸。这一成功验证了削减遗传密码的可行性,为理解早期生命演化提供了实验依据。未来,他们计划尝试移除更多氨基酸,以探索最小化遗传密码的极限。 这项研究不仅深化了对生命起源的认识,也可能推动合成生物学发展——例如,设计在极端环境中更稳定的蛋白质,或创造具有全新功能的生物系统。

Ars Technica1个月前原文
马斯克诉奥特曼案开庭,司法部投票权部门被掏空,AI替代岗位的恐慌是否被夸大?

本期《Uncanny Valley》播客深度探讨了埃隆·马斯克与萨姆·奥特曼之间诉讼案的深层影响,该案不仅关乎个人恩怨,更可能重塑OpenAI乃至整个AI行业的格局。同时,节目分析了Meta等公司近期裁员潮背后AI对就业的真实影响,并曝光了美国司法部投票权部门被系统性削弱的内幕。 ## 马斯克诉奥特曼:一场关乎AI灵魂的审判 本周,马斯克与OpenAI领导层(尤其是奥特曼)的诉讼在加州奥克兰联邦法院正式开庭。这起案件表面上源于马斯克对OpenAI背离非营利初衷的指控,但实际影响远超个人矛盾。**微软正竭力避免卷入这场风波**,而陪审团成员对马斯克的个人观感也成为变数——部分潜在陪审员坦言“不喜欢马斯克”。 案件的核心在于:OpenAI是否为了商业利益牺牲了最初承诺的“安全、开放”使命?若法院裁决支持马斯克,可能迫使OpenAI调整治理结构,甚至影响其与微软的合作关系。这将成为AI行业“营利与非营利”边界的一次关键司法检验。 ## AI裁员真相:是替代还是重塑? Meta近期宣布的大规模裁员,被部分媒体解读为“AI取代人类岗位”的转折点。但播客指出,实际情况更为复杂。**数百名负责训练Meta AI的合同工面临解雇**,这并非因为AI已能完全自主,而是企业正将工作重心从数据标注转向模型优化。 AI确实在淘汰部分低技能重复性工作,但同时创造了新岗位,比如提示工程师、AI伦理专家等。所谓“AI岗位末日”更多是媒体渲染的恐慌,而非现实图景。 ## 司法部投票权部门:被悄然掏空的民主防线 《连线》调查揭露,美国司法部投票权部门在过去一年经历了系统性削弱:**数十名资深律师被调离或被迫离职**,部门实际执法能力大幅下降。这一变化发生在2024年大选前夕,可能直接影响对选民压制行为的追查力度。 尽管该话题未获足够关注,但其对选举公正性的潜在威胁不容忽视。节目呼吁公众警惕行政机构“静默式”的功能丧失。 --- 本期节目还讨论了如何订阅《Uncanny Valley》播客,以及自动生成字幕可能存在的错误。听众可通过Apple Podcasts、Spotify等平台收听完整内容。

WIRED AI1个月前原文

OpenAI 于周四正式推出 **Advanced Account Security(AAS)**,这是一套面向 ChatGPT 用户的可选高级账户安全保护措施。该计划主要针对高风险人群——如政治异见人士、记者、研究人员和民选官员——但也向所有希望获得更强保护的普通用户开放。 作为 AAS 计划的一部分,数字安全公司 **Yubico** 宣布与 OpenAI 合作,推出两款联名 **YubiKey** 产品:**YubiKey C NFC** 和 **YubiKey C Nano**。这些安全密钥是小型硬件设备,通过 USB 端口连接计算机,内置唯一的加密标识符,只有持有密钥的人才能登录关联账户,从而有效抵御网络钓鱼攻击。 Yubico CEO Jerrod Chong 在新闻稿中表示:“我们的最终目标是大幅降低全球 OpenAI 账户中敏感数据被未授权访问的威胁。” 他指出,针对聊天机器人用户的网络钓鱼攻击正日益增多,而安全密钥是防范此类攻击的最有效手段之一。 尽管钓鱼 ChatGPT 账户的威胁听起来有些抽象,但已有越来越多研究证实,恶意行为者正将目光投向聊天机器人用户。由于聊天对话通常包含大量私密信息,犯罪分子可以借此进行勒索。OpenAI 的 AAS 计划正是为了应对这一趋势,为高风险用户提供硬件级的账户保护。 对于企业用户而言,将公司机密保存在 ChatGPT 会话中同样存在风险,AAS 和 YubiKey 的整合无疑为这些用户提供了更可靠的防护方案。目前,AAS 为可选功能,用户可自行决定是否启用。

TechCrunch1个月前原文

在加利福尼亚联邦法院的庭审中,埃隆·马斯克承认其 AI 初创公司 xAI 使用了 OpenAI 的模型来改进自家模型。这涉及模型蒸馏这一行业常见做法,即用一个大型 AI 模型作为“教师”来指导较小的“学生”模型。 ## 庭审关键交锋 当被问及是否了解模型蒸馏时,马斯克给出了肯定回答,并解释这是用一个 AI 模型训练另一个模型。但当被追问 xAI 是否蒸馏了 OpenAI 的技术时,马斯克起初回避,称“所有 AI 公司都这么做”。在检方进一步施压下,他才松口说“部分正确”,并补充道:“使用其他 AI 来验证自己的 AI 是标准做法。” 这一证词发生在马斯克与 OpenAI CEO 山姆·奥尔特曼的法律大战中。马斯克此前起诉 OpenAI 背离了非营利初心,而 OpenAI 则反诉马斯克存在骚扰行为。庭审中,蒸馏问题成为双方角力的焦点之一。 ## 行业灰色地带 模型蒸馏近年来争议不断,其合法性与是否违反公司服务条款往往处于灰色地带。OpenAI 和 Anthropic 曾公开指责中国公司蒸馏其模型——OpenAI 点名 DeepSeek,Anthropic 则列出 DeepSeek、Moonshot 和 MiniMax。谷歌也采取措施防范所谓的“蒸馏攻击”,将其定性为“违反谷歌服务条款的知识产权盗窃方式”。 但蒸馏本身并非非法。Anthropic 在相关博文中指出:“蒸馏是一种广泛使用且合法的训练技术。”关键在于是否违反目标模型的服务条款。多数 AI 公司禁止使用其模型输出训练竞争模型,但执行起来困难重重。 ## 对行业的影响 马斯克的证词可能重塑行业规则。若法庭认定蒸馏 OpenAI 模型违法,将对 xAI 及类似小公司造成冲击;反之,则可能巩固蒸馏作为合法竞争手段的地位。目前,案件仍在审理中,预计将持续数周。

The Verge1个月前原文

在 OpenAI 起诉案中,埃隆·马斯克承认其 AI 公司 xAI 通过蒸馏技术从 OpenAI 模型中学习以训练 Grok。蒸馏是前沿实验室试图阻止小型竞争对手复制其模型的热门话题。 ## 蒸馏:AI 领域的灰色地带 蒸馏技术允许开发者通过向公开可用的聊天机器人或 API 发送提示,来训练新模型。这种方法成本低廉,但可能违反服务条款。OpenAI 和 Anthropic 近期对中国公司使用蒸馏技术开发低成本开放权重模型表示担忧,但美国公司之间相互使用该技术的情况一直处于猜测中。马斯克的证词首次证实了这一点。 ## 法庭上的关键陈述 在加州联邦法院的证词中,马斯克被问及 xAI 是否使用蒸馏技术训练 Grok,他回答“部分如此”,并称这是 AI 公司的普遍做法。他还将 Anthropic 列为当前领先的 AI 提供商,随后是 OpenAI、谷歌和中国开源模型。 ## 行业影响与讽刺 蒸馏技术威胁着大型 AI 公司通过巨额计算投资建立的护城河。讽刺的是,前沿实验室自身也曾因使用受版权保护的数据训练模型而面临争议。目前,OpenAI、Anthropic 和谷歌正通过 Frontier Model Forum 共享信息,以阻止来自中国的蒸馏尝试,包括检测和防止大规模异常查询。 ## 法律与商业的双重博弈 马斯克起诉 OpenAI 违背其非营利使命,而蒸馏技术的承认可能使案件复杂化。尽管蒸馏是否违法尚不明确,但它显然挑战了行业巨头的商业模式。xAI 作为后来者,利用蒸馏追赶先行者,折射出 AI 领域激烈的竞争现实。

TechCrunch1个月前原文

在医疗科技领域创业,不能像消费互联网那样“快速行动,打破常规”。时间线更长、风险更高,成功取决于在强调严谨而非速度的系统中穿行。这正是 **BioticsAI** 联合创始人兼 CEO **Robhy Bustami** 所面对的现实。他的公司正在开发一款用于超声检查的 **AI 辅助工具**,帮助检测胎儿异常——这一领域误诊率仍然高得惊人。 Bustami 在 TechCrunch 的 Build Mode 节目中,与主持人 Isabelle Johannessen 探讨了公司如何在高度监管的领域中找到方向,并保持团队士气。 ## 从零到 FDA 批准的务实路径 BioticsAI 起步时极为精简。团队以不到 **10 万美元** 的成本构建了早期可用的产品原型——这在医疗设备领域几乎是闻所未闻的里程碑。该原型帮助他们在 **2023 年赢得 TechCrunch Startup Battlefield**,带来了早期曝光和信誉。今年 **1 月,他们获得了 FDA 批准**,这意味着可以开始进入医院并加速业务增长。 从一开始,团队就将产品开发与 FDA 审批流程并行推进。他们没有先构建产品再考虑监管,而是将临床验证、监管策略和产品开发整合为一个流程。这意味着与临床医生紧密合作、收集大规模数据集,并在提交审批前进行结构化临床研究。 ## 监管迷雾中的导航策略 FDA 审批流程常被视为黑箱,但 Bustami 强调创始人不必盲目摸索。通过 **预提交会议** 与监管机构早期接触,帮助团队在设计研究和预期结果上达成一致。尽管如此,风险从未完全消失。对于许多投资者来说,最大的问题很简单:如果 FDA 说不怎么办? ## 长期主义下的团队管理 在内部,漫长的开发周期带来了另一种挑战:当最重要的里程碑还在几年后时,如何保持团队动力?在 BioticsAI,这意味着在工程师、临床医生和研究人员之间建立 **文化对齐**,确保每个人都能看到过程中的“小胜利”。 “确保每个人都完全对齐,即使这超出了他们的技术范围,”Bustami 说,“在研发方面不断看到胜利”——无论是来自临床研究还是新的医疗合作伙伴关系。 ## 医疗 AI 创业的启示 BioticsAI 的故事为其他医疗科技创业者提供了宝贵经验: - **早期融入监管思维**:在产品设计之初就考虑 FDA 要求,而非事后补救。 - **低成本验证**:用最小可行产品证明概念,再逐步扩大。 - **团队激励**:在长周期项目中,通过阶段性成果保持团队士气至关重要。 随着 AI 在医疗领域的渗透加速,像 BioticsAI 这样既懂技术又懂监管的团队,可能正是行业最需要的破局者。

TechCrunch1个月前原文

2026年已过半,ZDNET回顾了今年测试过的众多产品,但读者们的选择往往更出人意料。根据读者通过ZDNET文章链接购买的数据,以下是截至目前最受欢迎的10款工具和科技小物。 ## 1. 蓝牙追踪器 帮助找回丢失钥匙、钱包等物品,是日常必备的实用工具。 ## 2. 智能恒温器 节能且可远程控制,提升家居舒适度。 ## 3. 无线充电板 摆脱线缆束缚,支持多设备同时充电。 ## 4. 降噪耳机 沉浸式音频体验,适合通勤和专注工作。 ## 5. 智能虫咬愈合器 利用特定光波或热量缓解蚊虫叮咬的瘙痒和肿胀,堪称夏季神器。 ## 6. 便携式电源站 户外活动或停电时的应急供电方案。 ## 7. 智能灯泡 通过语音或APP调节亮度和颜色,营造不同氛围。 ## 8. 空气净化器 关注室内空气质量,尤其适合过敏人群。 ## 9. 智能门锁 指纹、密码或手机开锁,提升家庭安全与便利。 ## 10. 运动追踪手表 监测心率、步数、睡眠等健康数据,激励运动习惯。 这些产品涵盖智能家居、个人健康、日常便利等多个领域,反映了2026年消费者对实用性和科技感的双重追求。

ZDNet AI1个月前原文

谷歌宣布将把Gemini AI助手引入搭载Google内置系统的汽车,取代现有的Google Assistant。这一举措标志着谷歌将更先进的对话式AI带入驾驶体验的雄心。此前一天,通用汽车已宣布Gemini将覆盖其约400万辆2022年款及更新的车型,涵盖凯迪拉克、雪佛兰、别克和GMC等品牌。但谷歌今日的公告未点名具体汽车制造商,暗示Gemini的部署将不限于通用汽车。 ## 升级亮点:更自然的对话体验 Gemini的更新使驾驶员能够以更自然、更流畅的方式与车辆交互。例如,驾驶员可以说“我想在沿途找一家评价不错、有户外座位的餐厅吃午饭”,Gemini就能通过Google Maps数据推荐合适选项,并回答后续问题,如停车场情况、菜单选择或饮食偏好。此外,Gemini还能执行打开暖风、导航、推荐音乐、查询车辆信息、总结短信并帮助驾驶员免提回复等任务。 ## 实时对话:Gemini Live 谷歌还推出了Gemini Live功能(目前处于测试阶段),支持更开放、实时的对话。驾驶员可通过点击界面按钮或说“Hey Google, let's talk”激活,从而在行驶中进行头脑风暴、学习或一般性讨论。 ## 部署范围与时间表 Gemini的推出将从美国开始,首批支持英语,未来几个月内逐步扩展。值得注意的是,Gemini不仅适用于新车,还将通过软件更新推送到兼容的现有车辆。自2020年首次推出以来,搭载Google内置系统的汽车数量持续增长。此次升级将覆盖数百万辆汽车,但具体数字取决于合作伙伴的部署速度。 ## 行业背景与意义 谷歌此举正值汽车行业加速智能化转型之际。将大语言模型集成到车载系统中,有望显著提升人机交互的深度和实用性。与传统的命令式语音助手不同,Gemini能理解复杂语境和多轮对话,使驾驶员无需分心操作屏幕即可完成更多任务。这不仅是谷歌在AI领域的一次重要落地,也可能推动其他车企和科技公司加速类似布局。 然而,车载AI的安全性和可靠性仍是关键挑战。如何在提供丰富功能的同时确保驾驶员不分心,将是谷歌和汽车制造商需要持续优化的方向。

TechCrunch1个月前原文
马斯克法庭证词疑似承认 xAI 使用 OpenAI 模型进行训练

在周四的联邦法庭证词中,埃隆·马斯克似乎承认其 AI 公司 xAI 使用了 OpenAI 的模型进行训练。这一对话发生在 OpenAI 律师的交叉询问环节,马斯克当时正就他与 OpenAI 的诉讼案出庭作证。 **关键对话还原** OpenAI 律师 William Savitt 询问马斯克是否了解“蒸馏”(distillation)技术——即用一个 AI 模型来训练另一个 AI 模型。马斯克确认后,Savitt 追问 xAI 是否对 OpenAI 的模型进行了蒸馏操作。马斯克回答:“一般来说,所有 AI 公司都这样做。”Savitt 随即表示:“那就是肯定答案。”马斯克补充道:“部分如此。” 蒸馏是一种常见技术,通过让较小的模型模仿较大、能力更强的模型的行为,从而在保持性能的同时降低成本并提升运行速度。 **行业背景与争议** OpenAI 一直在试图阻止竞争对手对其模型进行蒸馏,尤其是中国 AI 实验室 DeepSeek。在 2026 年 2 月的一份众议院委员会备忘录中,OpenAI 表示已“采取措施保护和加固我们的模型,防止蒸馏”,并强调要确保“中国不能通过盗用和包装美国创新来推进独裁式 AI”。特朗普政府也采取了类似措施,白宫科技政策办公室主任 Michael Kratsios 在 2026 年 4 月的备忘录中表示,将向美国 AI 公司共享关于外国蒸馏行为的信息。 然而,美国 AI 实验室之间相互使用对方模型进行测试和安全性评估也属常见。但在当前竞争激烈的环境下,一些公司已完全切断了对竞争对手的访问。2025 年 8 月,Anthropic 在指控 OpenAI 违反服务条款后,封锁了后者对其 Claude 编码模型的访问。 **法律与商业影响** 马斯克的证词可能对其与 OpenAI 的诉讼产生重要影响。他此前指控 OpenAI 背离了非营利使命,转而追求利润。如今,他的表态反而可能成为 OpenAI 反诉的依据——即 xAI 同样使用了竞争对手的技术。此外,这一事件也凸显了 AI 行业在模型蒸馏问题上的法律灰色地带:一方面,蒸馏是技术进步的常规手段;另一方面,它可能违反服务条款,甚至引发知识产权纠纷。 截至发稿,OpenAI 和 xAI 均未回应 WIRED 的置评请求。

WIRED AI1个月前原文
OpenAI 推出“高级”安全模式,保护高风险账户

OpenAI 于周四宣布推出 **高级账户安全(Advanced Account Security)** 功能,为担心 ChatGPT 或 Codex 账户可能成为钓鱼攻击目标的用户提供额外保护层。该功能强制实施严格的访问控制,使账户接管攻击变得极为困难。尽管这类措施在账户安全领域并非新概念——例如谷歌的“高级保护”已推出近十年——但随着 AI 服务在全球快速普及,部署基础性保护措施的需求日益迫切。 OpenAI 表示,此次发布是其本月早些时候公布的更广泛网络安全战略的一部分。公司在博客中写道:“人们正将 AI 用于深度个人问题以及日益高风险的场景。随着时间的推移,一个 ChatGPT 账户可能包含敏感的个人和专业信息,并成为连接工具和工作流程的核心。对于记者、民选官员、政治异见人士、研究人员以及特别注重安全的人群而言,风险更高。” 启用高级账户安全后,用户将无法再使用常规密码登录账户,而必须添加两个物理安全密钥或通行密钥(passkeys),以显著降低成功钓鱼攻击的风险。该功能还取消了通过电子邮件和短信进行账户恢复的途径,用户需使用恢复密钥、备份通行密钥或物理安全密钥。OpenAI 已与 **Yubico** 合作,为高级账户安全用户提供更实惠的 YubiKey 套餐。 关键的是,开启该功能后,用户将无法再向 OpenAI 支持团队寻求账户恢复帮助,因为支持人员不再拥有或控制任何恢复选项。此举可防止攻击者通过社会工程攻击针对支持渠道来入侵账户。高级账户安全还强制缩短登录窗口和会话时间,要求用户更频繁地在设备上重新登录,并在每次登录时生成警报,引导用户查看仪表盘以检查活跃的 ChatGPT 和 Codex 会话。此外,OpenAI 允许任何用户选择退出数据共享,但高级账户安全用户则默认强化了隐私保护。 这一举措反映了 AI 行业对安全性的重视程度不断提升。随着 AI 工具深度融入日常工作与生活,账户安全不再只是密码强度的问题,而是需要多因素认证、硬件密钥和防钓鱼机制的全面防护。对于高风险用户而言,高级账户安全提供了必要的保障,但同时也意味着个人需要承担更多管理责任——比如妥善保管物理密钥。

WIRED AI1个月前原文

Stripe在年度大会上推出数字钱包 **Link**,支持连接银行卡、加密货币钱包和先买后付服务,并记录订阅信息。其核心亮点在于:用户可通过OAuth授权AI代理(如OpenClaw)进行支付,代理发起请求后需用户审批,无需暴露真实凭证。目前支持传统支付方式,未来将加入代理代币和稳定币。钱包提供90天购买保护,用户可查看消费和订阅记录。Stripe计划后续增加额度限制和免审批模式。

TechCrunch1个月前原文

在折叠屏手机的赛道上,摩托罗拉与三星的竞争从未停歇。最近,我同时体验了 **摩托罗拉 Razr Ultra (2026)** 和 **三星 Galaxy Z Flip 7**,这两款翻盖式折叠屏旗舰各有侧重,但综合体验下来,我认为有一款明显更胜一筹。 ## 硬件设计的差异 摩托罗拉 Razr Ultra (2026) 在硬件上可谓下足了功夫。它的外屏尺寸进一步增大,几乎覆盖了整个上半部分机身,不仅支持完整的应用操作,还优化了相机取景和通知交互。铰链设计更加紧凑,折叠后几乎无缝,且支持多角度悬停,实用性更强。相比之下,三星 Galaxy Z Flip 7 延续了该系列一贯的耐用性,机身更坚固,防水性能也保持领先,但外屏尺寸和功能相对保守,主要仍作为信息预览和快捷操作使用。 ## AI 功能与系统体验 三星在 AI 方面投入巨大,Galaxy Z Flip 7 搭载了 Galaxy AI 套件,包括实时翻译、智能摘要、照片编辑助手等功能,这些功能深度集成在系统中,提升了日常使用的便利性。例如,通话实时翻译对于跨国交流非常实用。而摩托罗拉则更专注于硬件创新,AI 功能相对基础,主要集中在相机场景优化和电池管理上。 ## 相机与续航 相机方面,摩托罗拉 Razr Ultra (2026) 升级了主摄传感器,配合更大的外屏,自拍时可以利用后置主摄获得更高质量的人像。三星 Z Flip 7 的相机硬件升级不大,但凭借 AI 算法优化,在夜景和动态范围上表现稳定。续航上,摩托罗拉凭借更大的电池和快充技术胜出,而三星的续航依然中规中矩。 ## 最终结论 如果你追求极致的硬件体验,喜欢更大的外屏、更快的充电和更轻薄的设计,**摩托罗拉 Razr Ultra (2026) 无疑是更好的选择**。而如果你需要强大的 AI 功能和更可靠的耐用性,三星 Galaxy Z Flip 7 依然是一个稳妥的选项。但就创新和综合体验而言,摩托罗拉这次走在了前面。

ZDNet AI1个月前原文

在生成式AI的生产部署中,大语言模型(LLM)的迁移与升级始终是一项挑战。AWS近日推出的**生成式AI模型敏捷方案**,为这一问题提供了系统化的解决框架。该方案涵盖工具、方法论和最佳实践,旨在帮助开发者在不同LLM之间高效切换,同时确保提示词(prompt)的转换与优化过程稳健可靠。 ## 为何需要模型敏捷方案? 随着开源模型(如Llama、Mistral)和闭源模型(如GPT-4、Claude)的快速迭代,企业常面临模型替换或升级的需求。传统做法往往需要手动调整大量提示词和微调流程,耗时且易出错。AWS的模型敏捷方案通过**标准化协议**,将提示词转换、性能评估和回滚机制整合为自动化流水线,显著降低迁移风险。 ## 核心组件与工作流 该方案的核心是一套**提示词转换引擎**,它能够分析原始模型上的提示词模式,并自动生成目标模型兼容的版本。例如,当从Llama 2迁移到Mistral时,引擎会调整格式、角色设定和输出约束,而无需人工逐条修改。此外,方案还集成了**自动回归测试**,通过预设的评估数据集对比迁移前后的输出质量,确保性能不降级。 ## 最佳实践与行业意义 AWS推荐采用**分阶段迁移策略**:先在非关键任务上验证,再逐步扩大范围。同时,建议保留旧模型的快照,以便在出现问题时快速回滚。这一方案不仅适用于模型升级,也可用于多模型混合部署——例如,根据任务复杂度动态选择不同规模的模型,以平衡成本与效果。 对于AI团队而言,这意味着更快的迭代速度和更低的试错成本。在LLM生态日益碎片化的今天,AWS的模型敏捷方案为生产环境的模型管理提供了可复用的模板,有望成为生成式AI工程化的重要基石。

AWS ML1个月前原文

In this post, we show how Sun Finance used Amazon Bedrock, Amazon Textract, and Amazon Rekognition to build an AI-powered identity verification (IDV) pipeline. The solution improved extraction accuracy from 79.7% to 90.8%, cut per-document costs by 91%, and reduced processing time from up to 20 hours to under 5 seconds. You'll learn how combining specialized OCR with large language model (LLM) structuring outperformed using either tool alone. You'll also learn how to architect a serverless fraud

AWS ML1个月前原文

Anthropic 正式发布 Claude Security,一款基于 Claude Opus 4.7 模型的防御性网络安全工具,目前以公开测试版形式向 Enterprise 级用户开放,后续将覆盖 Team 和 Max 级用户。该工具能够扫描代码库中的漏洞、验证威胁并自动生成补丁,帮助安全团队优先修复最危险的缺陷。 ## 核心功能:从扫描到修复的全流程 Claude Security 的工作流程分为三步:**扫描**、**验证**和**补丁生成**。它利用 Opus 4.7 模型分析整个代码库,识别潜在漏洞;随后对每个漏洞进行验证,排除误报;最后为确认的漏洞生成针对性补丁。与传统的静态分析工具不同,Claude Security 能根据漏洞的利用难度、影响范围等维度自动排序,让开发者优先处理高风险问题。 ## 与 Project Glasswing 的协同 本月初,Anthropic 还公布了 **Project Glasswing**——一项被称为“AI 曼哈顿计划”的开源软件安全倡议,旨在挖掘全球关键基础设施中的漏洞。Glasswing 使用更强大的 Mythos 模型(因安全性过高而未公开发布),参与者包括 Amazon Web Services、Apple、Google、Microsoft 等科技巨头。Claude Security 可以视为 Glasswing 的实用化延伸,将后者的深度漏洞发现能力转化为企业日常可用的修复工具。 ## 行业背景与挑战 AI 驱动的漏洞扫描并非新鲜事,但 Claude Security 的独特之处在于**将发现与修复直接链接**,并引入优先级排序。传统流程中,安全团队往往要面对成百上千个漏洞,难以抉择先修复哪个。Claude Security 通过上下文分析(如漏洞所在模块的关键性、攻击路径的复杂度)给出建议,缩短了从发现到修复的周期。 不过,这类工具也面临潜在风险:如果被攻击者获取,可能被用于反向定位漏洞并加速攻击。Anthropic 表示,Claude Security 当前仅面向受信任的企业客户,且模型经过安全对齐,但业界仍需警惕双刃剑效应。 ## 适用场景与可用性 目前,Claude Security 处于公开测试阶段,仅限 Anthropic Enterprise 用户使用。团队版和 Max 版用户将在后续获得访问权限。对于拥有大型代码库的企业,该工具可显著降低安全运维的人力成本,尤其适合需要快速响应零日漏洞的场景。值得注意的是,Anthropic 强调该工具不会存储扫描的代码数据,所有分析均在客户环境内完成。 ## 小结 Claude Security 的推出标志着 AI 在网络安全领域的角色从“辅助分析”向“主动防御”迈进。通过将深度模型能力转化为可落地的修复建议,Anthropic 试图解决安全行业长期存在的“漏洞发现多、修复少”的痛点。但工具的有效性仍取决于模型对业务上下文的理解精度,以及企业对 AI 生成补丁的信任度。随着测试推进,其实际效果值得持续关注。

ZDNet AI1个月前原文