Google 在今年的 I/O 开发者大会上推出了 **Gemini Spark**,一个始终在线的 AI 智能体,能够连接你的个人数据、完成在线任务并自动化日常交互。这是 Google 对 2026 年初席卷硅谷的 OpenClaw 智能体的回应。 作为首批体验者,我让 Gemini Spark 完全访问我的 Gmail、文档和日历,然后输入了一句简单的提示:“帮我计划一场生日派对”。结果令人惊叹:它不仅从我真实预订的卡拉 OK 酒吧信息中提取了细节,还生成了五页的完整计划,包括宾客名单、场地规则、附近餐饮、余兴派对地点、邮件邀请和主题创意。整个过程仅需几分钟,无需我时刻监督。 然而,真正让我哭笑不得的是 AI 生成的宾客名单。它扫描了我的邮件和文档,推荐了 15 位潜在朋友——恰好是包间最大容量。名单第一位是我的长期同居男友,却被标注为“亲密朋友和频繁旅伴”。更离谱的是,作为寿星的我本人竟然不在名单上。这种“数据洞察”与真实关系的错位,暴露了当前 AI 智能体在理解人类情感和社交细微之处时的局限性。 Gemini Spark 本周开始向 AI Ultra 订阅用户(每月 100 美元)开放 Beta 版,位于 Gemini 聊天机器人的新标签页中,支持移动端和桌面端控制。尽管它在任务自动化上表现出色,但这次“翻车”提醒我们:AI 可以处理日程,却无法理解人心。
人工智能的崛起带来了大量新术语和行话。本文整理了一份常用词汇表,帮助你理解LLM、RAG、RLHF等关键概念。 ## 从AGI到AI Agent:核心概念解析 **AGI(通用人工智能)** 是一个模糊但重要的概念。OpenAI CEO Sam Altman将其描述为“可以雇来当同事的普通人类水平的AI”,而OpenAI的章程则定义为“在大多数经济价值工作上超越人类的高度自主系统”。Google DeepMind的理解略有不同,认为AGI是“在大多数认知任务上至少与人类能力相当的AI”。值得注意的是,即使是AI研究前沿的专家们对此也未达成共识。 **AI Agent(智能体)** 指的是能够自主执行一系列任务的工具——比如报销费用、预订机票或编写代码——远超基础聊天机器人的能力。不过,正如我们之前解释过的,这个新兴领域仍有许多不确定性,不同人对AI Agent的理解可能不同,其底层基础设施也仍在建设中。 ## 技术细节:API端点与思维链 **API端点(API endpoints)** 可以理解为软件后端暴露的“按钮”,其他程序可以“按下”这些按钮来触发功能。开发者利用这些接口构建集成,例如让一个应用从另一个应用拉取数据,或让AI Agent直接控制第三方服务。大多数智能家居设备和联网平台都有这些隐藏按钮,普通用户通常看不到。随着AI Agent能力增强,它们越来越能自主发现并调用这些端点,带来强大的自动化可能。 **思维链(Chain of thought)** 是一种推理方法,让AI像人类一样逐步思考问题。面对简单问题时,人类大脑可以不经思考直接回答;而复杂问题则需要分解步骤。思维链提示技术正是模拟这种过程,要求模型输出中间推理步骤,从而提升复杂任务的准确性。 ## 行业背景与术语价值 这些术语的涌现反映了AI行业的快速迭代。理解它们不仅是技术爱好者的需求,更是商业决策者和普通用户跟上时代的基础。例如,区分AGI的不同定义有助于评估AI公司的技术路线和商业承诺;了解API端点的概念则能理解为什么AI Agent正在成为自动化领域的热点。 本文作为一份活文档,将持续更新。建议读者重点关注**RLHF(基于人类反馈的强化学习)**、**RAG(检索增强生成)** 等后续会深入解析的术语,它们分别对应AI对齐和知识检索两大关键方向。
近年来,AI取代人类工作的论调甚嚣尘上,但Box创始人Aaron Levie却提出了一个令人警醒的观点:那些决定AI可以取代你工作的人,恰恰是最不了解你工作真正内涵的人。他将这种现象称为“AI精神病”(AI psychosis)。 Levie的这番评论并非空穴来风。项目管理平台ClickUp近期裁掉了22%的员工,理由是为了给AI代理腾出空间。更令人担忧的是,2026年的科技行业裁员人数已经几乎与2025年全年持平。这些数据表明,企业正在以前所未有的速度用AI替代人类岗位,但其中可能隐藏着巨大的认知偏差。 ### 什么是“AI精神病”? Levie所描述的“AI精神病”,指的是企业高管和技术决策者过度沉迷于AI的潜力,以至于盲目相信AI能够解决所有问题,甚至在不完全理解业务复杂性的情况下,就贸然用AI替代人类员工。这种思维模式忽略了AI的局限性,也低估了人类在特定场景下的不可替代性。 例如,ClickUp的裁员决策引发了广泛争议。虽然AI代理在处理重复性任务上确实高效,但项目管理涉及大量的人际沟通、创意协调和战略决策,这些都是当前AI难以胜任的。Levie认为,这种“先开枪后瞄准”的做法,最终可能导致企业效率下降,甚至失去核心竞争力。 ### AI替代的隐形成本 事实上,AI替代人类工作并非简单的成本效益计算。当企业盲目追求AI化时,往往会忽略以下隐形成本: - **知识流失**:经验丰富的员工离开后,其积累的行业知识和隐性技能难以被AI复制。 - **创新停滞**:过度依赖AI可能导致团队失去主动思考和创新的能力。 - **客户体验下降**:AI在处理复杂、个性化需求时,往往不如人类灵活和富有同理心。 Levie的警告并非反对AI技术本身,而是呼吁企业保持理性。AI应当被视为增强人类能力的工具,而非完全替代人类的解决方案。 ### 行业趋势与反思 2026年的裁员数据令人震惊:科技行业的裁员人数已接近2025年全年水平。这背后既有经济下行的压力,也有AI技术普及的冲击。然而,Levie的观点提醒我们,裁员并非总是最优解。企业在推动AI转型时,需要更深入地评估岗位价值,避免陷入“为了AI而AI”的误区。 一些公司已经开始反思这一趋势。例如,部分企业选择通过再培训让员工与AI协作,而非直接裁员。这种“人机协同”的模式或许更可持续。 ### 小结 “AI精神病”是一个值得所有科技从业者警惕的现象。在AI浪潮席卷各行各业的今天,企业决策者需要保持清醒:AI是工具,不是万能药。真正的竞争力,来自于对技术与人类价值的深刻理解与平衡。
随着科技行业围绕 AI 智能体(AI Agent)加速布局,股票交易应用 **Robinhood** 也正式加入这一浪潮。本周三,Robinhood 宣布推出 **AI 代理交易** 功能,并同步上线一款面向 AI 代理的虚拟信用卡,标志着个人投资与 AI 自主操作之间的边界正在被打破。 ## 功能设计:AI 代理如何为你交易? Robinhood 用户现在可以为自己的 AI 代理创建一个独立账户,并连接专属钱包。AI 代理能够读取和分析用户的投资组合,提出交易策略和投资建议,但**只能动用预充入专属钱包的资金**来下单。所有交易行为都会通过 Robinhood 应用向用户发送通知,用户可随时监控代理的活动。对于部分交易,代理会生成预览,**需要用户手动批准**后才能执行。 Robinhood 还内置了欺诈检测保护机制:一旦出现可疑交易,Robinhood 团队会进行审查并协助用户解决争议。目前该功能处于 **Beta 阶段**,仅支持股票交易;公司计划后续扩展至期权、加密货币、事件合约、期货和预测市场。 ## 连接方式:通过 MCP 协议实现智能体对接 Robinhood 允许用户将 AI 代理连接到其 **Model Context Protocol (MCP) 服务**,从而执行多种操作,例如: - 分析集中度风险和行业敞口 - 执行交易 - 浏览分析师笔记以发现跨行业投资机会 这种开放接口的设计,使得用户可以使用自己的工具、大型语言模型(LLM)和代理来与 Robinhood 平台交互。 ## 虚拟信用卡:让 AI 代理也能付款 除了交易功能,Robinhood 还推出了一款专为 AI 代理设计的 **虚拟信用卡**。用户可将 AI 代理连接到 Robinhood 的银行 MCP 服务器,使其能够代表用户进行支付。该虚拟卡目前仅面向 Robinhood Gold Card 持有者开放,用户可以设置**每月消费限额**,并选择每次支付是否需要代理请求批准。Robinhood 表示,即将推出的 **Platinum Card** 也将支持类似的虚拟代理卡功能。 ## 行业背景与战略意义 Robinhood 在 AI 领域的布局已有时日:2024 年收购了 AI 驱动的研究平台 **Pluto**,去年又推出了提供投资建议的 AI 助手。此次 AI 代理交易功能的推出,进一步将 AI 从“建议者”升级为“执行者”,标志着个人投资领域进入 **AI 自主操作** 的新阶段。 对于用户而言,AI 代理可以 24/7 监控市场并快速执行策略,但也带来了风险控制、隐私保护等新挑战。Robinhood 通过独立钱包、交易通知和人工审查机制,试图在“自主”与“可控”之间取得平衡。 ## 小结 Robinhood 的 AI 代理交易功能目前处于早期测试阶段,但它预示了一个趋势:AI 智能体正在从聊天工具演变为具备实际金融操作能力的“数字管家”。未来,随着更多资产类别和支付场景的接入,AI 代理在个人金融领域的应用空间值得密切关注。
本周,一家名为 **Shift** 的 AI 训练初创公司宣布,将为纽约居民提供**免费的家政清洁服务**,并计划将业务扩展到伦敦等城市。表面上是福利,但背后有一个明确的交换条件:Shift 要求拍摄清洁工工作的全过程——从洗碗、擦台面到拖地,所有家务细节都会被记录下来。这些视频并非用于宣传,而是作为训练机器人的**真实世界数据**。 为什么需要这么多家务视频?与可以从互联网大规模抓取的文本、图像数据不同,机器人要学习物理世界中的操作,需要理解空间、运动、力、摩擦、不规则形状和光线变化等复杂因素。对人类来说轻而易举的叠衣服、捡苹果、倒水,对机器人而言却是巨大的工程挑战。要教会它们这些技能,必须依赖海量的、高质量的**物理世界数据**。 Shift 并非孤例。在印度,家居服务平台 **Pronto** 也被曝出利用客户的家作为 AI 训练素材的来源,拍摄烹饪、清洁、洗衣等家务活动。Pronto 声称只在客户明确同意的情况下录制,但客户获得什么回报尚不明确。这种做法引发了关于隐私和知情同意的讨论。 ### 数据瓶颈催生“创意”采集 随着具身智能(Embodied AI)和机器人技术的升温,真实世界数据成为稀缺资源。与数字内容不同,家务数据无法轻易从网上抓取,且往往涉及隐私和伦理问题。Shift 的模式本质上是“以服务换数据”——用免费清洁换取拍摄许可,既获取了高质量训练数据,又绕过了传统数据采集的高昂成本。 ### 隐私与便利的博弈 对于消费者而言,免费清洁听起来很有吸引力,但代价是让陌生人记录下自己私密的生活空间。这些视频如何存储、使用、分享,是否会被用于其他目的,都是未知数。Shift 和 Pronto 的做法也提醒我们:在 AI 时代,**数据采集的边界正在模糊**,而日常生活中的隐私可能成为技术发展的“燃料”。 ### 小结 机器人想要真正走进家庭,必须先学会做家务。而学会做家务,又需要大量家庭场景的数据。Shift 的免费清洁计划是这一循环中的一环,它揭示了 AI 训练数据获取的新趋势——从公开网络转向现实世界,从免费抓取转向“等价交换”。但如何平衡技术发展与个人隐私,将是整个行业需要持续面对的课题。
AI芯片初创公司Groq正计划从现有投资者处筹集6.5亿美元新资金,以加大对其推理云业务的投入。据Axios报道,这家公司正从硬件转向聚焦AI推理(inference)——即优化AI模型对用户提示做出响应的过程。 去年12月,Groq与英伟达达成了一项价值约200亿美元的“非收购协议”,涉及部分Groq高管跳槽至英伟达,以及Groq硬件技术的授权。这笔交易让Groq的投资者获得了现金回报,但如果当时是全面收购,它本将成为英伟达历史上最大的一笔收购。如今,这些投资者被要求再次出资,支持公司发展推理云业务,该业务允许开发者和企业托管其推理密集型应用。 目前,Groq由临时CEO Adam Winter和临时CFO Matt Eng领导。报道称,这6.5亿美元融资几乎已成定局——现有投资者Disruptive和Infinitium已同意,如果其他投资者不愿按比例认购,他们将补足剩余份额。 推理是AI提示之后发生的处理过程,目前在AI世界中,推理的需求远大于模型训练。Groq的转型反映了这一趋势:随着AI应用大规模落地,推理环节对算力的消耗正成为瓶颈,而Groq自研芯片在推理速度和能效上具有优势。 这轮融资距离英伟达的“非收购”协议仅半年,显示出Groq在获得资金和人才后,正加速向推理服务商转型。对于英伟达而言,这既是巩固其AI生态的举措,也间接扶持了一个潜在竞争对手。
据 Axios 报道,AI 芯片初创公司 Groq 正寻求从现有投资者处筹集 **6.5 亿美元** 新资金,以加大对推理(inference)云业务的投入。该业务依托 Groq 自研芯片和系统,为开发者与企业提供托管推理密集型应用的平台。 此前,Groq 在去年 12 月与英伟达达成了一项价值约 **200 亿美元** 的“非收购协议”(not-a-quisition),部分 Groq 高管转投英伟达,同时 Groq 将其硬件技术授权给英伟达。这笔交易让 Groq 的早期投资者获得了现金回报——如果该交易是完整收购,它本会成为英伟达历史上最大的一笔收购。 如今,这些投资者被要求继续注资,支持 Groq 的推理云业务扩张。推理是 AI 模型在收到提示后进行的处理过程,当前在 AI 领域的需求远大于模型训练。Groq 的新方向目前由临时 CEO **Adam Winter** 和临时 CFO **Matt Eng** 领导。 报道称,这轮融资几乎已成定局:Groq 的投资方 **Disruptive** 和 **Infinitium** 已同意,如果其他现有投资者不愿按比例认购,它们将补足剩余份额。 ## 行业背景 Groq 的转型折射出 AI 芯片赛道的显著变化。随着大模型从训练转向大规模部署,**推理效率** 成为关键瓶颈。Groq 凭借其低延迟、高吞吐的 LPU(语言处理单元)架构,在推理市场占据一席之地,但面临英伟达、AMD 以及 Cerebras 等定制芯片厂商的激烈竞争。 此次融资也凸显了 **“非收购式人才获取”** 模式的兴起。英伟达通过类似协议,既获得了关键人才,又避免了反垄断审查,而 Groq 则获得了资金和生态支持。不过,Groq 的核心团队流失后,能否独立推进推理云战略仍存变数。 ## 小结 Groq 的 6.5 亿美元融资计划,既是对其推理云业务前景的押注,也是对英伟达主导地位的一次挑战。在 AI 推理需求爆发的当下,这家初创公司能否借力此轮融资实现突围,值得持续关注。
本周的机器人视频精选又来了!从仿生多足设计到全向移动突破,这些机器人正在重新定义“运动能力”的边界。 ## 亮点一:多足机器人的“冗余美学” 在最新一期“视频星期五”中,**通用机器人实验室(General Robotics Lab)** 展示了一款拥有**超常数量腿**的机器人。设计师似乎信奉“腿越多越好”的理念——这款机器人不仅能在复杂地形中保持稳定,还能通过冗余腿实现**容错运动**:即使部分关节失效,仍能继续完成任务。这让人联想到自然界中的蜈蚣或千足虫,它们通过多足协调实现高效且稳健的移动。 ## 亮点二:极致全向移动能力 该机器人的**全向移动**能力尤为突出。不同于传统轮式或双足机器人的转向限制,它可以在不改变朝向的情况下向任意方向平移,甚至原地旋转。这种能力在狭小空间作业(如管道检测、废墟搜救)中极具价值。研究者通过优化腿部运动轨迹和地面接触力,实现了近乎瞬时的方向切换。 ## 行业背景:为什么“腿越多”反而更受关注? 近年来,足式机器人领域呈现两极分化:一方面,**双足人形机器人**因拟人形态备受资本追捧;另一方面,**多足机器人**在**工业巡检、灾害响应**等场景中展现出独特优势。例如,波士顿动力的Spot(四足)已在石油平台和建筑工地部署,而六足或八足机器人则能进一步降低单腿负载,适应更松软或崎岖的地形。 ## 未来展望 虽然该机器人目前仍处于实验室阶段,但其设计理念为下一代救援或探索机器人提供了新思路。随着驱动器和控制算法的进步,多足机器人有望在**农业、行星探测**等领域大显身手。不过,能耗和运动效率仍是需要攻克的关键难题。 更多机器人酷炫视频,可关注IEEE Spectrum的“视频星期五”系列。
一本探讨AI如何扭曲现实的书籍,却因作者本人使用AI而陷入信任危机。史蒂夫·罗森鲍姆的新书《真相的未来》被曝包含多处伪造或错误归因的引文,而AI检测工具更指出书中部分内容疑似由AI生成。尽管作者辩称AI仅用于辅助研究,但这一事件揭示了AI时代下信息真实性的深层困境。
开源软件的安全问题正日益严峻,维护者不堪重负。IBM与Red Hat联合推出 **Project Lightwell**,这是一项由AI驱动的、旨在以工业级规模发现并修复开源软件漏洞的计划。两家公司计划投入 **50亿美元**,动员 **2万名工程师**,打造一个集中式安全漏洞处理中心。 ### 背景:开源维护者的困境 随着AI的普及,开源项目面临双重挑战:一方面,AI帮助开发者更快编程和发现缺陷;另一方面,大量AI生成的漏洞报告让维护者应接不暇。知名开源项目 **cURL** 的创始人兼维护者 **Daniel Steinberg** 坦言:“2026年安全报告涌入速度是2024年的4到5倍,是2025年的两倍。”他首次承认“工作强度前所未有,但漏洞洪流仍在持续”,已濒临过劳。他呼吁更多公司提供资金支持,以雇佣更多开发者分担压力。 ### Project Lightwell:AI驱动的安全中心 IBM与Red Hat的回应是Project Lightwell——一项“前所未有的力量”,旨在以工业规模识别并修复开源软件漏洞。它计划成为事实上的开源组件安全中心,覆盖支撑现代企业IT的核心组件。不过,该项目并非直接向上游开发者支付报酬,而是为IBM和Red Hat的工程师提供先进的AI工具,让他们专注于修复关键开源项目的安全问题。 Anthropic的 **Mythos Preview模型** 已在短短几周内识别出近 **3900个严重安全漏洞**,凸显了快速修复的紧迫性。为此,两家公司将投入 **50亿美元** 并动员 **2万名工程师**,在未来数年内推进该项目。 ### 订阅模式与未来展望 Lightwell将采用订阅制服务,但具体定价和运作细节尚未公布。这一模式能否有效缓解开源维护者的压力,并真正提升软件供应链的安全性,仍有待观察。但无疑,这是迄今为止企业界对开源安全最重大的投入之一。
## MSI Raider 16 Max HX 评测:性能与便携的终极融合 当一款游戏笔记本电脑能够让你忘记台式机的存在,它一定在某些方面做到了极致。ZDNET 资深编辑 **Cesar Cadenas** 在深度体验后给出了这样的评价:**MSI Raider 16 Max HX** 凭借当前最强的硬件配置、重新设计的散热系统以及一块惊艳的 **240Hz OLED 屏幕**,正在重新定义高端游戏本的标杆。 ### 核心亮点:性能与散热再进化 这款笔记本搭载了最新一代的旗舰级处理器和显卡,配合 MSI 全新的散热架构,确保在高负载场景下依然能保持稳定输出。评测中提到,即使在长时间运行 3A 大作时,机身温度控制也相当出色,键盘区域几乎没有明显热感。这种散热能力在轻薄化设计的游戏本中实属罕见。 ### 屏幕体验:240Hz OLED 的视觉盛宴 Raider 16 Max HX 配备的 **16 英寸 240Hz OLED 面板** 堪称最大卖点。OLED 带来纯粹的黑色表现与超高对比度,而 240Hz 刷新率则保证了极致流畅的动态画面。无论是快节奏的 FPS 游戏,还是注重光影氛围的 RPG,这块屏幕都能提供沉浸式的视觉体验。评测者直言,一旦用上这块屏幕,就很难再回到普通 LCD 面板。 ### 升级便利性与音频表现 MSI 在这款机型上保留了 **易于升级** 的设计,用户可以轻松更换内存和存储,这对于追求长期使用价值的玩家来说是个加分项。此外,**强劲的扬声器系统** 也获得了肯定,无需外接音箱即可获得饱满的游戏音效。 ### 妥协与权衡:价格与续航 当然,极致性能也有代价。**高昂的售价** 使其注定只能面向预算充足的发烧友。而 **平均水平的电池续航** 则是高性能游戏本的普遍短板——在脱离电源后,这台猛兽的续航时间仅能维持基本的轻度使用。如果你需要经常移动办公,可能需要时刻带着电源适配器。 ### 总结:台式机终结者? 对于追求极致游戏体验、且不介意为此支付高价的玩家来说,MSI Raider 16 Max HX 几乎满足了所有幻想:顶级性能、惊艳屏幕、优秀散热和不错的扩展性。它确实有能力让高端台式机变得“可有可无”——前提是你愿意接受它在便携性和续航上的妥协。如果你正在寻找一台能替代台式机的移动堡垒,这款产品值得认真考虑。
一家德国初创公司 MicroAGI 近日在纽约推出了一项“免费家庭清洁”服务,但要求清洁工佩戴摄像头记录全过程,用于训练未来家用机器人。这听起来像科幻情节,却已在现实中悄然落地。 ## 服务模式:以数据换清洁 MicroAGI 通过其新上线的 **Shift 应用** 提供预约服务。用户只需在 App 上填写电话、邮箱、住址等信息,即可预约一次约两小时的免费深度清洁。清洁工均为“专业清洁人员”,但会佩戴智能眼镜或头戴摄像头,全程记录第一人称视角的清洁动作。 公司官网直言,此举是为了收集 **“第一人称清洁视频”**,用于训练下一代家用机器人。这种“以数据换服务”的模式,在 AI 训练数据采集领域并非首创,但直接进入家庭环境仍属罕见。 ## 隐私承诺:自动模糊处理 针对隐私担忧,Shift 应用在 FAQ 中承诺:所有视频在上传至云端前,会通过运行在设备上的 **“先进机器学习模型”** 自动模糊人脸、身份证件、屏幕、手机等个人可识别信息。公司声称这些模糊处理是“不可逆的”。 但评论区指出几个潜在问题: - 用户无法要求删除已用于训练的数据; - 匿名化技术能否彻底防止家庭场景被识别,尚无第三方验证; - 预约需绑定支付信息,若取消不及时可能被扣款。 ## 行业背景:机器人训练数据的“饥渴” 当前具身智能(Embodied AI)领域面临一个核心瓶颈:**高质量的真实操作数据极度匮乏**。模拟环境生成的数据与真实场景存在“仿真-现实差距”,而人工标注又成本高昂。 此前,已有公司通过付费让用户穿戴摄像头记录日常活动(如做饭、整理)来收集数据。MicroAGI 的“免费清洁”策略,本质上是将数据采集成本转嫁为服务成本——用清洁服务换取用户对数据采集的许可。 ## 争议与展望 这种模式在 Reddit 等社区引发两极讨论。支持者认为,这为机器人训练提供了低成本、高真实度的数据,有望加速家用机器人落地。反对者则担忧,家庭环境的隐私边界模糊,即便模糊处理,仍可能通过物品布局、宠物特征等间接信息识别出用户。 MicroAGI 尚未公布具体的数据安全审计报告或第三方监督机制。对于是否接受“用隐私换清洁”,最终仍需用户自行权衡。 ## 小结 免费清洁的诱惑背后,是 AI 公司对真实世界数据的迫切需求。当服务与数据采集深度绑定,用户需要更透明的隐私条款和更强的数据控制权。这场实验的结果,或将影响未来家用机器人数据采集的伦理标准。
近日,AI 编程助手初创公司 Cognition 宣布完成 10 亿美元融资,估值高达 260 亿美元。其核心产品 Devin 被公认为最成功的 AI 编程代理之一,但 CEO 吴浩(Scott Wu)明确表示,Devin 的设计初衷并非取代人类程序员。 ## 从“替代”到“伙伴” 在 Cognition 的官方博客中,他们描绘了一个“自动驾驶式软件开发”的未来。当被问及 Devin 是否会取代中级程序员(L4)时,吴浩给出了“是,也不是”的回答。他强调:“我们从未将其视为替代人类。我知道外界有这样的讨论,但这从来不是我们的观点。” 吴浩本人是一位资深程序员,9 岁开始编程,曾被誉为“有史以来最有成就的少年竞技程序员”之一。二年级时,他就在面向七年级学生的全国数学竞赛中获胜,并结识了 Scale AI 创始人 Alexandr Wang 等天才少年。正是这种背景,让吴浩对编程有着深厚的感情。 “我们开始构建 Devin 时,想法很简单:它就是你的伙伴,帮你构建更多东西。”吴浩甚至在自己的办公桌上放了一个 Devin 泰迪熊,作为这种理念的象征。 ## 保持编程的乐趣 吴浩不希望 AI 代理剥夺人们编程的乐趣。“大多数软件工程师热爱构建软件。如果你问他们为什么,他们会说:我可以从无到有创造东西,把想法变成产品,变成体验。”他认为,就像可视化开发环境将软件创建从机器指令中抽象出来一样,AI 代理是另一层抽象——介于构思软件产品和实际产出之间。 然而,值得注意的是,Cognition 内部确实使用 Devin 来完成几乎所有软件的交付。这种“自己用自己产品”的做法,一方面证明了 Devin 的能力,另一方面也引发了对程序员就业的担忧。 ## 产业视角 在 2026 年这个 AI 裁员新闻频发的年份,吴浩的表态显得尤为谨慎。他坦言:“我们不想让程序员失业。我们本身就是程序员。”这种立场与许多鼓吹“AI 取代人类”的科技公司形成鲜明对比。 但现实是,AI 编程代理的能力正在快速提升。Devin 能够端到端地处理任务,从需求理解到代码生成、测试、部署,几乎覆盖了整个开发流程。对于企业而言,这意味着更高的效率和更低的成本。 吴浩试图在效率与人文之间找到平衡。他相信,AI 代理可以解放程序员,让他们专注于更有创造性的工作,而不是被重复性劳动所困。但最终,这种平衡能否实现,取决于技术发展和社会选择。 ## 小结 Cognition 的案例表明,AI 编程代理的未来不是非此即彼的替代,而是人机协作的新范式。吴浩的“伙伴”理念为行业提供了一个值得思考的方向:AI 应当增强人类能力,而非取而代之。
近日,Hacker News 上关于“CAPTCHAs can still detect AI agents”的讨论引发广泛关注。尽管近年来大语言模型和多模态AI在图像识别、自然语言理解等领域取得突破性进展,但验证码(CAPTCHA)这一经典的图灵测试机制依然能够有效区分人类与AI代理。本文将从技术原理、行业挑战和未来趋势三个维度,解析验证码为何至今仍是AI难以逾越的屏障。 ## 验证码为何仍能奏效? 验证码的核心设计理念是利用人类与机器在感知、推理和交互上的差异。当前主流验证码包括扭曲文字、图像选择(如“选出所有包含自行车”)、以及行为分析(如鼠标轨迹、点击模式)。尽管AI在静态图像分类上已超越人类,但验证码通过动态生成、噪声叠加、语义歧义和时序约束,大幅提升了破解难度。例如,Google 的 reCAPTCHA v3 会综合用户浏览历史、页面停留时间和操作连贯性进行风险评分,而非仅依赖单一任务,这使得AI代理难以模拟真实人类的随机性和不完美操作。 ## AI代理的攻防博弈 近年来,研究者尝试用强化学习、生成对抗网络(GAN)和视觉Transformer破解验证码。例如,2023年的一项研究显示,AI在解决扭曲文字验证码上的准确率已超过90%。然而,验证码系统也在快速进化:引入动态交互(如拖拽滑块)、上下文感知(如要求用户按顺序点击特定物体),甚至结合生物特征(如分析按键力度)。这种“猫鼠游戏”使得AI代理的通用破解方案始终滞后于验证码的更新。 ## 行业影响与未来展望 对于依赖AI代理进行数据采集、自动化测试和服务的公司而言,验证码的持续有效性意味着更高的运营成本。许多企业转向付费API或自建代理池,但面临IP封锁和账号风控风险。另一方面,验证码提供商如Cloudflare、Arkose Labs开始推出更隐形的验证方案(如Turnstile),旨在减少对用户的干扰同时提升安全性。 长远来看,随着AI在常识推理和情境理解上的进步,验证码可能需要融合更多模态(如听觉、触觉)或转向基于用户身份的持续验证。但至少在当下,验证码作为人机边界的守门人,依然稳固。
## 你的数据正在被“免费”利用 每一次网购、注册账号、甚至浏览网页,你的个人信息——姓名、地址、电话、邮箱——都可能被数据经纪商悄悄收集、打包出售。这些数据最终流向营销电话、垃圾邮件,甚至诈骗团伙。**Incogni** 正是为此而生的一款数据移除服务,它能自动帮你向各大数据经纪商发送删除请求,持续监控并清理你的数字足迹。 ## 限时优惠:55% 折扣 ZDNET 编辑团队推荐 Incogni 作为首选隐私工具,目前该服务正提供 **55% 的折扣**:年费仅 **86 美元**(原价 191 美元),省下 105 美元。这一价格在同类服务中极具竞争力,尤其适合希望一劳永逸减少骚扰的用户。 ## 为什么选择 Incogni? - **自动化流程**:无需手动联系数十家数据经纪商,Incogni 代理完成所有删除请求。 - **持续监控**:定期扫描数据泄露和新增记录,确保你的信息不会再次被收集。 - **覆盖广泛**:支持超过 200 家数据经纪商和人员搜索网站。 - **用户友好**:设置简单,提供进度追踪和删除报告。 ## 谁需要它? 如果你曾收到过精准的营销电话、垃圾邮件,或者担心身份信息被滥用,那么 Incogni 值得考虑。尤其对于经常在线上留下信息的人——比如网购达人、社交媒体活跃用户——它能显著减少数据暴露面。 ## 小结 在数据泄露频发的今天,主动管理个人隐私已成为刚需。Incogni 以合理的价格和自动化能力,为用户提供了一个高效方案。趁 55% 折扣入手,相当于每天花费不到 0.24 美元,即可为你的数字生活加上一道“防护锁”。
教皇利奥十四世(Pope Leo XIV)发布历史性AI通谕《Magnifica Humanitas》,呼吁“解除”人工智能的武装。在随后的仪式上,一位意想不到的演讲者登上讲台:Anthropic联合创始人、无神论者Chris Olah。Olah坦言,包括Anthropic在内的前沿AI实验室都身处一套“有时会与做正确之事相冲突的激励机制和约束”之中。这为教皇的观点提供了第一手验证:AI行业需要外部压力和内部约束,以避免人类灾难。通谕虽不会立即让AI公司放弃AGI追求,或让CEO停止以AI效率为由裁员,但其目的在于开启对话,缓和行业的鲁莽野心,并在那些明知后果可能糟糕却仍在构建AI的人心中唤起羞耻感。梵蒂冈对AI的思考已持续数十年,从2016年的密涅瓦对话系列会议开始,就不断邀请科技界人士参与。Olah的出现是多年布局的结果。
## ExpressVPN 审计数量碾压对手,但用户该关注什么? VPN 行业的安全审计常常被厂商当作营销亮点,但普通用户往往对这些术语感到困惑。最近,**ExpressVPN** 宣布已通过 **27 次独立安全审计**,包括其新推出的 **ExpressMailGuard** 和 **Identity Defender** 两项产品。这一数字远超主要竞争对手,例如 NordVPN 和 Surfshark 通常仅公布数项审计结果。 ### 审计的本质:第三方背书还是营销工具? 安全审计是由独立第三方机构对 VPN 服务的代码、基础设施和隐私政策进行审查,旨在验证其“无日志”声明和加密实现是否可靠。ExpressVPN 的审计由 **Cure53** 等知名安全公司执行,覆盖了从 VPN 协议到邮件保护功能的多个层面。然而,审计并非一劳永逸——它仅代表特定时间点的快照,且审计范围可能有限。用户仍需关注审计报告的完整性和时效性。 ### 行业对比:数量不等于质量 ExpressVPN 的 27 次审计在数量上确实领先,但竞争对手也在提升透明度。NordVPN 曾通过德勤的审计,并公开其基础设施架构;Surfshark 则引入了漏洞赏金计划。关键在于,审计是否覆盖了用户最关心的隐私核心——例如日志保留策略和 DNS 泄漏防护。ExpressVPN 的审计历史较长,但用户应查看具体报告,而非仅依赖数字。 ### 实用建议:如何解读 VPN 审计 - **查看审计机构信誉**:Cure53、德勤等知名机构更具公信力。 - **关注审计范围**:是否包括服务器、应用程序和隐私政策? - **注意时效性**:审计日期越新越好,旧审计可能无法反映当前状态。 - **结合独立评测**:审计并非唯一标准,实际速度、连接稳定性同样重要。 总之,ExpressVPN 的审计记录值得肯定,但用户在选择 VPN 时仍需综合考量。审计是信任的基石,而非全部。
**TechCrunch Disrupt 2026** 将于 **10月13日至15日** 在旧金山 Moscone West 举行,演讲申请窗口将于 **今晚(太平洋时间 11:59 p.m.)** 关闭。这场年度科技盛会预计汇聚 **超过 10,000 名** 初创企业及风险投资领袖,议题覆盖 **AI、金融科技、基础设施、机器人、气候科技** 等前沿领域。 ### 申请流程与演讲形式 申请者需提交议题,经编辑团队筛选后进入 **“观众选择”投票环节**,由 TechCrunch 读者决定最终登台阵容。演讲形式分为两种: - **分组会议(Breakout Sessions)**:30分钟演讲(最多4位演讲者,含主持人)+ 20分钟问答,容量100人。 - **圆桌讨论(Roundtables)**:30分钟引导式讨论(最多40人),无需幻灯片或音视频设备,侧重深度交流。 ### 为何不容错过 Disrupt 是科技界最具影响力的活动之一,过往参与者包括 **初创公司创始人、投资人、技术专家**。成功入选不仅能获得曝光,更能与行业决策者直接对话。 ### 行动提醒 申请截止时间紧迫,有意者需立即提交。更多细节可查阅 TechCrunch **Call for Content** 页面。 > 早鸟票优惠(最高省 $410)将于 **5月29日** 截止,注册请访问官网。
Box创始人Aaron Levie在TechCrunch的《Equity》播客中抛出一个尖锐观点:那些决定AI可以取代你工作的人,恰恰是最不了解你工作真正内容的人。他将这种现象称为“AI精神病”(AI psychosis)。 Levie的言论并非空穴来风。项目管理工具公司ClickUp近期裁减了22%的员工,理由是引入AI代理后不再需要那么多人力;2026年的科技行业裁员人数已几乎与2025年全年持平;而DuckDuckGo的安装量正在攀升,因为用户希望Google停止强制将AI塞进搜索结果,只想看到干净的链接。 本期播客由Kirsten Korosec、Anthony Ha和Sean O Kane主持,深入探讨了当“AI狂热派”和“AI怀疑派”同时正确时会发生什么。此外,还讨论了三个值得关注的交易:Waymo在凤凰城推出的全新Ojai机器人出租车及其盈利路径、云数据巨头Snowflake与AWS签署的60亿美元五年协议、反亚马逊的物流初创公司Stord以30亿美元估值融资2.5亿美元,以及AI代理浪潮如何真正重塑招聘格局,而非仅仅是裁员。 ## AI代理:效率提升还是岗位杀手? ClickUp的裁员是AI替代人类工作的典型案例。该公司声称AI代理可以完成此前由员工承担的任务,因此决定削减22%的劳动力。然而,Levie指出,这种决策往往由高层做出,他们并不理解基层工作的复杂性和细微差别。这种“AI精神病”表现为一种盲目相信AI能解决一切问题的倾向,而忽略了实际业务中的人为因素。 ## 用户的反抗:逃离AI搜索 DuckDuckGo的崛起反映了用户对AI过度侵入搜索体验的厌倦。Google在搜索结果中强制集成AI摘要,导致用户无法获得传统的纯链接结果。DuckDuckGo强调隐私和简洁,正好迎合了这部分用户的需求。这表明,尽管AI技术发展迅速,但并非所有用户都买账。 ## Waymo的新车与盈利之路 Waymo在凤凰城推出了名为Ojai的新一代机器人出租车。Kirsten Korosec首次体验了这款车,并分享了她的第一印象。同时,团队讨论了Waymo如何实现盈利——随着车队规模扩大和运营成本降低,自动驾驶出租车业务有望在2026年实现正现金流。 ## Snowflake与AWS的60亿大单 云数据仓库公司Snowflake与AWS签署了为期五年的合作协议,总价值60亿美元。这笔交易表明,企业级云服务市场仍在快速增长,而Snowflake正通过深度绑定AWS来巩固其市场地位。 ## Stord:反亚马逊的物流独角兽 物流初创公司Stord以30亿美元估值融资2.5亿美元,其定位是“反亚马逊”——为中小电商提供灵活的仓储和配送服务,而非依赖亚马逊的物流网络。这反映了电商基础设施领域的新趋势:品牌希望摆脱对巨头的依赖。 ## OpenRouter:AI基础设施的“镐和铲” OpenRouter以1.13亿美元融资引起关注。作为AI模型路由平台,它帮助开发者选择最合适的模型来执行任务。这属于AI基础设施层,在热潮中往往能获得稳定回报,但长期兴趣能持续多久仍是未知数。 ## AI代理如何重塑招聘? 播客最后讨论了AI代理对就业市场的实际影响。虽然AI取代了一些岗位,但也创造了新的需求,比如AI训练师、提示工程师和模型部署专家。Levie认为,企业应该更关注如何利用AI增强员工能力,而非简单地替换他们。 本期《Equity》播客已在YouTube、Apple Podcasts、Overcast、Spotify等平台上线,欢迎订阅收听。
## 倒计时开始:你的最后省钱机会 **TechCrunch Disrupt 2026** 的早鸟优惠即将结束。你仅剩今晚(太平洋时间 11:59 PM)之前锁定最高 **$410** 的折扣。如果你一直犹豫是否参加这场科技盛会,现在就是做出决定的最佳时机——一旦错过,票价将立即上涨。 ### 活动亮点 - **时间与地点**:2026 年 10 月 13–15 日,旧金山 Moscone West。 - **参与规模**:预计吸引 **10,000+** 创始人、投资人、运营者和创新者。 - **折扣福利**:携带同伴可享 **50%** 折扣,团体购票最高 **30%** 优惠。 ## 为什么 Disrupt 值得每年参加? TechCrunch Disrupt 是创业加速器,汇聚了 AI、金融科技、SaaS、气候、网络安全、消费科技等领域的实干家。参与者可以: - **直接接触**正在行动的投资者、创始人和运营者 - **促成**合作、融资和招聘对话 - **获取**来自规模化公司领导者的实战洞见 - **抢先了解**即将主流的创新技术 活动包含 **300+** 家参展初创公司、**Startup Battlefield 200** 竞赛、精心策划的社交环节以及多个主题舞台,旨在帮助与会者建立有意义的联系并推动实际业务进展。 ## 谁应该参加? - **创始人**:寻找资本和合作伙伴 - **投资人**:发掘优质项目 - **运营者**:学习规模化经验 - **创新者**:追踪技术前沿 ### 演讲嘉宾阵容 每年 Disrupt 都邀请数百位行业领袖。往届嘉宾来自塑造 AI、企业软件、金融科技等领域未来的顶级公司。今年将延续高水准,推出 **200+** 场会议,涵盖六大行业舞台,以及关于规模化、AI、基础设施、机器人等主题的圆桌讨论。 ## 立即行动 **最后提醒**:今晚 11:59 PM PT 前注册,即可享受早鸟价。之后价格将上调。点击下方链接,锁定你的席位: [立即注册](https://techcrunch.com/2025/06/13/final-24-hours-to-save-up-to-410-on-your-techcrunch-disrupt-2026-ticket/)