Patronus AI 获 5000 万美元融资,打造“数字世界”为 AI 智能体进行压力测试
AI 智能体正从简单的问答进化到自主执行多步复杂任务,但如何确保它们在实际场景中可靠运行,成为行业亟待解决的难题。由前 Meta AI 研究员创立的 Patronus AI 正致力于此——通过构建模拟数字环境来测试智能体的表现。近日,该公司宣布完成 5000 万美元 B 轮融资,领投方为 Greenfield Partners,跟投方包括 Notable Capital、Lightspeed、Datadog 和 Samsung,累计融资额达 7000 万美元。
需求“几乎难以满足”
Patronus 的投资者、Notable Capital 董事总经理 Glenn Solomon 表示,几乎所有前沿 AI 实验室和众多新兴初创公司都已成为其客户,对模拟环境的需求“几乎难以满足”。过去一年,公司营收增长了 15 倍,吸引了大量投资者关注。
数字世界模型:让智能体在虚拟环境中试错
Patronus 的核心技术是“数字世界模型”,即创建网站和内部系统的数字副本。在这些模拟环境中,智能体通过强化学习进行训练后的压力测试:系统会因成功完成任务而获得奖励,因出错而受到惩罚。这种方法类似于 Waymo 训练自动驾驶汽车的方式——先在合成世界中测试车辆应对罕见危险(如恶劣天气或儿童追球)的能力。不同之处在于,AI 智能体倾向于“走捷径”,导致未能正确完成任务。Solomon 指出:“Patronus 非常擅长发现这些‘作弊’行为,并确保模型承担责任。”
从软件工程和金融起步
目前,Patronus 的模拟数字世界主要应用于软件工程和金融领域,但这只是开始。联合创始人 Anand Kannappan 表示,公司未来将拓展更多行业。随着 AI 智能体被用于订票、财务分析等关键任务,确保其可靠性变得至关重要。Patronus 的解决方案填补了传统基准测试的空白——高分并不代表实际工作能力,而模拟环境提供了更真实的评估手段。
行业意义
Patronus 的快速成长反映出 AI 行业对安全性和可靠性的迫切需求。随着智能体自主性增强,错误可能带来严重后果。通过构建可重复、可扩展的测试环境,Patronus 不仅帮助开发者改进模型,也为企业部署 AI 智能体提供了信任基础。这一轮融资将用于扩大团队、拓展场景,并加速产品迭代。
