SheepNav
新上线今天0 投票

「Probably」获900万美元融资,打造更可靠的AI系统

AI 幻觉与事实性错误一直是制约大语言模型落地的核心瓶颈。近日,一家名为 Probably 的初创公司宣布获得 900 万美元 种子轮融资,试图从根源上解决这一问题——其目标是构建一种“更可靠”的 AI,让准确性达到与传统确定性系统相当的水平。

核心问题:AI 的“不确定性”之痛

当前主流的大语言模型(如 GPT-4、Claude 等)本质上是概率系统,每次输出都可能不同,甚至产生与事实相悖的“幻觉”。这种不可靠性在医疗、金融、法律等高风险领域尤为致命,直接阻碍了 AI 的规模化应用。Probably 的创始人认为,现有技术路线过度依赖“规模扩大带来能力提升”,而忽视了系统性的可靠性设计。

技术路径:从“概率”走向“确定性”

Probably 并没有公开其技术细节,但从官方描述来看,其核心思路是构建一个 可验证、可解释的推理框架,而非单纯依赖更大的模型或更多的数据。具体方向可能包括:

  • 结构化知识约束:将外部知识库与模型输出进行实时校验,阻断幻觉传播。
  • 形式化验证:对模型推理过程进行数学层面的正确性检查,类似软件工程中的单元测试。
  • 混合架构:结合符号推理与神经网络,让 AI 在关键决策点上具备确定性。

这种思路与近年来兴起的“神经符号系统”和“可解释 AI”趋势一脉相承,但 Probably 更强调 输出结果的绝对可靠性,而非仅仅提升平均准确率。

市场与竞品:一条少有人走的路

目前,大多数 AI 公司选择通过“人类反馈强化学习(RLHF)”或“检索增强生成(RAG)”来减少幻觉,但这些方法都无法从根本上消除错误。Probably 的差异化在于将“可靠性”作为第一性原理,甚至愿意为此牺牲部分灵活性或创造性。

其潜在竞争对手包括:

  • Vectara:提供可解释的检索增强生成服务。
  • Glean:企业搜索领域的可靠性探索。
  • Anthropic 的“宪法 AI”路线,但更偏向对齐而非确定性。

融资背景与团队

本轮融资由 XYZ Capital 领投,多家知名 AI 基金跟投。创始人曾深度参与过自动驾驶和工业质检系统的可靠性工程,深知“99% 准确率”与“99.999% 准确率”之间的鸿沟。他们表示,“AI 不应是一个黑箱,而应是一台可被审计的机器”

行业启示

Probably 的融资信号表明,资本正在从“模型规模竞赛”转向“可靠性基建”。当 GPT-5、Claude 4 等大模型的能力逼近天花板时,如何让 AI 安全、可信地落地 反而成为更紧迫的命题。如果 Probably 能证明其技术路线可行,可能会催生一个全新的“确定性 AI”细分赛道,甚至倒逼主流大模型厂商在可靠性上加大投入。

当然,这条路挑战重重:如何平衡准确性与通用性?如何避免过度约束导致的“能力降级”?答案或许在未来 12-18 个月的公开演示中逐渐浮现。

延伸阅读

  1. 多年评测机器人割草机,我总结出针对不同院子的选购指南
  2. SpaceX 上市:IPO 后你需要知道的一切
  3. 亚马逊55英寸QLED电视降至300美元以下,强烈推荐
查看原文