「Probably」获900万美元融资,打造更可靠的AI系统
AI 幻觉与事实性错误一直是制约大语言模型落地的核心瓶颈。近日,一家名为 Probably 的初创公司宣布获得 900 万美元 种子轮融资,试图从根源上解决这一问题——其目标是构建一种“更可靠”的 AI,让准确性达到与传统确定性系统相当的水平。
核心问题:AI 的“不确定性”之痛
当前主流的大语言模型(如 GPT-4、Claude 等)本质上是概率系统,每次输出都可能不同,甚至产生与事实相悖的“幻觉”。这种不可靠性在医疗、金融、法律等高风险领域尤为致命,直接阻碍了 AI 的规模化应用。Probably 的创始人认为,现有技术路线过度依赖“规模扩大带来能力提升”,而忽视了系统性的可靠性设计。
技术路径:从“概率”走向“确定性”
Probably 并没有公开其技术细节,但从官方描述来看,其核心思路是构建一个 可验证、可解释的推理框架,而非单纯依赖更大的模型或更多的数据。具体方向可能包括:
- 结构化知识约束:将外部知识库与模型输出进行实时校验,阻断幻觉传播。
- 形式化验证:对模型推理过程进行数学层面的正确性检查,类似软件工程中的单元测试。
- 混合架构:结合符号推理与神经网络,让 AI 在关键决策点上具备确定性。
这种思路与近年来兴起的“神经符号系统”和“可解释 AI”趋势一脉相承,但 Probably 更强调 输出结果的绝对可靠性,而非仅仅提升平均准确率。
市场与竞品:一条少有人走的路
目前,大多数 AI 公司选择通过“人类反馈强化学习(RLHF)”或“检索增强生成(RAG)”来减少幻觉,但这些方法都无法从根本上消除错误。Probably 的差异化在于将“可靠性”作为第一性原理,甚至愿意为此牺牲部分灵活性或创造性。
其潜在竞争对手包括:
- Vectara:提供可解释的检索增强生成服务。
- Glean:企业搜索领域的可靠性探索。
- Anthropic 的“宪法 AI”路线,但更偏向对齐而非确定性。
融资背景与团队
本轮融资由 XYZ Capital 领投,多家知名 AI 基金跟投。创始人曾深度参与过自动驾驶和工业质检系统的可靠性工程,深知“99% 准确率”与“99.999% 准确率”之间的鸿沟。他们表示,“AI 不应是一个黑箱,而应是一台可被审计的机器”。
行业启示
Probably 的融资信号表明,资本正在从“模型规模竞赛”转向“可靠性基建”。当 GPT-5、Claude 4 等大模型的能力逼近天花板时,如何让 AI 安全、可信地落地 反而成为更紧迫的命题。如果 Probably 能证明其技术路线可行,可能会催生一个全新的“确定性 AI”细分赛道,甚至倒逼主流大模型厂商在可靠性上加大投入。
当然,这条路挑战重重:如何平衡准确性与通用性?如何避免过度约束导致的“能力降级”?答案或许在未来 12-18 个月的公开演示中逐渐浮现。