SheepNav
精选今天0 投票

一家初创公司声称突破了制约大语言模型的数学瓶颈

一家名为 Subquadratic 的迈阿密 AI 初创公司上个月结束隐身模式,声称解决了近十年来制约大语言模型发展的一个数学瓶颈。起初细节有限,引发质疑,但该公司近日公布了第三方独立评估结果,为其主张提供了有力证据。

Subquadratic 宣称开发了一种名为 SubQ 的新型大语言模型,速度更快、成本更低、能耗更少。SubQ 能一次性处理多达普通模型 12 倍的文本量,适用于分析数百份文档或整个代码库等数据密集型任务。该公司还表示,SubQ 在编码等关键任务上的表现与 Google DeepMind、OpenAI 和 Anthropic 的最佳模型相当。

然而,Subquadratic 最初仅提供了少量自测分数,且未公开模型供外部试用,导致业界普遍持怀疑态度。AI 工程师 Dan McAteer 在 X 上评论道:“SubQ 要么是 Transformer 以来最大的突破,要么就是 AI 版的 Theranos。”

为回应质疑,Subquadratic 委托第三方评测公司 Appen 对 SubQ 进行独立测试。Appen 的生成式 AI 研究总监 Jeanine Sinanan-Singh 表示结果令人兴奋,验证了 SubQ 的架构,并称其“可能改变游戏规则”。她指出:“模型在速度和效率上一直存在问题,但当你看到这样惊人的结果时,确实需要反复确认。”

Subquadratic 联合创始人兼 CTO Alex Whedon 承认:“我们预料到会有健康的质疑。事后看来,如果在最初发布时就附带第三方基准测试,或许能避免许多怀疑。这也是我们今后会确保所有结果都经过充分验证再公开的原因。”

尽管 SubQ 尚未广泛开放,但第三方验证结果已为其可信度增添了重要砝码。若后续独立复现和实际应用能持续验证这些成果,Subquadratic 或将重塑大语言模型的效率与成本格局,推动 AI 行业进入新阶段。

延伸阅读

  1. 脑机接口人体试验加速推进:从实验室走向日常生活
  2. 指标的必然弱点:数据能揭示的,远不及它掩盖的
  3. DeXposure-Claw:面向DeFi风险监管的智能体系统
查看原文