ScaleOps 融资 1.3 亿美元,旨在 AI 需求激增背景下提升计算效率
随着 AI 浪潮席卷全球,企业正面临 GPU 短缺和云成本飙升的双重压力。然而,初创公司 ScaleOps 认为,问题的核心并非资源不足,而是资源管理不善。该公司近日宣布完成 1.3 亿美元 C 轮融资,估值达到 8 亿美元,由 Insight Partners 领投,Lightspeed Venture Partners、NFX 等现有投资者跟投。
融资详情与市场背景
ScaleOps 成立于 2022 年,由前 Run:ai(已被英伟达收购)工程师 Yodar Shafrir 联合创立。本轮融资正值 AI 基础设施需求爆炸性增长之际,许多企业尽管投入巨资购买 GPU 和云服务,却因资源利用率低下而承受着高昂的浪费。Shafrir 指出,公司在 Run:ai 期间接触了大量客户,尤其是 DevOps 团队,发现他们在管理生产负载,特别是 AI 推理任务时,仍面临巨大挑战。
核心问题:静态配置与动态需求脱节
当前,许多企业依赖 Kubernetes 等工具来管理计算集群,但这些系统通常基于静态配置运行。在 AI 工作负载快速变化的环境中,这种模式导致了一系列问题:
- GPU 闲置:资源分配未能实时匹配应用需求,造成昂贵硬件利用率不足。
- 过度配置:为应对峰值负载,团队往往预留过多资源,推高了云成本。
- 跨团队协调低效:DevOps 人员常需多方沟通才能调整资源,响应迟缓且容易出错。
Shafrir 强调:“问题不仅限于 GPU,它延伸到计算、内存、存储和网络等整个基础设施层面。相同的低效模式不断重复——团队未能高效管理资源。”
ScaleOps 的解决方案:实时自动化管理
ScaleOps 的软件平台旨在填补现有工具的“只发现问题、不提供解决方案”的缺口。其核心能力包括:
- 实时资源重分配:自动监控应用需求,动态调整计算、内存和存储资源,减少闲置。
- 端到端自主管理:从应用需求感知到基础设施决策,实现全流程自动化,无需人工干预。
- 上下文感知优化:系统能理解每个应用的特定场景,做出更精准的资源调度。
据公司称,该平台可将云和 AI 基础设施成本降低高达 80%,这对于动辄每月数百万美元云支出的 AI 企业而言,意义重大。
行业影响与未来展望
在 AI 竞赛白热化的今天,效率已成为核心竞争力之一。ScaleOps 的融资成功反映了市场对智能资源管理工具的迫切需求。随着更多企业从 AI 训练转向推理部署,工作负载的波动性将加剧,传统静态管理方式的局限性会进一步凸显。
Shafrir 表示:“Kubernetes 是一个优秀的系统,灵活且可配置性强,但这也正是问题所在。当应用变得高度动态时,依赖静态配置会导致持续的跨团队手动工作。我们需要的是能理解应用上下文、自动适应的解决方案。”
小结
ScaleOps 的崛起并非偶然,它直击了 AI 规模化落地中的关键痛点——资源效率。在 GPU 紧缺和成本压力并存的背景下,通过自动化提升基础设施利用率,不仅有助于企业降本增效,也可能缓解整个行业的算力焦虑。随着 1.3 亿美元资金的注入,ScaleOps 有望加速产品迭代和市场扩张,为更多企业提供“看不见”却至关重要的效率引擎。