Amazon SageMaker AI 集成 MLflow v3.10,助力生成式 AI 开发
Amazon SageMaker AI 今日宣布其 MLflow Apps 现已支持 MLflow v3.10,为生成式 AI 工作流带来增强的实验追踪、可观测性和评估能力。本次更新聚焦于生成式 AI 应用与智能体工作流的特殊需求,新增了针对多轮对话的追踪、与主流大模型框架的集成,以及通过 mlflow.genai.evaluation() API 实现系统性质量评估。此外,可观测性方面引入了更细粒度的追踪过滤、丰富的元数据捕获和预置性能仪表盘,帮助团队直观监控延迟、质量评分和 Token 用量等指标。结合 SageMaker AI 的企业级基础设施,MLflow v3.10 让数据科学家和 ML 工程师能够更高效地将生成式 AI 从实验推向生产,同时保持治理与可重复性。
新特性亮点
生成式 AI 追踪与集成
MLflow 3.10 显著提升了复杂多轮工作流的追踪能力,与 LangChain、LlamaIndex 等流行 LLM 框架的集成更加紧密,日志记录也针对生成式 AI 交互进行了优化。这意味着开发者可以更清晰地追溯每次推理的完整上下文,便于调试和优化。
系统性评估:mlflow.genai.evaluation()
新引入的程序化评估接口支持在开发到生产的全生命周期中,使用内置指标(如相关性、忠实度、正确性、安全性)系统衡量生成式 AI 质量。这些指标与 SageMaker AI 工作流无缝集成,为模型迭代提供量化依据。
可观测性升级
- 更精细的追踪过滤与搜索:快速定位特定请求或异常。
- 丰富的元数据捕获:辅助根因分析和调试。
- 预置性能仪表盘:自动展示延迟分布、请求量、质量分数和 Token 用量,无需手动配置图表。
这些改进帮助生产团队一目了然地掌握运营成本与性能状况,而 MLflow 工作空间则支持跨团队和项目组织工件,实现结构化治理。
如何开始
用户可以通过 Amazon SageMaker AI 控制台直接启用支持 MLflow 3.10 的 MLflow Apps,现有工作流可平滑升级。具体步骤可参考 AWS 官方文档。
行业意义
随着生成式 AI 应用进入生产化阶段,实验管理、可观测性和评估成为关键瓶颈。MLflow 3.10 在 SageMaker AI 上的落地,意味着开发者可以在一个统一平台上完成从实验追踪、模型评估到生产监控的全流程,无需切换工具。此举进一步降低了生成式 AI 开发的门槛,尤其适合需要快速迭代和严格治理的企业场景。