Amazon SageMaker AI 集成 MLflow v3.10 助力生成式 AI 开发

Amazon SageMaker AI 今日宣布其 MLflow Apps 现已支持 MLflow v3.10，为生成式 AI 工作流带来增强的实验追踪、可观测性和评估能力。本次更新聚焦于生成式 AI 应用与智能体工作流的特殊需求，新增了针对多轮对话的追踪、与主流大模型框架的集成，以及通过 mlflow.genai.evaluation() API 实现系统性质量评估。此外，可观测性方面引入了更细粒度的追踪过滤、丰富的元数据捕获和预置性能仪表盘，帮助团队直观监控延迟、质量评分和 Token 用量等指标。结合 SageMaker AI 的企业级基础设施，MLflow v3.10 让数据科学家和 ML 工程师能够更高效地将生成式 AI 从实验推向生产，同时保持治理与可重复性。

新特性亮点

生成式 AI 追踪与集成

MLflow 3.10 显著提升了复杂多轮工作流的追踪能力，与 LangChain、LlamaIndex 等流行 LLM 框架的集成更加紧密，日志记录也针对生成式 AI 交互进行了优化。这意味着开发者可以更清晰地追溯每次推理的完整上下文，便于调试和优化。

系统性评估：`mlflow.genai.evaluation()`

新引入的程序化评估接口支持在开发到生产的全生命周期中，使用内置指标（如相关性、忠实度、正确性、安全性）系统衡量生成式 AI 质量。这些指标与 SageMaker AI 工作流无缝集成，为模型迭代提供量化依据。

可观测性升级

更精细的追踪过滤与搜索：快速定位特定请求或异常。
丰富的元数据捕获：辅助根因分析和调试。
预置性能仪表盘：自动展示延迟分布、请求量、质量分数和 Token 用量，无需手动配置图表。

这些改进帮助生产团队一目了然地掌握运营成本与性能状况，而 MLflow 工作空间则支持跨团队和项目组织工件，实现结构化治理。

如何开始

用户可以通过 Amazon SageMaker AI 控制台直接启用支持 MLflow 3.10 的 MLflow Apps，现有工作流可平滑升级。具体步骤可参考 AWS 官方文档。

行业意义

随着生成式 AI 应用进入生产化阶段，实验管理、可观测性和评估成为关键瓶颈。MLflow 3.10 在 SageMaker AI 上的落地，意味着开发者可以在一个统一平台上完成从实验追踪、模型评估到生产监控的全流程，无需切换工具。此举进一步降低了生成式 AI 开发的门槛，尤其适合需要快速迭代和严格治理的企业场景。

Amazon SageMaker AI 集成 MLflow v3.10，助力生成式 AI 开发

新特性亮点

生成式 AI 追踪与集成

系统性评估：`mlflow.genai.evaluation()`

可观测性升级

如何开始

行业意义

延伸阅读

相关资讯

Amazon SageMaker AI 集成 MLflow v3.10，助力生成式 AI 开发

新特性亮点

生成式 AI 追踪与集成

系统性评估：mlflow.genai.evaluation()

可观测性升级

如何开始

行业意义

延伸阅读

相关资讯

系统性评估：`mlflow.genai.evaluation()`