baar-core
producthunt.com
在 LLM API 账单产生前拦截,而非事后补救
19天前制作者:Robat Das
关于 baar-core
产品概述
baar-core 是一个轻量级的 Python 库,专为 LLM 应用开发者设计,旨在从源头杜绝意外的高额 API 费用。它通过在每次 API 调用前检查预算,一旦超限立即在本地抛出异常,从而避免任何网络连接和费用产生。
核心功能
预算前置检查
在每次调用 LLM API 之前,baar-core 会实时检查当前预算使用情况。如果超出预设上限,它会立即在本地抛出异常,阻止任何 DNS 查询或 TCP 连接,确保零费用产生。
语义路由降本
通过内置的语义路由机制,baar-core 能够智能地将请求路由到成本更低的模型或服务,平均可降低 84% 的 API 调用成本。
按用户配额管理
支持基于 SQLite 的按用户配额管理,可为不同用户或会话设置独立的预算上限,实现精细化的成本控制。
主要特性
- 零网络开销:预算检查完全在本地完成,不产生任何网络请求。
- 即插即用:与 LangGraph、FastAPI 等主流框架无缝集成,只需几行代码即可启用。
- MIT 开源许可:完全免费,可自由使用和修改。
- 轻量级:通过
pip install baar-core即可安装,无复杂依赖。
适用场景
- 开发 LLM 驱动的自动化 Agent,防止因循环或异常导致巨额账单。
- 多用户 SaaS 平台,需要为每个用户设置独立的 API 调用预算。
- 对成本敏感的 AI 应用,希望在不牺牲功能的前提下大幅降低 API 支出。