
Aurko
aurko.com
将LLM API成本降低40-70%的AI网关
5天前制作者:Arnab Dutta
关于 Aurko
Aurko 是一款基于 Go 语言构建的超高速、轻量级 AI 缓存代理网关,专为削减 LLM API 成本而设计,可将费用降低 40-70%。它针对自主代理网络和递归工作流进行了优化,采用基于 Jaccard 指数的令牌归一化相似度匹配算法,精准拦截高频重复的系统提示和思维循环,直接从 Redis 缓存中提供服务,响应时间小于 1 毫秒,无需上游网络延迟。
核心功能
Aurko 的核心在于其智能缓存机制。它不仅能缓存完整的 API 响应,还能通过语义相似度匹配识别并复用高度相似的请求,从而大幅减少对 LLM 提供商的调用次数。无论是重复的系统提示、常见的用户查询,还是代理间的递归对话,Aurko 都能高效命中缓存,显著降低 API 调用成本。
主要特性
- 极速响应:基于 Go 语言开发,内存占用极低,缓存命中时响应时间小于 1 毫秒,几乎无额外延迟。
- 智能匹配:使用 Jaccard 指数进行令牌归一化相似度计算,准确识别重复或高度相似的请求,避免无效调用。
- 成本节省:典型场景下可降低 40-70% 的 LLM API 费用,尤其适合高频调用的自主代理和递归工作流。
- 轻量易部署:作为轻量级代理网关,可轻松集成到现有架构中,无需修改应用代码。
- Redis 后端:利用 Redis 实现高性能缓存,支持分布式部署和持久化。
适用场景
Aurko 特别适合以下场景:
- 自主代理网络:多个代理之间的频繁通信和重复查询。
- 递归工作流:需要多次调用 LLM 的复杂任务链。
- 高并发应用:需要低延迟和高吞吐量的实时 AI 应用。
- 成本敏感型项目:希望在不牺牲性能的前提下大幅降低 API 开支的团队。