一句话选型结论:Scutum 更适合希望在自有基础设施上运行 LLM gateway,并把审计、成本和路由放进统一控制面的团队。
Scutum 是什么?
Scutum 官网将其定位为 self-hosted LLM gateway,强调 audit、routing 和 cost governance。它适合对数据边界和本地控制有要求的团队,用一个 OpenAI 兼容端点统一管理多模型调用。
从方向舵的收录角度,它属于“模型网关与 API 路由”,重点看是否能用正规的方式统一多模型调用、路由策略、成本监控、失败兜底和日志审计,而不是把它当作共享 Key 或低价 token 中转服务。
我能拿它做什么?
| 使用目标 | 可尝试的用法 | 选型时先确认 |
|---|---|---|
| 自托管网关 | 在自己的基础设施上运行 LLM gateway。 | 部署、升级、备份和监控是否有负责人。 |
| 审计日志 | 记录模型请求、策略和关键事件。 | 日志保留、脱敏和权限是否符合要求。 |
| 成本治理 | 按模型、项目或 key 追踪成本。 | 能否对应到真实业务维度。 |
| 统一路由 | 把多个模型放到一个入口后面。 | 是否支持你当前供应商和调用方式。 |
适合哪些人?
- 对第三方托管日志不放心的 AI SaaS 团队。
- 有自托管运维能力的小团队。
- 需要审计、路由和成本治理合在一起的后端团队。
- 希望保留模型调用控制权的技术型创始人。
价格和隐藏成本怎么看?
公开页面未稳定提取到完整价格表,选型时应确认免费额度、团队席位、调用量、日志保留、企业功能和支持方式。
| 成本项 | 判断方法 |
|---|---|
| 平台费用 | 确认免费额度、团队版、企业版和是否按调用量、日志量或席位计费。 |
| 模型费用 | 模型网关通常不会消除底层模型成本,要单独计算各模型供应商账单。 |
| 迁移成本 | 查看是否兼容 OpenAI 风格 API、是否支持 BYOK、是否容易替换供应商。 |
| 治理成本 | 关注 API Key 权限、限流、日志保留、审计和敏感数据遮罩。 |
和同类工具比看什么?
- 自托管带来控制权,也带来维护责任。
- 和 Routerly、LiteLLM 相比,重点看审计和成本治理能力。
- OpenAI 兼容端点是否覆盖你的高级参数。
- 生产前要压测延迟、失败率和日志完整性。
- 价格和许可方式以官方最新说明为准。
不适合的情况
- 只是想找低价 token、共享 Key、账号拼车或绕过平台限制的服务。
- 无法确认服务主体、隐私政策、服务条款、日志保存和数据处理方式。
- 业务会把敏感用户数据、支付信息或内部密钥直接交给第三方且没有审计流程。
- 当前只是个人临时测试,不需要统一路由、限流、日志和成本控制。
合规收录边界
- 只收录正规模型网关、API 路由、BYOK、多模型聚合、限流、日志、审计和成本监控工具。
- 不收录共享 Key、低价 token 倒卖、代充、拼车号、镜像绕限制、免实名或灰产用途服务。
- 涉及用户数据、API Key、日志和跨境服务时,必须提示自行核对服务条款、隐私政策和数据边界。
本站按“模型网关与 API 路由”口径收录,不按“token 中转站”口径收录。使用前请自行确认服务条款、账号合规、数据处理方式、日志保存策略和所在地法律要求。
低风险试用建议
先使用测试 Key、低风险 prompt 和小流量请求验证路由、失败返回、日志脱敏、预算上限和切换供应商流程。通过后,再把生产流量逐步接入,并保留回滚方案。
页面更新时间:2026-06-07
LiteLLM 主要用于统一多模型 API 调用、路由、fallback、日志、限流和成本追踪。LiteLLM 主要用于统一多模型 API 调用、路由、fallback、日志、限流和成本追踪。LiteLLM 主要用于统一多模型 API… 选择前重点看价格、上手门槛、风险和替代方案。