一句话选型结论:Pellet AI 更适合希望把请求路由到足够小但仍能完成任务的模型,以降低成本的团队。
Pellet AI 是什么?
Pellet AI 官网强调 intelligent LLM routing 和 smallest capable open-source model,提供 OpenAI-compatible API、auto-routing 和 analytics。它适合把模型选择做成成本与质量的持续实验。
从方向舵的收录角度,它属于“模型网关与 API 路由”,重点看是否能用正规的方式统一多模型调用、路由策略、成本监控、失败兜底和日志审计,而不是把它当作共享 Key 或低价 token 中转服务。
我能拿它做什么?
| 使用目标 | 可尝试的用法 | 选型时先确认 |
|---|---|---|
| 降低模型成本 | 把简单任务交给更小模型。 | 需要用真实任务验证质量是否足够。 |
| 自动路由 | 让系统自动选择合适模型。 | 是否能解释选择依据和失败回退。 |
| 兼容 API | 用 OpenAI 兼容方式减少接入成本。 | 高级参数和错误语义是否兼容。 |
| 分析效果 | 观察不同模型的成本和表现。 | 分析维度是否支持产品决策。 |
适合哪些人?
- 模型调用量较高、希望降低成本的 AI 应用团队。
- 有评测数据,可以验证小模型是否够用的开发者。
- 想把模型路由作为长期优化项的小团队。
- 关注开源模型和成本效率的产品负责人。
价格和隐藏成本怎么看?
公开页面未稳定提取到完整价格表,选型时应确认免费额度、团队席位、调用量、日志保留、企业功能和支持方式。
| 成本项 | 判断方法 |
|---|---|
| 平台费用 | 确认免费额度、团队版、企业版和是否按调用量、日志量或席位计费。 |
| 模型费用 | 模型网关通常不会消除底层模型成本,要单独计算各模型供应商账单。 |
| 迁移成本 | 查看是否兼容 OpenAI 风格 API、是否支持 BYOK、是否容易替换供应商。 |
| 治理成本 | 关注 API Key 权限、限流、日志保留、审计和敏感数据遮罩。 |
和同类工具比看什么?
- 低成本不能牺牲关键任务质量,要先定义验收标准。
- 和 Not Diamond 相比,重点看路由目标和模型覆盖。
- 和 RouteLLM 相比,重点看托管便利和可控制权。
- 生产前保留固定强模型回退。
- 价格、模型列表和数据处理以官方最新说明为准。
不适合的情况
- 只是想找低价 token、共享 Key、账号拼车或绕过平台限制的服务。
- 无法确认服务主体、隐私政策、服务条款、日志保存和数据处理方式。
- 业务会把敏感用户数据、支付信息或内部密钥直接交给第三方且没有审计流程。
- 当前只是个人临时测试,不需要统一路由、限流、日志和成本控制。
合规收录边界
- 只收录正规模型网关、API 路由、BYOK、多模型聚合、限流、日志、审计和成本监控工具。
- 不收录共享 Key、低价 token 倒卖、代充、拼车号、镜像绕限制、免实名或灰产用途服务。
- 涉及用户数据、API Key、日志和跨境服务时,必须提示自行核对服务条款、隐私政策和数据边界。
本站按“模型网关与 API 路由”口径收录,不按“token 中转站”口径收录。使用前请自行确认服务条款、账号合规、数据处理方式、日志保存策略和所在地法律要求。
低风险试用建议
先使用测试 Key、低风险 prompt 和小流量请求验证路由、失败返回、日志脱敏、预算上限和切换供应商流程。通过后,再把生产流量逐步接入,并保留回滚方案。
页面更新时间:2026-06-10
LocalRouter 提供本地 OpenAI 兼容 API 网关和智能模型路由,适合评估本地优先的多模型调用、成本优化和监控。