一句话选型结论:Not Diamond 更适合已经有多模型选择需求、并希望用路由策略降低成本或提升准确率的 AI 产品团队。
Not Diamond 是什么?
Not Diamond 官网强调 intelligent AI model router,核心场景是帮助团队在多个模型之间做更合适的选择。它不是低价 token 中转,而是把模型选择、成本和效果权衡放进调用链里的路由层。
从方向舵的收录角度,它属于“模型网关与 API 路由”,重点看是否能用正规的方式统一多模型调用、路由策略、成本监控、失败兜底和日志审计,而不是把它当作共享 Key 或低价 token 中转服务。
我能拿它做什么?
| 使用目标 | 可尝试的用法 | 选型时先确认 |
|---|---|---|
| 选择更合适的模型 | 根据任务类型、成本或质量要求,把请求路由到不同模型。 | 是否能解释路由依据,并支持你使用的模型列表。 |
| 降低 Agent 成本 | 避免每个任务都默认调用最贵模型。 | 节省成本是否会牺牲关键场景的准确率。 |
| 做模型实验 | 比较不同模型在真实任务上的表现。 | 是否有足够日志和评估数据支撑选择。 |
| 生产路由治理 | 把模型选择策略从业务代码里抽离出来。 | 权限、日志、fallback 和回滚方案是否明确。 |
适合哪些人?
- 已经同时使用多个前沿模型、并希望自动选择模型的 AI Agent 团队。
- 模型成本开始影响毛利,需要在质量和成本之间做细粒度权衡的产品。
- 有真实评测数据,愿意持续校准路由策略的工程团队。
- 希望把模型选择从人工判断变成可测试流程的小团队。
价格和隐藏成本怎么看?
公开页面未稳定提取到完整价格表,选型时应确认免费额度、团队席位、调用量、日志保留、企业功能和支持方式。
| 成本项 | 判断方法 |
|---|---|
| 平台费用 | 确认免费额度、团队版、企业版和是否按调用量、日志量或席位计费。 |
| 模型费用 | 模型网关通常不会消除底层模型成本,要单独计算各模型供应商账单。 |
| 迁移成本 | 查看是否兼容 OpenAI 风格 API、是否支持 BYOK、是否容易替换供应商。 |
| 治理成本 | 关注 API Key 权限、限流、日志保留、审计和敏感数据遮罩。 |
和同类工具比看什么?
- 它更偏模型路由优化,而不是完整 LLMOps 或通用观测平台。
- 路由策略是否能和你的评测集、业务指标和成本目标结合。
- 是否支持关键模型供应商、fallback 和日志导出。
- 如果模型质量波动,团队是否能快速回滚到固定模型。
- 和 OpenRouter、LiteLLM、Portkey 相比,是否更适合你的路由精度需求。
不适合的情况
- 只是想找低价 token、共享 Key、账号拼车或绕过平台限制的服务。
- 无法确认服务主体、隐私政策、服务条款、日志保存和数据处理方式。
- 业务会把敏感用户数据、支付信息或内部密钥直接交给第三方且没有审计流程。
- 当前只是个人临时测试,不需要统一路由、限流、日志和成本控制。
合规收录边界
- 只收录正规模型网关、API 路由、BYOK、多模型聚合、限流、日志、审计和成本监控工具。
- 不收录共享 Key、低价 token 倒卖、代充、拼车号、镜像绕限制、免实名或灰产用途服务。
- 涉及用户数据、API Key、日志和跨境服务时,必须提示自行核对服务条款、隐私政策和数据边界。
本站按“模型网关与 API 路由”口径收录,不按“token 中转站”口径收录。使用前请自行确认服务条款、账号合规、数据处理方式、日志保存策略和所在地法律要求。
低风险试用建议
先使用测试 Key、低风险 prompt 和小流量请求验证路由、失败返回、日志脱敏、预算上限和切换供应商流程。通过后,再把生产流量逐步接入,并保留回滚方案。
页面更新时间:2026-06-05
Nucleus AI Gateway 是面向 AI 应用的网关候选,适合评估统一入口、模型访问、治理边界和生产接入成本。