限制
限制
当前工程中已经落地的限制机制不是传统固定 QPS 限流,而是 API Key 额度、策略约束和钱包余额预检查。客户端文档需要按这些真实行为来写。
如果后续 gateway 增加每分钟请求数、并发数或 token-per-minute 限制,再把它补进本页。目前不要承诺固定 QPS、RPM 或 TPM 配额。
当前执行的限制
钱包回退
当请求使用 model: "auto" 或省略 model 时,JoyToken 可以在余额不足时尝试换 tier 重新路由。当前候选顺序是:
如果请求指定了具体模型,网关不会为了余额不足自动改成其他模型。
客户端处理建议
指数退避示例
retry.ts
对 402 和 403 做无限重试通常只会放大流量,应该先修正账户、策略或请求配置。