为规模与管控而生
一个网关,统管所有 LLM 流量。
一次集成,50+ 模型
无需修改代码即可切换供应商或模型。兼容 OpenAI 的 API,支持 Claude、Gemini 等主流模型。
📱
统一接口
API
网关
网关
GPT-4o
Claude 3.5
Gemini Pro
Llama 3
Qwen 2.5
DeepSeek
用量、配额与费用管控
按密钥和模型追踪用量,设置限额与预算,让成本可预测。
用量概览本月
¥2.8k
GPT-4o59%¥1,662
Claude 3.525%¥702
其他16%¥483
配额使用128K / 200K 请求
安全与鉴权
API 密钥、RBAC 权限与审计日志,凭证和流量尽在掌控。
密钥与权限安全
密钥名称权限状态
prod-main全部模型活跃
dev-testGPT-4o活跃
analytics只读活跃
old-key-01—已吊销
审计日志
14:32:01prod-main 调用 gpt-4o
14:31:58dev-test 调用 claude-3.5
14:31:45old-key-01 已吊销
14:30:22analytics 权限变更为只读
一个网关,一切就绪
计费、限流、鉴权与可观测性,无需胶水代码。
统一 API
兼容 OpenAI 接口,只需修改一行配置即可切换模型。
用量与分析
按密钥、按模型查看用量、延迟和费用仪表盘。
模型路由
按模型名称路由或设置回退链,轻松进行供应商 A/B 测试。
密钥管理
创建和吊销 API 密钥,支持细粒度权限和配额。
缓存加速
可选的响应缓存,减少重复请求的延迟和成本。
Webhooks 通知
在用量事件、限额触发或异常时通知您的系统。