QuickSilver Pro vs OpenRouter
对于 7 个热门开源 LLM(DeepSeek V4 Flash 与 Pro、V3、R1、Qwen 3.6 与 3.5-35B-A3B、Kimi K2.6),QuickSilver Pro 的公开单 token 价格大约比 OpenRouter 低 20%,而且仍然保持相同的 OpenAI-compatible API,迁移只要两行。对于闭源模型(GPT-4、Claude)或长尾模型,OpenRouter 依然是更合适的工具。
快速概览
| 特性 | QuickSilver Pro | openrouter |
|---|---|---|
| 模型目录中的共享部分 | 9 个(DeepSeek V4 Flash + Pro、V3、R1、Qwen 3.7 Max + 3.6 Plus + 3.6 + 3.5-35B-A3B、Kimi K2.6) | 300+ |
| 共享模型定价 | 比 OpenRouter 低 20% | 基准价 |
| OpenAI-compatible 接口 | 是 | 是 |
| Streaming / tools / json_schema | 是 | 是 |
| 响应中的 usage.cost | 是(合成值) | 是 |
| 按 key 的月消费上限 | 是 | 是 |
| 闭源模型(GPT-4、Claude) | 否 | 是 |
| 上线特惠 | 首次充值 100% 等额,最高 $50 | 有限的免费模型 |
| 最小充值金额 | $5 | $10 |
价格(每百万 tokens,USD)
公开挂牌价格,更新于 2026 年 4 月。
| 模型 | QSP 输入 | QSP 输出 | openrouter 输入 | openrouter 输出 | 节省 |
|---|---|---|---|---|---|
| DeepSeek V4 Flash | $0.08 | $0.16 | $0.10 | $0.20 | ~20% |
| DeepSeek V4 Pro | $0.348 | $0.696 | $0.435 | $0.87 | ~20% |
| DeepSeek V3 | $0.16 | $0.616 | $0.20 | $0.77 | ~20% |
| DeepSeek R1 | $0.56 | $2.00 | $0.70 | $2.50 | ~20% |
| Qwen3.6-35B-A3B | $0.12 | $0.80 | $0.15 | $1.00 | ~20% |
| Qwen3.5-35B-A3B | $0.111 | $0.80 | $0.139 | $1.00 | ~20% |
| Kimi K2.6 | $0.584 | $2.79 | $0.73 | $3.49 | ~20% |
迁移:只改两行
from openai import OpenAI
client = OpenAI(
base_url="https://api.quicksilverpro.io/v1",
api_key=os.environ["QSP_KEY"],
)
r = client.chat.completions.create(
model="deepseek-v3",
messages=[{"role": "user", "content": "Hi"}],
)常见问题
是的。对于 9 个共享的开源模型(DeepSeek V4 Flash + Pro、V3、R1、Qwen 3.7 Max + 3.6 Plus + 3.6 + 3.5-35B-A3B、Kimi K2.6),QuickSilver Pro 的公开单 token 价格大约低 20%。上面的定价表里有精确数字。
只改两行 OpenAI SDK 配置:把 base_url 从 openrouter.ai/api/v1 改成 api.quicksilverpro.io/v1,再替换 API key。模型 ID 去掉 provider 前缀即可,例如 deepseek/deepseek-v4-flash → deepseek-v4-flash,qwen/qwen3.6-35b-a3b → qwen3.6-35b,moonshotai/kimi-k2.6 → kimi-k2.6。
如果你的工作负载需要闭源模型(GPT-4、Claude、Gemini)、Llama、Mistral,或者更长尾的模型目录,那么 OpenRouter 更合适。QuickSilver Pro 只聚焦于 9 个开源模型,而 OpenRouter 提供 300+。
对于共享模型,基本一样。Streaming、tool / function calling、json_schema strict mode 和标准 usage 统计都能通过官方 OpenAI SDK 直接工作。每个响应还会返回一个按公开单 token 价格计算出的 usage.cost 合成值。
DeepSeek V4 Flash + Pro、Qwen 3.6/3.7 和 Kimi K2.6 在 OpenRouter 上都会默认开启 chain-of-thought,所以一句简单的“Hi”也可能返回数百个 reasoning tokens。对 DeepSeek V4 和 Kimi K2.6,我们原样透传请求:如需 V3 风格的低成本聊天,请在请求体里传 `reasoning: { enabled: false }`。对 Qwen 3.6/3.7 系列,网关已默认发送 `reasoning: { enabled: false }`——如需思考,传 `reasoning: { enabled: true }` 开启。现有 V3 仍保持不思考的行为。