首页/对比/vs openrouter
对比

QuickSilver Pro vs OpenRouter

对于 7 个热门开源 LLM(DeepSeek V4 Flash 与 Pro、V3、R1、Qwen 3.6 与 3.5-35B-A3B、Kimi K2.6),QuickSilver Pro 的公开单 token 价格大约比 OpenRouter 低 20%,而且仍然保持相同的 OpenAI-compatible API,迁移只要两行。对于闭源模型(GPT-4、Claude)或长尾模型,OpenRouter 依然是更合适的工具。

快速概览

特性QuickSilver Proopenrouter
模型目录中的共享部分9 个(DeepSeek V4 Flash + Pro、V3、R1、Qwen 3.7 Max + 3.6 Plus + 3.6 + 3.5-35B-A3B、Kimi K2.6)300+
共享模型定价比 OpenRouter 低 20%基准价
OpenAI-compatible 接口
Streaming / tools / json_schema
响应中的 usage.cost是(合成值)
按 key 的月消费上限
闭源模型(GPT-4、Claude)
上线特惠首次充值 100% 等额,最高 $50有限的免费模型
最小充值金额$5$10

价格(每百万 tokens,USD)

公开挂牌价格,更新于 2026 年 4 月。

模型QSP 输入QSP 输出openrouter 输入openrouter 输出节省
DeepSeek V4 Flash$0.08$0.16$0.10$0.20~20%
DeepSeek V4 Pro$0.348$0.696$0.435$0.87~20%
DeepSeek V3$0.16$0.616$0.20$0.77~20%
DeepSeek R1$0.56$2.00$0.70$2.50~20%
Qwen3.6-35B-A3B$0.12$0.80$0.15$1.00~20%
Qwen3.5-35B-A3B$0.111$0.80$0.139$1.00~20%
Kimi K2.6$0.584$2.79$0.73$3.49~20%

迁移:只改两行

修改后 · QuickSilver Pro
from openai import OpenAI

client = OpenAI(
    base_url="https://api.quicksilverpro.io/v1",
    api_key=os.environ["QSP_KEY"],
)

r = client.chat.completions.create(
    model="deepseek-v3",
    messages=[{"role": "user", "content": "Hi"}],
)

常见问题

是的。对于 9 个共享的开源模型(DeepSeek V4 Flash + Pro、V3、R1、Qwen 3.7 Max + 3.6 Plus + 3.6 + 3.5-35B-A3B、Kimi K2.6),QuickSilver Pro 的公开单 token 价格大约低 20%。上面的定价表里有精确数字。

只改两行 OpenAI SDK 配置:把 base_url 从 openrouter.ai/api/v1 改成 api.quicksilverpro.io/v1,再替换 API key。模型 ID 去掉 provider 前缀即可,例如 deepseek/deepseek-v4-flash → deepseek-v4-flash,qwen/qwen3.6-35b-a3b → qwen3.6-35b,moonshotai/kimi-k2.6 → kimi-k2.6。

如果你的工作负载需要闭源模型(GPT-4、Claude、Gemini)、Llama、Mistral,或者更长尾的模型目录,那么 OpenRouter 更合适。QuickSilver Pro 只聚焦于 9 个开源模型,而 OpenRouter 提供 300+。

对于共享模型,基本一样。Streaming、tool / function calling、json_schema strict mode 和标准 usage 统计都能通过官方 OpenAI SDK 直接工作。每个响应还会返回一个按公开单 token 价格计算出的 usage.cost 合成值。

DeepSeek V4 Flash + Pro、Qwen 3.6/3.7 和 Kimi K2.6 在 OpenRouter 上都会默认开启 chain-of-thought,所以一句简单的“Hi”也可能返回数百个 reasoning tokens。对 DeepSeek V4 和 Kimi K2.6,我们原样透传请求:如需 V3 风格的低成本聊天,请在请求体里传 `reasoning: { enabled: false }`。对 Qwen 3.6/3.7 系列,网关已默认发送 `reasoning: { enabled: false }`——如需思考,传 `reasoning: { enabled: true }` 开启。现有 V3 仍保持不思考的行为。

首次充值双倍 — 最高 $50 免费

改两行代码,立刻节省 20%。

获取 API Key