QuickSilver Pro vs DeepInfra
DeepInfra 已经算是 DeepSeek 转售商里偏便宜的选择,而 QuickSilver Pro 在多数维度上仍然更低:DeepSeek V3 输出便宜约 30%,DeepSeek R1 输出便宜约 9%。在 DeepSeek R1 输入上两者基本持平(QSP $0.56 vs DeepInfra $0.55,QSP 略高一点点)。如果你已经因为成本敏感而选了 DeepInfra,那 V3 上继续往下省的空间会直接累计到账单上。接口仍然兼容 OpenAI,迁移只需要两行。
快速概览
| 特性 | QuickSilver Pro | deepinfra |
|---|---|---|
| 目录侧重点 | 9 个开源 LLM | 60+ 开源模型、视觉、音频 |
| DeepSeek V3 输出价格 | $0.616 / 1M | $0.88 / 1M |
| DeepSeek R1 输出价格 | $2.00 / 1M | $2.19 / 1M |
| 缓存输入折扣 | 暂未提供 | 是(DeepSeek V3/V3.1) |
| Embeddings / 音频 / 图像 | 否 | 是 |
| 专用部署 | 否 | 是 |
| OpenAI-compatible chat | 是 | 是 |
| 最小充值金额 | $5 | $20 |
价格(每百万 tokens,USD)
公开挂牌价格,更新于 2026 年 4 月。
| 模型 | QSP 输入 | QSP 输出 | deepinfra 输入 | deepinfra 输出 | 节省 |
|---|---|---|---|---|---|
| DeepSeek V3 | $0.16 | $0.616 | $0.28 | $0.88 | ~30% |
| DeepSeek R1 | $0.56 | $2.00 | $0.55 | $2.19 | ~9% output |
| Qwen3.5-35B-A3B | $0.111 | $0.80 | Comparable | Comparable | — |
迁移:只改两行
from openai import OpenAI
client = OpenAI(
base_url="https://api.quicksilverpro.io/v1",
api_key=os.environ["QSP_KEY"],
)
r = client.chat.completions.create(
model="deepseek-v3",
messages=[{"role": "user", "content": "Hi"}],
)常见问题
按公开定价看,DeepSeek V3 的输入大约便宜 43%,输出大约便宜 30%。DeepSeek R1 的输入两者基本持平(QSP $0.56 vs DeepInfra $0.55,QSP 略高一点点),输出大约便宜 9%($2.00 vs $2.19)。不过如果你的 workload 缓存命中率很高,DeepInfra 的 cached-input 定价可能会改变结论,所以最好比较真实单请求成本。
两行即可:把 base_url 换成 api.quicksilverpro.io/v1,换新的 API key,并去掉模型 ID 中的 deepseek-ai/ 或 Qwen/ 前缀。
支持。DeepSeek V3/V4 以及 Qwen/Kimi 系列的缓存命中输入会按单独、更低的 cache-read 费率计费,所以重复 prompt 比全新输入更便宜。两家都对缓存输入有折扣;如果你的 cache-hit ratio 很高,建议按真实单请求成本对比。
这些我们目前不提供。QuickSilver Pro 聚焦于 7 个 LLM 的 chat completions;DeepInfra 覆盖这些多模态能力。