QuickSilver Pro vs OpenAI
对于那些开源模型已经能达到等效质量的工作负载,QuickSilver Pro 相比 OpenAI 最多可便宜 30 倍。DeepSeek V4 Flash 可以替代 GPT-4o-mini,成本低约 73%;V3 可以替代 GPT-4o,输出成本低约 16 倍;V4 Pro 可以替代 o3-mini,输出成本低约 6 倍;R1 可以替代 o1,输出成本低约 30 倍。至于视觉、音频、图像生成和 Assistants API,仍然建议继续使用 OpenAI。这一页会诚实说明:哪些能力值得为 OpenAI 的溢价买单,哪些不值得。
快速概览
| 特性 | QuickSilver Pro | openai |
|---|---|---|
| 模型目录 | 9 个开源 LLM(V4 Flash + Pro、V3、R1、Qwen 3.7 Max + 3.6 Plus + 3.6 + 3.5、Kimi K2.6) | GPT-4、o1/o3-mini、DALL-E、Whisper、TTS |
| 模型权重 | 开放(MIT / Apache) | 闭源 |
| 低价聊天成本(GPT-4o-mini / DeepSeek V4 Flash) | $0.08 / $0.16 | $0.15 / $0.60 |
| 通用聊天成本(GPT-4o / DeepSeek V3) | $0.16 / $0.616 | $2.50 / $10.00 |
| 高端推理成本(o3-mini / DeepSeek V4 Pro) | $0.348 / $0.696 | $1.10 / $4.40 |
| 顶级推理成本(o1 / DeepSeek R1) | $0.56 / $2.00 | $15.00 / $60.00 |
| 视觉(图像输入) | 否 | 是(GPT-4o) |
| 音频(Whisper / TTS) | 否 | 是 |
| 图像生成(DALL-E) | 否 | 是 |
| Assistants API + 内置工具 | 否 | 是 |
| 兼容 OpenAI 的 chat + tools + JSON | 是 | 是(原生) |
| 最小充值金额 | $5 | $5 |
价格(每百万 tokens,USD)
公开挂牌价格,更新于 2026 年 4 月。
| 模型 | QSP 输入 | QSP 输出 | openai 输入 | openai 输出 | 节省 |
|---|---|---|---|---|---|
| deepseek-v4-flash vs gpt-4o-mini | $0.08 | $0.16 | $0.15 | $0.60 | ~73% |
| deepseek-v3 vs gpt-4o | $0.16 | $0.616 | $2.50 | $10.00 | ~94% |
| deepseek-v4-pro vs o3-mini | $0.348 | $0.696 | $1.10 | $4.40 | ~84% |
| deepseek-r1 vs o1 | $0.56 | $2.00 | $15.00 | $60.00 | ~97% |
| qwen3.6-35b vs gpt-4o | $0.12 | $0.80 | $2.50 | $10.00 | ~92% |
| qwen3.5-35b vs gpt-4o | $0.111 | $0.80 | $2.50 | $10.00 | ~92% |
| kimi-k2.6 | $0.584 | $2.79 | — | — | specialist tier |
迁移:只改两行
from openai import OpenAI
client = OpenAI(
base_url="https://api.quicksilverpro.io/v1",
api_key=os.environ["QSP_KEY"],
)
r = client.chat.completions.create(
model="deepseek-v3",
messages=[{"role": "user", "content": "Hi"}],
)常见问题
DeepSeek V4 Flash 对比 GPT-4o-mini:输入约便宜 47%,输出约便宜 73%。DeepSeek V3 对比 GPT-4o:输入约便宜 16 倍,输出约便宜 16 倍。DeepSeek V4 Pro 对比 o3-mini:输入约便宜 3 倍,输出约便宜 6 倍。DeepSeek R1 对比 o1:输入约便宜 27 倍,输出约便宜 30 倍。在大多数纯文本基准上,底层任务质量是同级别的。
对于高端推理且需要长上下文的工作负载,DeepSeek V4 Pro 可以比较直接地对标 o3-mini:它支持 1M 上下文(而 o3-mini 是 200K),价格是 $0.348/$0.696,而 o3-mini 是 $1.10/$4.40,输出大约便宜 6 倍。Kimi K2.6 更接近 Claude Opus 这一类 agentic / 规划场景,OpenAI 没有特别直接的等价物;如果你的评测结果经常选出 Claude Opus,那么定价为 $0.584/$2.79 的 K2.6 是很接近的开源替代。
可以,而且代码结构不需要改。你只需要更换 base_url、api_key 和 model。Streaming、工具调用、json_schema 严格模式、usage 计费统计都支持。V4 系列模型(V4 Flash、V4 Pro、Kimi K2.6)默认会思考;如果想要 V3 风格的廉价聊天,可传 `reasoning: { enabled: false }`。
当你需要视觉输入、Whisper / TTS、DALL-E、Assistants API、embeddings,或者在你自己的评测里 GPT-4 明显比 DeepSeek V3 更强时。对于能通过你评测的纯文本聊天任务,更适合用 QSP。
可以。通常做法是初始化两个 OpenAI SDK client,各自对应一个 provider,然后按请求类型路由。很多团队就是这么做的:OpenAI 负责视觉 / 音频 / Assistants,QSP 负责 80% 的纯文本流量。这样混合后的总账单,通常只相当于全量使用 OpenAI 的 10%-30%。