开源推理，价格低于其他所有人。

9 款最热门的开源模型 —— DeepSeek V4 Flash 与 Pro、V3、R1、Qwen 3.7 Max + 3.6 Plus + 3.6 + 3.5、Kimi K2.6 —— 通过兼容 OpenAI 的 API 提供。比所有其他转售商更便宜，只需改一行代码。

获取 API Key 查看定价

或者在 HuggingFace 在线试用这些模型 —— 无需注册。

无订阅
兼容 OpenAI
按量付费
文本 + 图像

兼容

OpenAI SDK
Aider
Cursor
Cline
Continue.dev
LangChain
Vercel AI SDK

python

1# 只改一行，就够了。
2from openai import OpenAI
3 
4client = OpenAI(
5    base_url="https://api.quicksilverpro.io/v1",
6    api_key="your-api-key",
7)

定价

最便宜的开源模型推理

文本模型按每 100 万 token 计价；图像和音频模型按标注的每张图或每分钟计价。

模型

上下文

输入

输出

节省

DeepSeek V4 Flash新

deepseek-v4-flash

快速聊天与编程，1M 上下文，默认开启思考

$0.08$0.10

$0.16$0.20

−20%

DeepSeek V4 Pro新

deepseek-v4-pro

顶级推理能力，1M 上下文

$0.348$0.435

$0.696$0.87

−20%

DeepSeek V3

deepseek-v3

聊天、编程、结构化输出

128K

$0.16$0.20

$0.616$0.77

−20%

DeepSeek R1推理

deepseek-r1

数学、多步推理、逻辑

128K

$0.56$0.70

$2.00$2.50

−20%

Qwen3.7 Max新

qwen3.7-max

Qwen 3.7 旗舰，agent / 编程，1M 上下文

$2.00$2.50

$6.00$7.50

−20%

Qwen3.7 Plus新

qwen3.7-plus

Qwen 3.7 agent 旗舰，长程编程

262K

$0.256$0.32

$1.024$1.28

−20%

Qwen3.6 Plus新

qwen3.6-plus

默认思考旗舰，1M 上下文

$0.26$0.325

$1.56$1.95

−20%

Qwen3.6-35B-A3B

qwen3.6-35b

长上下文 RAG，3.5 的无缝升级

262K

$0.12$0.15

$0.80$1.00

−20%

Qwen3.5-35B-A3B

qwen3.5-35b

长上下文 RAG、摘要

262K

$0.111$0.139

$0.80$1.00

−20%

Kimi K2.6

kimi-k2.6

Opus 级代理 / 规划

256K

$0.584$0.73

$2.79$3.49

−20%

Kimi K2.7 Code新

kimi-k2.7-code

长程 agentic 编程

256K

$0.60$0.75

$2.80$3.50

−20%

Claude Opus 4.8新

claude-opus-4-8

顶级推理、编码、代理

$4.00$5.00

$20.00$25.00

−20%

Claude Opus 4.6新

claude-opus-4-6

深度推理与编码

$4.00$5.00

$20.00$25.00

−20%

Claude Sonnet 4.6新

claude-sonnet-4-6

均衡中端，快速且强大

$2.40$3.00

$12.00$15.00

−20%

Claude Haiku 4.5新

claude-haiku-4-5

快速、低成本、高吞吐任务

200K

$0.80$1.00

$4.00$5.00

−20%

Whisper Large V3 Turbo新

whisper-large-v3-turbo

通过 /v1/audio/transcriptions 快速语音转文本

Audio

$0.0004/min$0.000667/min

—

−40%

FLUX.2 Pro新

flux.2-pro

旗舰图像生成

—

$0.027/img$0.031/img

−13%

FLUX.1 Schnell新

flux.1-schnell

快速高吞吐图像生成

—

$0.0025/img$0.003/img

−17%

Gemini 2.5 Flash新

gemini-2.5-flash

多模态对话，1M 上下文

$0.255$0.30

$2.125$2.50

−15%

Gemini 2.5 Flash Image新

gemini-2.5-flash-image

图像生成

$0.255$0.30

$25.50$30.00

−15%

Gemini 2.5 Flash Lite新

gemini-2.5-flash-lite

高吞吐廉价任务

$0.085$0.10

$0.34$0.40

−15%

Gemini 3 Flash Preview新

gemini-3-flash-preview

下一代 flash 推理

$0.425$0.50

$2.55$3.00

−15%

Gemini 3 Pro Image Preview新

gemini-3-pro-image-preview

专业级图像生成

$1.70$2.00

$102.00$120.00

−15%

Gemini 3.1 Pro Preview新

gemini-3.1-pro-preview

旗舰推理，1M 上下文

$1.70$2.00

$10.20$12.00

−15%

Gemini 3.5 Flash新

gemini-3.5-flash

下一代 Flash GA，1M 上下文

$1.275$1.50

$7.65$9.00

−15%

Gemini 2.5 Pro新

gemini-2.5-pro

专业中端推理，1M 上下文

$1.0625$1.25

$8.50$10.00

−15%

Gemini 3.1 Flash Lite新

gemini-3.1-flash-lite

最新低成本主力，高并发

$0.2125$0.25

$1.275$1.50

−15%

文本模型对比基于 OpenRouter、Together AI 和 Fireworks AI。图像与音频行展示的是 QSP 在 2026 年 5 月的公开标价。

与所有竞争对手逐项对比

面向工具调用代理的 DeepSeek V3 →

推理

用于数学与算法的 DeepSeek R1 →

长上下文

面向 262K RAG 的 Qwen3.5-35B-A3B →

查看全部对比 →

计算器

你能省下多少？

输入你的月度用量，看看 QSP 相比每个竞争对手能省多少。

常用月度总量 (10:1 输入/输出)：

推理模型的输出 token 统计包含思维链，通常会是最终可见回复的 3 到 10 倍。

每月输入 token1M

每月输出 token300K

QuickSilver Pro

$0.13最低价

OpenRouter

$0.16+25%

OpenAIclosed model analog

$0.33+2.6×

QSP 相比 OpenRouter 每月可节省 3¢/month（20% cheaper）。

CLIqsp

为终端和 AI 代理而生。 --json 输出具备稳定退出码，Claude Code、Cursor、Aider 无需解析 HTML 就能直接调用。

PyPI GitHub 快速开始 →

FAQ

常见问题

QuickSilver Pro 是什么？

这是一个兼容 OpenAI 的 HTTP API，提供 9 款顶级开源 LLM —— DeepSeek V4 Flash 与 Pro、V3、R1、Qwen 3.7 Max、3.6 Plus、3.6 与 3.5-35B-A3B，以及 Kimi K2.6。把官方 OpenAI SDK 指向我们的 base URL，就能以同样的 chat-completions 接口、比其他转售商低 20% 的价格使用这些模型。

V3 和 V4 Flash 有什么区别？

V4 Flash 是 DeepSeek 最新的模型（2026 年 4 月发布）：输出价格比 V3 便宜约 74%，上下文从 128K 提升到 1M，并默认开启思考（思维链推理）—— 因此一个一字 “Hi” 也可能返回约 175 个推理 token。如果你需要 V3 风格、不带思考开销的低价聊天，请在请求体中传入 `reasoning: { enabled: false }`。原有的 V3 不会受到影响，继续正常使用。

相比 OpenRouter / OpenAI 便宜多少？

在相同开源模型上，我们比 OpenRouter、Together AI、Fireworks AI 和 DeepInfra 的公开单 token 价格低 20%。V4 Flash：$0.08 / $0.16。V4 Pro：$0.348 / $0.696。V3：$0.16 / $0.616。R1：$0.56 / $2.00。Qwen 3.7 Max：$2.00 / $6.00。Qwen 3.6 Plus：$0.26 / $1.56。Qwen 3.6：$0.12 / $0.80。Qwen 3.5：$0.111 / $0.80。Kimi K2.6：$0.584 / $2.79。我们不提供 GPT-4、Claude 这类闭源模型。

真的能作为 OpenAI 的无缝替代吗？

可以。只要把官方 openai Python / Node / Swift SDK 里的 base_url 改成 https://api.quicksilverpro.io/v1。流式输出、工具调用、json_schema strict mode 和 usage.cost 统计都可直接使用。

有免费额度吗？

上线特惠：首次充值 $5–$50 任意金额，我们等额赠送 100%。充 $5 得 $10，充 $50 得 $100。仅限首次充值，自动到账，之后按量付费。

查看全部问题

今天就开始节省推理成本

创建账户、购买额度、30 秒内拿到 API Key。

获取 API Key