上线特惠

开源推理,价格低于其他所有人。

9 款最热门的开源模型 —— DeepSeek V4 Flash 与 Pro、V3、R1、Qwen 3.7 Max + 3.6 Plus + 3.6 + 3.5、Kimi K2.6 —— 通过兼容 OpenAI 的 API 提供。比所有其他转售商更便宜,只需改一行代码。

或者 在 HuggingFace 在线试用这些模型 —— 无需注册。

  • 无订阅
  • 兼容 OpenAI
  • 按量付费
  • 文本 + 图像
兼容
  • OpenAI SDK
  • Aider
  • Cursor
  • Cline
  • Continue.dev
  • LangChain
  • Vercel AI SDK
python
1# 只改一行,就够了。
2from openai import OpenAI
3 
4client = OpenAI(
5 base_url="https://api.quicksilverpro.io/v1",
6 api_key="your-api-key",
7)
定价

最便宜的开源模型推理

文本模型按每 100 万 token 计价;图像和音频模型按标注的每张图或每分钟计价。

模型
上下文
输入
输出
节省
deepseek-v4-flash
快速聊天与编程,1M 上下文,默认开启思考
1M
$0.08$0.10
$0.16$0.20
−20%
deepseek-v4-pro
顶级推理能力,1M 上下文
1M
$0.348$0.435
$0.696$0.87
−20%
deepseek-v3
聊天、编程、结构化输出
128K
$0.16$0.20
$0.616$0.77
−20%
deepseek-r1
数学、多步推理、逻辑
128K
$0.56$0.70
$2.00$2.50
−20%
qwen3.7-max
Qwen 3.7 旗舰,agent / 编程,1M 上下文
1M
$2.00$2.50
$6.00$7.50
−20%
qwen3.7-plus
Qwen 3.7 agent 旗舰,长程编程
262K
$0.256$0.32
$1.024$1.28
−20%
qwen3.6-plus
默认思考旗舰,1M 上下文
1M
$0.26$0.325
$1.56$1.95
−20%
qwen3.6-35b
长上下文 RAG,3.5 的无缝升级
262K
$0.12$0.15
$0.80$1.00
−20%
qwen3.5-35b
长上下文 RAG、摘要
262K
$0.111$0.139
$0.80$1.00
−20%
kimi-k2.6
Opus 级代理 / 规划
256K
$0.584$0.73
$2.79$3.49
−20%
kimi-k2.7-code
长程 agentic 编程
256K
$0.60$0.75
$2.80$3.50
−20%
Claude Opus 4.8
claude-opus-4-8
顶级推理、编码、代理
1M
$4.00$5.00
$20.00$25.00
−20%
Claude Opus 4.6
claude-opus-4-6
深度推理与编码
1M
$4.00$5.00
$20.00$25.00
−20%
Claude Sonnet 4.6
claude-sonnet-4-6
均衡中端,快速且强大
1M
$2.40$3.00
$12.00$15.00
−20%
Claude Haiku 4.5
claude-haiku-4-5
快速、低成本、高吞吐任务
200K
$0.80$1.00
$4.00$5.00
−20%
Whisper Large V3 Turbo
whisper-large-v3-turbo
通过 /v1/audio/transcriptions 快速语音转文本
Audio
$0.0004/min$0.000667/min
−40%
flux.2-pro
旗舰图像生成
$0.027/img$0.031/img
−13%
flux.1-schnell
快速高吞吐图像生成
$0.0025/img$0.003/img
−17%
gemini-2.5-flash
多模态对话,1M 上下文
1M
$0.255$0.30
$2.125$2.50
−15%
Gemini 2.5 Flash Image
gemini-2.5-flash-image
图像生成
1M
$0.255$0.30
$25.50$30.00
−15%
gemini-2.5-flash-lite
高吞吐廉价任务
1M
$0.085$0.10
$0.34$0.40
−15%
gemini-3-flash-preview
下一代 flash 推理
1M
$0.425$0.50
$2.55$3.00
−15%
Gemini 3 Pro Image Preview
gemini-3-pro-image-preview
专业级图像生成
1M
$1.70$2.00
$102.00$120.00
−15%
gemini-3.1-pro-preview
旗舰推理,1M 上下文
1M
$1.70$2.00
$10.20$12.00
−15%
gemini-3.5-flash
下一代 Flash GA,1M 上下文
1M
$1.275$1.50
$7.65$9.00
−15%
gemini-2.5-pro
专业中端推理,1M 上下文
1M
$1.0625$1.25
$8.50$10.00
−15%
gemini-3.1-flash-lite
最新低成本主力,高并发
1M
$0.2125$0.25
$1.275$1.50
−15%

文本模型对比基于 OpenRouter、Together AI 和 Fireworks AI。图像与音频行展示的是 QSP 在 2026 年 5 月的公开标价。

计算器

你能省下多少?

输入你的月度用量,看看 QSP 相比每个竞争对手能省多少。

常用月度总量 (10:1 输入/输出):
推理模型的输出 token 统计包含思维链,通常会是最终可见回复的 3 到 10 倍。
1M
300K
QuickSilver Pro
$0.13最低价
OpenRouter
$0.16+25%
OpenAIclosed model analog
$0.33+2.6×
QSP 相比 OpenRouter 每月可节省 3¢/month(20% cheaper)。
CLIqsp

为终端和 AI 代理而生。 --json 输出具备稳定退出码,Claude Code、Cursor、Aider 无需解析 HTML 就能直接调用。

FAQ

常见问题

这是一个兼容 OpenAI 的 HTTP API,提供 9 款顶级开源 LLM —— DeepSeek V4 Flash 与 Pro、V3、R1、Qwen 3.7 Max、3.6 Plus、3.6 与 3.5-35B-A3B,以及 Kimi K2.6。把官方 OpenAI SDK 指向我们的 base URL,就能以同样的 chat-completions 接口、比其他转售商低 20% 的价格使用这些模型。

V4 Flash 是 DeepSeek 最新的模型(2026 年 4 月发布):输出价格比 V3 便宜约 74%,上下文从 128K 提升到 1M,并默认开启思考(思维链推理)—— 因此一个一字 “Hi” 也可能返回约 175 个推理 token。如果你需要 V3 风格、不带思考开销的低价聊天,请在请求体中传入 `reasoning: { enabled: false }`。原有的 V3 不会受到影响,继续正常使用。

在相同开源模型上,我们比 OpenRouter、Together AI、Fireworks AI 和 DeepInfra 的公开单 token 价格低 20%。V4 Flash:$0.08 / $0.16。V4 Pro:$0.348 / $0.696。V3:$0.16 / $0.616。R1:$0.56 / $2.00。Qwen 3.7 Max:$2.00 / $6.00。Qwen 3.6 Plus:$0.26 / $1.56。Qwen 3.6:$0.12 / $0.80。Qwen 3.5:$0.111 / $0.80。Kimi K2.6:$0.584 / $2.79。我们不提供 GPT-4、Claude 这类闭源模型。

可以。只要把官方 openai Python / Node / Swift SDK 里的 base_url 改成 https://api.quicksilverpro.io/v1。流式输出、工具调用、json_schema strict mode 和 usage.cost 统计都可直接使用。

上线特惠:首次充值 $5–$50 任意金额,我们等额赠送 100%。充 $5 得 $10,充 $50 得 $100。仅限首次充值,自动到账,之后按量付费。

今天就开始节省推理成本

创建账户、购买额度、30 秒内拿到 API Key。

获取 API Key