开源推理,价格低于其他所有人。
9 款最热门的开源模型 —— DeepSeek V4 Flash 与 Pro、V3、R1、Qwen 3.7 Max + 3.6 Plus + 3.6 + 3.5、Kimi K2.6 —— 通过兼容 OpenAI 的 API 提供。比所有其他转售商更便宜,只需改一行代码。
或者 在 HuggingFace 在线试用这些模型 —— 无需注册。
- 无订阅
- 兼容 OpenAI
- 按量付费
- 文本 + 图像
- OpenAI SDK
- Aider
- Cursor
- Cline
- Continue.dev
- LangChain
- Vercel AI SDK
1# 只改一行,就够了。2from openai import OpenAI34client = OpenAI(5 base_url="https://api.quicksilverpro.io/v1",6 api_key="your-api-key",7)
最便宜的开源模型推理
文本模型按每 100 万 token 计价;图像和音频模型按标注的每张图或每分钟计价。
claude-opus-4-8claude-opus-4-6claude-sonnet-4-6claude-haiku-4-5whisper-large-v3-turbogemini-2.5-flash-imagegemini-3-pro-image-preview文本模型对比基于 OpenRouter、Together AI 和 Fireworks AI。图像与音频行展示的是 QSP 在 2026 年 5 月的公开标价。
与所有竞争对手逐项对比
你能省下多少?
输入你的月度用量,看看 QSP 相比每个竞争对手能省多少。
常见问题
这是一个兼容 OpenAI 的 HTTP API,提供 9 款顶级开源 LLM —— DeepSeek V4 Flash 与 Pro、V3、R1、Qwen 3.7 Max、3.6 Plus、3.6 与 3.5-35B-A3B,以及 Kimi K2.6。把官方 OpenAI SDK 指向我们的 base URL,就能以同样的 chat-completions 接口、比其他转售商低 20% 的价格使用这些模型。
V4 Flash 是 DeepSeek 最新的模型(2026 年 4 月发布):输出价格比 V3 便宜约 74%,上下文从 128K 提升到 1M,并默认开启思考(思维链推理)—— 因此一个一字 “Hi” 也可能返回约 175 个推理 token。如果你需要 V3 风格、不带思考开销的低价聊天,请在请求体中传入 `reasoning: { enabled: false }`。原有的 V3 不会受到影响,继续正常使用。
在相同开源模型上,我们比 OpenRouter、Together AI、Fireworks AI 和 DeepInfra 的公开单 token 价格低 20%。V4 Flash:$0.08 / $0.16。V4 Pro:$0.348 / $0.696。V3:$0.16 / $0.616。R1:$0.56 / $2.00。Qwen 3.7 Max:$2.00 / $6.00。Qwen 3.6 Plus:$0.26 / $1.56。Qwen 3.6:$0.12 / $0.80。Qwen 3.5:$0.111 / $0.80。Kimi K2.6:$0.584 / $2.79。我们不提供 GPT-4、Claude 这类闭源模型。
可以。只要把官方 openai Python / Node / Swift SDK 里的 base_url 改成 https://api.quicksilverpro.io/v1。流式输出、工具调用、json_schema strict mode 和 usage.cost 统计都可直接使用。
上线特惠:首次充值 $5–$50 任意金额,我们等额赠送 100%。充 $5 得 $10,充 $50 得 $100。仅限首次充值,自动到账,之后按量付费。