徽章 — Powered by QuickSilver Pro

使用条款 — 简短版

徽章

推理、数学、o1 替代

通用聊天、编程、工具调用

262K 长上下文、RAG

使用 1 美元免费额度和官方 OpenAI SDK 开始。

在 DeepSeek V3 和 R1 上的挂牌价格更低。对于高度依赖缓存的提示词，DeepInfra 的缓存折扣可能会改变对比结果。

QuickSilver Pro vs DeepInfra

V3 便宜约 20%，R1 输出便宜约 79%。兼容 OpenAI 接口，工具调用语义相同。

QuickSilver Pro vs Fireworks AI

在 DeepSeek V3、R1 和 Qwen3.5-35B-A3B 上，按 token 计价便宜 20%。同样兼容 OpenAI API，迁移只需两行代码。

QuickSilver Pro vs OpenRouter

在 DeepSeek R1 输出价格上便宜约 76%。对于重推理工作负载，这是转售商中差距最大的。

QuickSilver Pro vs Together AI

查看 QuickSilver Pro 与其他兼容 OpenAI 的推理服务商的正面对比定价，以及每个模型的用例指南和快速上手代码。

对比与用例 — QuickSilver Pro

对比与用例

适用于数学、算法和多步规划。作为开源版 o1 替代方案，价格低 35 倍。

代码生成、重构、工具调用代理。每 100 万 tokens 为 $0.24 / $0.70。

262K 上下文，3B 激活 MoE。适合 RAG 和长文档摘要，输入价格低至 $0.13。

请检查收件箱

粘贴你的 API key，或者通过邮箱恢复访问。

我们会通过邮件发送一次性登录链接。你的旧 key 会被轮换成新的（旧 key 会失效）。

恢复访问

测试邀请已生效。

这个邀请码已被领取。

我们会给你发送一封魔法链接邮件来完成注册，并附送 {amount} 免费额度。

我们会给你发送一封魔法链接邮件来完成注册，并附送 1 美元免费额度。

创建账户

额度通常会在几秒内自动添加到你的 key。额度一旦到账，不支持退款。

请使用注册时的同一邮箱。

朋友或合作伙伴给了你邀请码？在这里使用后可为当前账户添加

额度。每个账户只能使用一次。

有邀请码？

额度永不过期，只按实际使用付费。

购买额度

模型

把这三个值填到你的 agent / CLI / IDE 中所有需要“OpenAI-compatible endpoint”的地方。请妥善保管你的 key。

连接你的 Agent

复制这条命令并粘贴到终端里。它大约会消耗

发起你的第一条请求

一眼查看你的账户活动和用量。

总览

查看各模型的花费和请求数。

用量

你访问的页面不存在，或已被移动。

你可能想了解的关于 QuickSilver Pro 的一切：一个兼容 OpenAI 的 DeepSeek V3、R1 与 Qwen3.5-35B-A3B 推理 API。

常见问题 — QuickSilver Pro

常见问题

输入你的月度用量，看看 QSP 相比每个竞争对手能省多少。

你能省下多少？

输出具备稳定退出码，Claude Code、Cursor、Aider 无需解析 HTML 就能直接调用。

创建账户、购买额度、30 秒内拿到 API Key。

今天就开始节省推理成本

通过兼容 OpenAI 的 API 使用最热门的开源模型：DeepSeek V3、DeepSeek R1、Qwen3.5-35B-A3B。比所有其他转售商更便宜，只需改一行代码。

价格低于其他所有人。

开源推理，

这是一个过渡策略，让用户现在就能节省 20%。我们持续跟踪主要开源推理服务商的实时价格与可用性，并把请求分发到当下最便宜且健康的后端。只聚焦三款模型，让路由表保持高热度和低维护成本，节省直接让利给用户。

现在：在自有 GPU 容量上线前的过渡阶段

我们正在基于 H100/H200 构建自托管推理层，采用 SGLang、continuous batching、EAGLE-3 speculative decoding、DeepGEMM 的 FP8 量化，以及 SageAttention / ThunderMLA 自定义内核。目标是在 DeepSeek V3 上再降 30% 到 50%。

下一步：在专用 GPU 上运行自有推理栈

开源模型的权重是公开的，我们才能真正运行并优化它们。闭源模型（GPT-4、Claude）不开放权重，再多基础设施工作也无法把它们做得更便宜。所以我们的目录只保留三款可以验证、路由、并最终自托管的开源模型。

为什么只有开源模型能做到这一点

按每百万 tokens 计价 · 对比 OpenRouter、Together AI、Fireworks。

最便宜的开源模型推理

面向工具调用代理的 DeepSeek V3 →

面向 262K RAG 的 Qwen3.5-35B-A3B →

用于数学与算法的 DeepSeek R1 →

对比 DeepInfra

对比 Fireworks

对比 OpenAI

对比 OpenRouter

对比 Together AI

面向 DeepSeek V3、R1 与 Qwen3.5-35B-A3B 的 OpenAI 兼容 API，价格比 OpenRouter、Together AI、Fireworks 低 20%。一行替换即可接入，附赠 1 美元免费额度。

DeepSeek V3、R1、Qwen API · 便宜 20% · QuickSilver Pro

控制方决定提交至本服务的个人数据之处理目的与方式。处理方仅依据控制方记录在案的指示（通过 API 请求参数体现）处理该等个人数据，并且仅为提供服务之目的而处理。

数据主体：控制方应用的终端用户，其输入被提交到 API。类别：提示词和回复内容（其中可能包含控制方选择发送的任何个人数据）、账户元数据以及使用元数据。期限：服务协议有效期内。

仅依据控制方指示处理个人数据，除非法律另有要求（在法律允许的情况下，处理方将先通知控制方）。

对获授权处理个人数据的人员施加保密义务。

实施第 6 节所述的技术和组织措施。

不使用控制方个人数据训练机器学习模型。

在数据主体请求和监管调查方面协助控制方；对于非常规请求，控制方需承担合理成本。

控制方授权处理方聘用我们隐私政策中列明的子处理方。新增或更换子处理方前，我们将至少提前 30 天通过电子邮件或仪表盘通知。若控制方提出合理异议，控制方可终止服务并按比例退还已预付但未使用的费用。

个人数据可能会在美国处理。对于源自 EEA、英国或瑞士的传输，双方依赖欧盟标准合同条款（模块二，控制方向处理方）以及英国国际数据传输附录；在签署企业版 DPA 后，这些文件将通过引用纳入本协议。

传输中的数据使用 TLS 1.2+；强制启用 HSTS。

API 密钥以 SHA-256 哈希形式存储；仅在创建时以明文显示一次。

Webhook 签名通过 HMAC-SHA256 和时间戳有效窗口进行校验。

提示词和回复内容不会持久化到我们的存储中（仅在请求处理期间保留于内存中）。

生产系统访问权限仅授予授权人员，并保留日志以供调查。

托管于 Railway（SOC 2 Type II 基线）并使用 Cloudflare 边缘网络。

一旦发现影响控制方个人数据的已确认个人数据泄露事件，我们将在不无故拖延的情况下通知控制方，且无论如何不晚于知悉后 72 小时。通知将包括泄露性质、数据主体类别及大致人数、可能后果以及已采取的措施。

服务终止后，我们将在 30 天内删除全部个人数据，但法律要求保留的除外（例如税务/会计需要，可保留最长 7 年的汇总非个人形式数据）。控制方可在服务期内随时通过仪表盘或 API 导出账户和使用元数据。

处理方将在控制方请求时提供其最近的第三方审计报告（完成后将为 SOC 2 Type II）或同等摘要。如适用法律要求额外审计权，处理方将在控制方承担费用的前提下提供合理协助。

如本 DPA 与《服务条款》存在冲突，就个人数据处理事项而言，以本 DPA 为准。

数据保护联系人：hello@quicksilverpro.io — MachineFi Inc., 68 Willow Road, Menlo Park, CA 94205, USA。

数据处理附录 — QuickSilver Pro

数据处理附录

账户数据：您注册时提供的电子邮箱地址。

API 密钥：我们仅存储其加密哈希；原始密钥只会在创建时显示一次，之后无法恢复。

使用元数据：时间戳、模型名称、token 数量（输入和输出）、请求时长以及每次请求成本，用于计费和滥用检测。

支付数据：由 Stripe 处理。我们只能看到银行卡后四位和账单邮箱地址；看不到完整卡号。

我们不会持久化存储您的 API 提示词或模型回复内容。请求仅在调用期间于内存中处理，完成后即被丢弃。我们使用的算力基础设施合作方可能有其自己的保留政策，详见第 5 节。

我们使用收集的数据来：运营并计费服务、执行使用限制、调查滥用行为、发送事务性邮件（收据、安全通知），以及遵守法律义务。我们不会向第三方出售您的数据，也不会使用您的提示词或回复内容训练机器学习模型。

账户元数据会在您的账户活跃期间保留，并在账户关闭后继续保留 12 个月（用于税务和会计记录）。使用日志保留 90 天。您可发送邮件至 hello@quicksilverpro.io 请求更早删除；在符合法定保留要求的前提下，我们会在 30 天内处理经核实的请求。

我们仅与运营服务所必需的提供商共享数据。

传输中的数据受 TLS 1.2+ 保护。API 密钥以 SHA-256 哈希形式存储。Stripe Webhook 签名会使用 HMAC 密钥进行校验。我们的后端运行在 Railway（SOC 2 Type II 基线）上。我们不会持久化存储提示词内容。

您可以通过发送邮件至 hello@quicksilverpro.io 请求访问、更正、导出或删除您的个人数据。加州居民在 CCPA 下享有额外权利，欧盟/英国居民在 GDPR 下享有额外权利，包括不受非法自动化决策约束的权利。我们会在处理请求前核实您的身份。

我们只使用 localStorage，以便在您再次访问时记住已登录的 API 密钥。我们不使用跟踪 Cookie、分析 Cookie 或广告网络。

本政策的重大变更将在生效前至少 30 天通过电子邮件通知。

MachineFi Inc., 68 Willow Road, Menlo Park, CA 94205, USA — hello@quicksilverpro.io

隐私政策 — QuickSilver Pro

隐私政策

我们提供与 OpenAI 兼容的 HTTP API，以可预期的价格提供流行的开源语言模型。可用性、模型选择和定价可能会在合理通知后发生变化。

您有责任对 API 密钥保密，并对您账户下的所有活动负责。您可以随时在仪表盘中轮换或撤销密钥。账户仅供单一法律实体使用；请勿共享账户。

服务通过 Stripe 以美元预付费。只要您的账户保持活跃，额度永不过期。已购买的额度一经消耗不可退款。未使用的额度可在购买后 7 天内通过书面请求发送至 hello@quicksilverpro.io 申请退款。您的账单上 Stripe 扣款将显示为 MACHINEFI INC。

您不得将本服务用于：(a) 生成非法、侵权或以其他方式违反我们公开使用政策的内容；(b) 试图对服务进行逆向工程、提取模型权重或绕过速率限制；(c) 发送自动化垃圾信息或协助滥用行为；或 (d) 未经单独书面协议转售原始 API。

如果我们合理认为某些流量具有滥用性，或会威胁其他客户的服务稳定性，我们可能会对其限流或临时封禁。我们尽最大努力实现每月 99.5% 的可用性目标，但不包括计划维护和上游服务商中断。标准套餐不提供合同级 SLA。

本服务按“现状”和“可用”提供。我们不提供任何明示或默示担保，包括特定用途适用性和非侵权担保。模型输出可能不准确、令人不适或不适合您的使用场景；在依赖输出之前，您有责任自行审核。

在法律允许的最大范围内，因您使用本服务而产生或与之相关的我们的累计责任，不超过您在索赔前 12 个月内向我们支付的费用。对于任何间接、附带或后果性损害，我们概不负责。

您可以随时发送邮件至 hello@quicksilverpro.io 关闭账户。对于违反本条款的账户，我们可暂停或终止服务。除非终止原因是违反第 4 节，否则剩余未使用额度将在 30 天内退款。

我们可能修改服务、定价或本条款。重大变更将在生效前至少 30 天通过电子邮件或仪表盘通知发布。生效日期后继续使用即视为接受变更。

本条款受加利福尼亚州法律管辖。任何争议均应由位于加利福尼亚州圣马特奥县的州或联邦法院专属解决。

Services

Model availability

Roadmap - how we become a real inference company

Now - bridge phase while our GPU capacity comes online

Q2 2026 - our own inference stack on H100/H200