QuickSilver Pro 系统状态
全部系统正常
检查中...
服务
90 天历史 · 客户端实测
推理 API
api.quicksilverpro.io
检查中...
— · —
仪表盘后端
pay.quicksilverpro.io
检查中...
— · —
官网
quicksilverpro.io
检查中...
— · —
模型可用性
合成探测 · 每 3 分钟更新
DeepSeek V4 Flash
deepseek-v4-flash1M 上下文 · 低成本聊天,默认会思考
检查中...
— · —
DeepSeek V4 Pro
deepseek-v4-pro1M 上下文 · 高阶推理
检查中...
— · —
DeepSeek V3
deepseek-v3128K 上下文 · 通用用途
检查中...
— · —
DeepSeek R1
deepseek-r1128K 上下文 · 推理
检查中...
— · —
Qwen3.7 Max
qwen3.7-max1M 上下文 · Qwen 3.7 旗舰 · agent
检查中...
— · —
Qwen3.7 Plus
qwen3.7-plus262K 上下文 · Qwen 3.7 agent · 编程
检查中...
— · —
Qwen3.6 Plus
qwen3.6-plus1M 上下文 · 1T-MoE 旗舰 · 默认思考
检查中...
— · —
Qwen3.6-35B-A3B
qwen3.6-35b3B 激活参数 · 262K 上下文 · MoE 升级版
检查中...
— · —
Qwen3.5-35B-A3B
qwen3.5-35b3B 激活参数 · 262K 上下文 · MoE
检查中...
— · —
Kimi K2.6
kimi-k2.6256K 上下文 · agentic / planning
检查中...
— · —
Kimi K2.7 Code
kimi-k2.7-code256K 上下文 · agentic 编程
检查中...
— · —
GLM 5.2
glm-5.2100 万上下文 · 推理 · agentic 编程
检查中...
— · —
路线图:我们如何成为真正的推理基础设施公司
1
当前:精选模型目录上线
已上线客户今天就能省下 20%。精选模型目录让运营面收得很窄,差距来自工程精度,同一套接口直接延续到 Phase 2。
2
2026 年 Q2:在 H100/H200 上运行自有推理栈
计划中使用专用 GPU 自托管推理服务,结合 SGLang + continuous batching、EAGLE-3 speculative decoding、通过 DeepGEMM 做 FP8 quantization,以及 SageAttention / ThunderMLA 自定义内核。到那时 system_fingerprint 会稳定下来(只有我们升级推理栈时才变化),可重复 seed 工作流也会真正可用。目标:DeepSeek V3 的价格比当前再低 30-50%。
3
2026 年 H2:机柜托管数据中心 + AIDC 合作
未来从租用(Vast.ai)转向自有或托管机柜,并在合适的地方与 AI 数据中心运营商合作。目标是做出地球上最便宜且可靠的开源模型推理服务:从全栈到底层工程都由我们自己掌控。
关于此页面
服务行显示的是从你的浏览器发出的客户端探测。 模型行反映的是我们后端每 3 分钟发起一次、真实 1-token 的服务端探测。 历史条展示的是近期探测结果,数据存储在当前浏览器的 localStorage;如果你切换设备,这些历史会被清空。
公开可用性追踪始于 2026-04-16. 如果你需要带合同约束的 SLA 和第三方监控历史,请 联系我们。