लॉन्च बोनस

Open-source इन्फरेंस,बाकियों से 20% कम।

9 सबसे लोकप्रिय open-source models — DeepSeek V4 Flash और Pro, V3, R1, Qwen 3.7 Max + 3.6 Plus + 3.6 + 3.5, Kimi K2.6 — अब OpenAI-compatible API के साथ। हर दूसरे reseller से सस्ता। बस एक लाइन कोड बदलें।

या HuggingFace पर models लाइव आज़माएँ — signup की जरूरत नहीं।

  • कोई subscription नहीं
  • OpenAI compatible
  • जितना उपयोग उतना भुगतान
  • टेक्स्ट + इमेज
इनके साथ काम करता है
  • OpenAI SDK
  • Aider
  • Cursor
  • Cline
  • Continue.dev
  • LangChain
  • Vercel AI SDK
python
1# बस एक लाइन बदलें। इतना ही।
2from openai import OpenAI
3 
4client = OpenAI(
5 base_url="https://api.quicksilverpro.io/v1",
6 api_key="your-api-key",
7)
कीमत

सबसे सस्ता open-source inference

Text models के लिए 1M tokens pricing; image और audio models के लिए जहां noted हो वहां per-image या per-minute pricing.

मॉडल
कॉन्टेक्स्ट
इनपुट
आउटपुट
बचत
deepseek-v4-flash
तेज़ चैट और कोडिंग, 1M context, thinking डिफ़ॉल्ट रूप से ON
1M
$0.08$0.10
$0.16$0.20
−20%
deepseek-v4-pro
प्रीमियम reasoning, 1M context
1M
$0.348$0.435
$0.696$0.87
−20%
deepseek-v3
चैट, कोडिंग, structured output
128K
$0.16$0.20
$0.616$0.77
−20%
DeepSeek R1रीज़निंग
deepseek-r1
गणित, multi-step reasoning, logic
128K
$0.56$0.70
$2.00$2.50
−20%
Qwen3.7 Maxनया
qwen3.7-max
Qwen 3.7 flagship, agent / coding, 1M context
1M
$2.00$2.50
$6.00$7.50
−20%
Qwen3.7 Plusनया
qwen3.7-plus
Qwen 3.7 agent flagship, long-horizon coding
262K
$0.256$0.32
$1.024$1.28
−20%
Qwen3.6 Plusनया
qwen3.6-plus
thinks-by-default flagship, 1M context
1M
$0.26$0.325
$1.56$1.95
−20%
qwen3.6-35b
long-context RAG, 3.5 का drop-in upgrade
262K
$0.12$0.15
$0.80$1.00
−20%
qwen3.5-35b
long-context RAG, summarization
262K
$0.111$0.139
$0.80$1.00
−20%
kimi-k2.6
Opus-class agentic / planning
256K
$0.584$0.73
$2.79$3.49
−20%
kimi-k2.7-code
Long-horizon agentic coding
256K
$0.60$0.75
$2.80$3.50
−20%
GLM 5.2नया
glm-5.2
long-horizon agents, project-level coding
1M
$0.80$1.00
$3.20$4.00
−20%
Claude Opus 4.8नया
claude-opus-4-8
top-tier reasoning, coding, agentic
1M
$4.00$5.00
$20.00$25.00
−20%
Claude Opus 4.6नया
claude-opus-4-6
गहन reasoning और coding
1M
$4.00$5.00
$20.00$25.00
−20%
Claude Sonnet 4.6नया
claude-sonnet-4-6
संतुलित mid-tier, तेज़ और सक्षम
1M
$2.40$3.00
$12.00$15.00
−20%
Claude Haiku 4.5नया
claude-haiku-4-5
तेज़, कम लागत, high-volume tasks
200K
$0.80$1.00
$4.00$5.00
−20%
Whisper Large V3 Turboनया
whisper-large-v3-turbo
/v1/audio/transcriptions के जरिए तेज़ speech-to-text
Audio
$0.0004/min$0.000667/min
−40%
FLUX.2 Proनया
flux.2-pro
flagship image generation
$0.027/img$0.031/img
−13%
flux.1-schnell
fast image generation
$0.0025/img$0.003/img
−17%
gemini-2.5-flash
multimodal chat, 1M context
1M
$0.255$0.30
$2.125$2.50
−15%
Gemini 2.5 Flash Imageनया
gemini-2.5-flash-image
image generation
1M
$0.255$0.30
$25.50$30.00
−15%
gemini-2.5-flash-lite
high-volume cheap tasks
1M
$0.085$0.10
$0.34$0.40
−15%
gemini-3-flash-preview
next-gen flash reasoning
1M
$0.425$0.50
$2.55$3.00
−15%
Gemini 3 Pro Image Previewनया
gemini-3-pro-image-preview
pro-grade image generation
1M
$1.70$2.00
$102.00$120.00
−15%
gemini-3.1-pro-preview
flagship reasoning, 1M context
1M
$1.70$2.00
$10.20$12.00
−15%
gemini-3.5-flash
next-gen Flash GA, 1M context
1M
$1.275$1.50
$7.65$9.00
−15%
gemini-2.5-pro
pro मिड-टियर reasoning, 1M context
1M
$1.0625$1.25
$8.50$10.00
−15%
gemini-3.1-flash-lite
newest low-cost workhorse, high volume
1M
$0.2125$0.25
$1.275$1.50
−15%

Text-model comparisons OpenRouter, Together AI और Fireworks AI के खिलाफ हैं। Image और audio rows में May 2026 के QSP list prices दिखाए गए हैं।

कैलकुलेटर

आप कितना बचाएँगे?

अपना monthly usage भरें — QSP और हर competitor की लागत देखें।

मासिक कुल (10:1 input/output):
Reasoning मॉडल में output token count में सोचने की trace भी शामिल होती है, जो आमतौर पर दिखने वाले जवाब से 3-10 गुना ज्यादा होती है।
1M
300K
QuickSilver Pro
$0.13सबसे सस्ता
OpenRouter
$0.16+25%
OpenAIclosed model analog
$0.33+2.6×
QSP, OpenRouter की तुलना में 3¢/month बचाता है (20% cheaper)।
CLIqsp

टर्मिनल और AI agents के लिए बनाया गया। --json output stable exit codes के साथ आता है — Claude Code, Cursor और Aider इसे HTML parse किए बिना कॉल कर सकते हैं।

FAQ

सामान्य प्रश्न

यह 9 top open-source LLMs — DeepSeek V4 Flash और Pro, V3, R1, Qwen 3.7 Max, 3.6 Plus, 3.6 और 3.5-35B-A3B, और Kimi K2.6 — के लिए OpenAI-compatible HTTP API है। official OpenAI SDK को हमारे base URL पर point करें और वही chat-completions interface पाएँ, बाकी resellers से 20% कम कीमत पर।

V4 Flash DeepSeek का सबसे नया मॉडल है (अप्रैल 2026 में रिलीज़): output में V3 से ~74% सस्ता, 128K की जगह 1M context, और डिफ़ॉल्ट रूप से सोचता है (chain-of-thought reasoning) — इसलिए एक-token का "Hi" भी ~175 reasoning tokens लौटा सकता है। बिना thinking overhead के V3 जैसी सस्ती चैट के लिए, request body में `reasoning: { enabled: false }` पास करें। मौजूदा V3 बिना किसी बदलाव के काम करती रहेगी।

उसी open-source models पर यह OpenRouter, Together AI, Fireworks AI और DeepInfra की public per-token rates से 20% कम है। V4 Flash: $0.08 / $0.16। V4 Pro: $0.348 / $0.696। V3: $0.16 / $0.616। R1: $0.56 / $2.00। Qwen 3.7 Max: $2.00 / $6.00। Qwen 3.6 Plus: $0.26 / $1.56। Qwen 3.6: $0.12 / $0.80। Qwen 3.5: $0.111 / $0.80। Kimi K2.6: $0.584 / $2.79। हम closed models (GPT-4, Claude) नहीं देते।

हाँ। official openai Python / Node / Swift SDKs में base_url को https://api.quicksilverpro.io/v1 कर दें। Streaming, tool calling, json_schema strict mode और usage.cost accounting सब काम करते हैं।

लॉन्च बोनस: $5 से $50 तक की पहली credit खरीद पर 100% मैच। $5 दें, $10 मिलें। $50 दें, $100 मिलें। केवल पहली खरीद पर एक बार, automatically applied — उसके बाद standard pay-as-you-go।

आज ही inference पर बचत शुरू करें

अकाउंट बनाएं, credits खरीदें, और 30 सेकंड में API key पाएँ।

API कुंजी प्राप्त करें