लॉन्च बोनसपहली क्रेडिट खरीद पर 100% मैच — $50 तक मुफ्त

Open-source इन्फरेंस,बाकियों से 20% कम।

9 सबसे लोकप्रिय open-source models — DeepSeek V4 Flash और Pro, V3, R1, Qwen 3.7 Max + 3.6 Plus + 3.6 + 3.5, Kimi K2.6 — अब OpenAI-compatible API के साथ। हर दूसरे reseller से सस्ता। बस एक लाइन कोड बदलें।

API कुंजी प्राप्त करें कीमत देखें

या HuggingFace पर models लाइव आज़माएँ — signup की जरूरत नहीं।

कोई subscription नहीं
OpenAI compatible
जितना उपयोग उतना भुगतान
टेक्स्ट + इमेज

इनके साथ काम करता है

OpenAI SDK
Aider
Cursor
Cline
Continue.dev
LangChain
Vercel AI SDK

python

1# बस एक लाइन बदलें। इतना ही।
2from openai import OpenAI
3 
4client = OpenAI(
5    base_url="https://api.quicksilverpro.io/v1",
6    api_key="your-api-key",
7)

कीमत

सबसे सस्ता open-source inference

Text models के लिए 1M tokens pricing; image और audio models के लिए जहां noted हो वहां per-image या per-minute pricing.

मॉडल

कॉन्टेक्स्ट

इनपुट

आउटपुट

बचत

DeepSeek V4 Flashनया

deepseek-v4-flash

तेज़ चैट और कोडिंग, 1M context, thinking डिफ़ॉल्ट रूप से ON

$0.08$0.10

$0.16$0.20

−20%

DeepSeek V4 Proनया

deepseek-v4-pro

प्रीमियम reasoning, 1M context

$0.348$0.435

$0.696$0.87

−20%

DeepSeek V3

deepseek-v3

चैट, कोडिंग, structured output

128K

$0.16$0.20

$0.616$0.77

−20%

DeepSeek R1रीज़निंग

deepseek-r1

गणित, multi-step reasoning, logic

128K

$0.56$0.70

$2.00$2.50

−20%

Qwen3.7 Maxनया

qwen3.7-max

Qwen 3.7 flagship, agent / coding, 1M context

$2.00$2.50

$6.00$7.50

−20%

Qwen3.7 Plusनया

qwen3.7-plus

Qwen 3.7 agent flagship, long-horizon coding

262K

$0.256$0.32

$1.024$1.28

−20%

Qwen3.6 Plusनया

qwen3.6-plus

thinks-by-default flagship, 1M context

$0.26$0.325

$1.56$1.95

−20%

Qwen3.6-35B-A3B

qwen3.6-35b

long-context RAG, 3.5 का drop-in upgrade

262K

$0.12$0.15

$0.80$1.00

−20%

Qwen3.5-35B-A3B

qwen3.5-35b

long-context RAG, summarization

262K

$0.111$0.139

$0.80$1.00

−20%

Kimi K2.6

kimi-k2.6

Opus-class agentic / planning

256K

$0.584$0.73

$2.79$3.49

−20%

Kimi K2.7 Codeनया

kimi-k2.7-code

Long-horizon agentic coding

256K

$0.60$0.75

$2.80$3.50

−20%

GLM 5.2नया

glm-5.2

long-horizon agents, project-level coding

$0.80$1.00

$3.20$4.00

−20%

Claude Opus 4.8नया

claude-opus-4-8

top-tier reasoning, coding, agentic

$4.00$5.00

$20.00$25.00

−20%

Claude Opus 4.6नया

claude-opus-4-6

गहन reasoning और coding

$4.00$5.00

$20.00$25.00

−20%

Claude Sonnet 4.6नया

claude-sonnet-4-6

संतुलित mid-tier, तेज़ और सक्षम

$2.40$3.00

$12.00$15.00

−20%

Claude Haiku 4.5नया

claude-haiku-4-5

तेज़, कम लागत, high-volume tasks

200K

$0.80$1.00

$4.00$5.00

−20%

Whisper Large V3 Turboनया

whisper-large-v3-turbo

/v1/audio/transcriptions के जरिए तेज़ speech-to-text

Audio

$0.0004/min$0.000667/min

—

−40%

FLUX.2 Proनया

flux.2-pro

flagship image generation

—

$0.027/img$0.031/img

−13%

FLUX.1 Schnellनया

flux.1-schnell

fast image generation

—

$0.0025/img$0.003/img

−17%

Gemini 2.5 Flashनया

gemini-2.5-flash

multimodal chat, 1M context

$0.255$0.30

$2.125$2.50

−15%

Gemini 2.5 Flash Imageनया

gemini-2.5-flash-image

image generation

$0.255$0.30

$25.50$30.00

−15%

Gemini 2.5 Flash Liteनया

gemini-2.5-flash-lite

high-volume cheap tasks

$0.085$0.10

$0.34$0.40

−15%

Gemini 3 Flash Previewनया

gemini-3-flash-preview

next-gen flash reasoning

$0.425$0.50

$2.55$3.00

−15%

Gemini 3 Pro Image Previewनया

gemini-3-pro-image-preview

pro-grade image generation

$1.70$2.00

$102.00$120.00

−15%

Gemini 3.1 Pro Previewनया

gemini-3.1-pro-preview

flagship reasoning, 1M context

$1.70$2.00

$10.20$12.00

−15%

Gemini 3.5 Flashनया

gemini-3.5-flash

next-gen Flash GA, 1M context

$1.275$1.50

$7.65$9.00

−15%

Gemini 2.5 Proनया

gemini-2.5-pro

pro मिड-टियर reasoning, 1M context

$1.0625$1.25

$8.50$10.00

−15%

Gemini 3.1 Flash Liteनया

gemini-3.1-flash-lite

newest low-cost workhorse, high volume

$0.2125$0.25

$1.275$1.50

−15%

Text-model comparisons OpenRouter, Together AI और Fireworks AI के खिलाफ हैं। Image और audio rows में May 2026 के QSP list prices दिखाए गए हैं।

हर competitor के साथ side-by-side pricing

tool-calling agents के लिए DeepSeek V3 →

रीज़निंग

गणित और algorithms के लिए DeepSeek R1 →

लॉन्ग कॉन्टेक्स्ट

262K RAG के लिए Qwen3.5-35B-A3B →

सभी तुलना देखें →

कैलकुलेटर

आप कितना बचाएँगे?

अपना monthly usage भरें — QSP और हर competitor की लागत देखें।

मासिक कुल (10:1 input/output):

Reasoning मॉडल में output token count में सोचने की trace भी शामिल होती है, जो आमतौर पर दिखने वाले जवाब से 3-10 गुना ज्यादा होती है।

इनपुट tokens / महीना1M

आउटपुट tokens / महीना300K

QuickSilver Pro

$0.13सबसे सस्ता

OpenRouter

$0.16+25%

OpenAIclosed model analog

$0.33+2.6×

QSP, OpenRouter की तुलना में 3¢/month बचाता है (20% cheaper)।

CLIqsp

टर्मिनल और AI agents के लिए बनाया गया। --json output stable exit codes के साथ आता है — Claude Code, Cursor और Aider इसे HTML parse किए बिना कॉल कर सकते हैं।

PyPI GitHub Quickstart →

FAQ

सामान्य प्रश्न

QuickSilver Pro क्या है?

यह 9 top open-source LLMs — DeepSeek V4 Flash और Pro, V3, R1, Qwen 3.7 Max, 3.6 Plus, 3.6 और 3.5-35B-A3B, और Kimi K2.6 — के लिए OpenAI-compatible HTTP API है। official OpenAI SDK को हमारे base URL पर point करें और वही chat-completions interface पाएँ, बाकी resellers से 20% कम कीमत पर।

V3 और V4 Flash में क्या अंतर है?

V4 Flash DeepSeek का सबसे नया मॉडल है (अप्रैल 2026 में रिलीज़): output में V3 से ~74% सस्ता, 128K की जगह 1M context, और डिफ़ॉल्ट रूप से सोचता है (chain-of-thought reasoning) — इसलिए एक-token का "Hi" भी ~175 reasoning tokens लौटा सकता है। बिना thinking overhead के V3 जैसी सस्ती चैट के लिए, request body में `reasoning: { enabled: false }` पास करें। मौजूदा V3 बिना किसी बदलाव के काम करती रहेगी।

OpenRouter / OpenAI की तुलना में कितना सस्ता है?

उसी open-source models पर यह OpenRouter, Together AI, Fireworks AI और DeepInfra की public per-token rates से 20% कम है। V4 Flash: $0.08 / $0.16। V4 Pro: $0.348 / $0.696। V3: $0.16 / $0.616। R1: $0.56 / $2.00। Qwen 3.7 Max: $2.00 / $6.00। Qwen 3.6 Plus: $0.26 / $1.56। Qwen 3.6: $0.12 / $0.80। Qwen 3.5: $0.111 / $0.80। Kimi K2.6: $0.584 / $2.79। हम closed models (GPT-4, Claude) नहीं देते।

क्या यह सच में OpenAI का drop-in replacement है?

हाँ। official openai Python / Node / Swift SDKs में base_url को https://api.quicksilverpro.io/v1 कर दें। Streaming, tool calling, json_schema strict mode और usage.cost accounting सब काम करते हैं।

क्या free tier है?

लॉन्च बोनस: $5 से $50 तक की पहली credit खरीद पर 100% मैच। $5 दें, $10 मिलें। $50 दें, $100 मिलें। केवल पहली खरीद पर एक बार, automatically applied — उसके बाद standard pay-as-you-go।

सभी प्रश्न देखें

आज ही inference पर बचत शुरू करें

अकाउंट बनाएं, credits खरीदें, और 30 सेकंड में API key पाएँ।

API कुंजी प्राप्त करें