उपयोग मामला

कोडिंग के लिए DeepSeek V3

DeepSeek V3 एक open-source 671B MoE मॉडल है (37B active) जो code generation बेंचमार्क्स पर मजबूत है और OpenAI tool calling को पूरी तरह सपोर्ट करता है। QuickSilver Pro पर $0.16 input / $0.616 output प्रति 1M tokens की कीमत पर, यह coding agents और PR bots के लिए व्यावहारिक default है, जहाँ GPT-4 स्तर की quality चाहिए लेकिन 5-10x कम लागत में।

$0.16 / $0.616 per 1M tokens

कोडिंग में V3 किस बात में अच्छा है

Code generation: HumanEval, MBPP और LiveCodeBench पर मजबूत स्कोर। यह idiomatic Python, JavaScript, Go, Rust और TypeScript लिखता है। 128K context window के भीतर multi-file refactors को भी अच्छी तरह संभालता है.

Tool calling: OpenAI tools / function calling लागू करता है। LangChain agents, LlamaIndex ReAct loops, Aider, Cline, Cursor — किसी भी ऐसे framework में drop-in replacement है जो response में tool_calls अपेक्षित करता है.

Structured output: response_format: json_schema strict mode सपोर्ट करता है। यह code-review bots, JSON patch निकालने वाले fixers, और API doc generators के लिए उपयोगी है.

कोडिंग के लिए V3 कब लें और R1 कब

रोजमर्रा की code generation, refactoring, PR reviews और documentation के लिए default रूप से V3 चुनें। यह सस्ता है, तेज है, और output छोटा व सीधा होता है — बिना लंबी chain-of-thought preamble के.

R1 पर तब जाएँ जब step-by-step reasoning की जरूरत हो: competitive programming, tricky concurrency bugs, mathematical specs से code port करना, या intermittent failures debug करना.

खर्च के हिसाब से देखें तो R1 का output $2.00 प्रति 1M tokens है और यह 3-5x ज्यादा tokens भी जनरेट करता है, क्योंकि इसका thinking trace भी output का हिस्सा है। routine coding के लिए यह अक्सर 10-15x महँगा पड़ता है, बिना स्पष्ट quality gain के।

क्विकस्टार्ट कोड

python
from openai import OpenAI

client = OpenAI(
    base_url="https://api.quicksilverpro.io/v1",
    api_key="sk-qsp-...",
)

resp = client.chat.completions.create(
    model="deepseek-v3",
    messages=[
        {"role": "system", "content": "You are a senior Python engineer. Write clean, idiomatic code."},
        {"role": "user", "content": "Implement an LRU cache in Python without using functools.lru_cache."},
    ],
    temperature=0.2,
)
print(resp.choices[0].message.content)
print(f"Cost: ${resp.usage.cost:.6f}")
python-tools
tools = [
    {
        "type": "function",
        "function": {
            "name": "read_file",
            "description": "Read a file from disk",
            "parameters": {
                "type": "object",
                "properties": {"path": {"type": "string"}},
                "required": ["path"],
            },
        },
    },
    {
        "type": "function",
        "function": {
            "name": "write_file",
            "description": "Write content to a file",
            "parameters": {
                "type": "object",
                "properties": {
                    "path": {"type": "string"},
                    "content": {"type": "string"},
                },
                "required": ["path", "content"],
            },
        },
    },
]

resp = client.chat.completions.create(
    model="deepseek-v3",
    messages=[{"role": "user", "content": "Refactor app.py to extract the auth helpers."}],
    tools=tools,
    tool_choice="auto",
)
for call in resp.choices[0].message.tool_calls or []:
    print(call.function.name, call.function.arguments)

FAQ

पब्लिश्ड benchmarks (HumanEval, MBPP, LiveCodeBench) पर DeepSeek V3, GPT-4o के साथ प्रतिस्पर्धी दिखता है। वास्तविक developer perception task पर निर्भर करेगी; mainstream languages में V3 अक्सर ज्यादा साफ और idiomatic code देता है। edge-case languages या domain-specific code (जैसे Verilog, COBOL) में GPT-4 अभी भी बेहतर है।

हाँ। तीनों custom OpenAI base URL स्वीकार करते हैं। Aider के लिए: aider --openai-api-base https://api.quicksilverpro.io/v1 --openai-api-key $QSP_KEY --model deepseek-v3। Cline और Cursor में भी 'Custom OpenAI-compatible provider' सेटिंग्स हैं जिनमें यही values दी जा सकती हैं।

हाँ। response_format: {type: "json_schema", json_schema: {...}} पास करें। मॉडल schema के मुताबिक वैध JSON निकालेगा; strict mode decoder को grammar के भीतर रखता है।

QuickSilver Pro पर 131,072 tokens। अधिकांश repos में multi-file refactors के लिए यह काफी है। बड़े codebases में retrieval के साथ काम करें और केवल relevant files भेजें, या 262K context वाले Qwen3.5-35B-A3B पर जाएँ।

दोगुने क्रेडिट के साथ आज़माएँ — $50 तक मुफ्त

API Key लें