QuickSilver Pro सिस्टम स्टेटस
सेवाएँ
मॉडल उपलब्धता
deepseek-v4-flashdeepseek-v4-prodeepseek-v3deepseek-r1qwen3.7-maxqwen3.7-plusqwen3.6-plusqwen3.6-35bqwen3.5-35bkimi-k2.6kimi-k2.7-codeglm-5.2रोडमैप - हम एक वास्तविक inference कंपनी कैसे बनेंगे
अभी - एक curated catalog पर लॉन्च
लाइवग्राहक आज ही 20% बचा सकते हैं — कम list prices वाले curated catalog पर। संकीर्ण operational surface ही gap को ईमानदार रखती है, और वही interface बिना बदलाव Phase 2 तक चलता है।
Q2 2026 - H100/H200 पर हमारा अपना inference stack
योजनाबद्धDedicated GPU पर self-hosted serving, जिसमें SGLang + continuous batching, EAGLE-3 speculative decoding, DeepGEMM के जरिए FP8 quantization, और SageAttention / ThunderMLA custom kernels शामिल होंगे। उस समय system_fingerprint स्थिर हो जाएगा (सिर्फ stack update होने पर बदलेगा), और repeatable-seed workflows ठीक से काम करेंगे। लक्ष्य: DeepSeek V3 की मौजूदा कीमतों से 30-50% नीचे जाना।
H2 2026 - colocated data center + AIDC partnerships
भविष्यRented capacity (Vast.ai) से self-owned या colocated racks की ओर बढ़ना। जहाँ उचित होगा वहाँ AI datacenter operators के साथ साझेदारी करना। लक्ष्य है open-source models के लिए दुनिया का सबसे सस्ता और विश्वसनीय inference stack बनाना - पूरा stack, हमारी engineering।
इस पेज के बारे में
Service rows आपके browser से client-side probes चलाते हैं। Model rows हमारे backend द्वारा हर 3 मिनट में भेजे गए एक वास्तविक 1-token probe को दिखाते हैं। Historical bars हाल की probes के परिणाम दिखाते हैं, जो इस browser के localStorageमें stored होते हैं; device बदलने पर ये साफ हो जाते हैं।
सार्वजनिक uptime tracking शुरू हुई 2026-04-16. यदि आपको contractual SLA और third-party monitored history चाहिए, तो हमसे संपर्क करें।