Системный статус QuickSilver Pro
Сервисы
Доступность моделей
deepseek-v4-flashdeepseek-v4-prodeepseek-v3deepseek-r1qwen3.7-maxqwen3.7-plusqwen3.6-plusqwen3.6-35bqwen3.5-35bkimi-k2.6kimi-k2.7-codeglm-5.2Roadmap: как мы становимся настоящей inference-компанией
Сейчас - запущены на курируемом каталоге
LiveКлиенты экономят 20% уже сегодня на курируемом каталоге по низким прейскурантным ценам. Узкая операционная поверхность - это и есть то, что удерживает разрыв честным, и тот же интерфейс продолжается в Phase 2 без изменений.
Q2 2026 - собственный inference-стек на H100/H200
ЗапланированоSelf-hosted serving на выделенных GPU с использованием SGLang + continuous batching, EAGLE-3 speculative decoding, FP8 quantization через DeepGEMM и кастомных ядер SageAttention / ThunderMLA. На этом этапе system_fingerprint станет стабильным (он будет меняться только при обновлении стека), а repeatable-seed workflows начнут нормально работать. Цель: быть на 30-50% дешевле текущих цен на DeepSeek V3.
H2 2026 - colocated data center + партнерства с AIDC
БудущееПереход от аренды (Vast.ai) к собственным или colocated стойкам. Там, где это имеет смысл, будем работать с операторами AI-датацентров. Цель - самый дешевый и надежный inference для open-source моделей на планете: весь стек и вся инженерия под нашим контролем.
Об этой странице
Строки сервисов запускают client-side probes из вашего браузера. Строки моделей отражают реальный 1-token probe, который наш backend отправляет каждые 3 минуты. Исторические бары показывают результаты недавних проверок, сохраненных в localStorage; при смене устройства история очищается.
Публичное отслеживание аптайма началось 2026-04-16. Если вам нужен контрактный SLA и история, отслеживаемая третьей стороной, свяжитесь с нами.