Статус и roadmap - QuickSilver Pro

Все системы работают нормально

Проверка...

Сервисы

История за 90 дней · измерения в клиенте

Inference API

api.quicksilverpro.io

Проверка...

— · —

Бэкенд панели

pay.quicksilverpro.io

Проверка...

— · —

Сайт

quicksilverpro.io

Проверка...

— · —

Доступность моделей

Синтетический probe · обновление каждые 3 мин

DeepSeek V4 Flash

deepseek-v4-flash

1M контекста · дешевый чат, думает по умолчанию

Проверка...

— · —

DeepSeek V4 Pro

deepseek-v4-pro

1M контекста · премиальный reasoning

Проверка...

— · —

DeepSeek V3

deepseek-v3

128K контекста · универсальная модель

Проверка...

— · —

DeepSeek R1

deepseek-r1

128K контекста · reasoning

Проверка...

— · —

Qwen3.7 Max

qwen3.7-max

1M контекста · Qwen 3.7 флагман · agent

Проверка...

— · —

Qwen3.7 Plus

qwen3.7-plus

262K контекста · Qwen 3.7 agent · кодинг

Проверка...

— · —

Qwen3.6 Plus

qwen3.6-plus

1M контекста · 1T-MoE флагман · думает по умолчанию

Проверка...

— · —

Qwen3.6-35B-A3B

qwen3.6-35b

3B active · 262K контекста · обновленная MoE

Проверка...

— · —

Qwen3.5-35B-A3B

qwen3.5-35b

3B active · 262K контекста · MoE

Проверка...

— · —

Kimi K2.6

kimi-k2.6

256K контекста · agentic / planning

Проверка...

— · —

Kimi K2.7 Code

kimi-k2.7-code

256K контекста · agentic-кодинг

Проверка...

— · —

GLM 5.2

glm-5.2

1M контекста · рассуждения · agentic-кодинг

Проверка...

— · —

Roadmap: как мы становимся настоящей inference-компанией

Сейчас - запущены на курируемом каталоге

Live

Клиенты экономят 20% уже сегодня на курируемом каталоге по низким прейскурантным ценам. Узкая операционная поверхность - это и есть то, что удерживает разрыв честным, и тот же интерфейс продолжается в Phase 2 без изменений.

Q2 2026 - собственный inference-стек на H100/H200

Запланировано

Self-hosted serving на выделенных GPU с использованием SGLang + continuous batching, EAGLE-3 speculative decoding, FP8 quantization через DeepGEMM и кастомных ядер SageAttention / ThunderMLA. На этом этапе system_fingerprint станет стабильным (он будет меняться только при обновлении стека), а repeatable-seed workflows начнут нормально работать. Цель: быть на 30-50% дешевле текущих цен на DeepSeek V3.

H2 2026 - colocated data center + партнерства с AIDC

Будущее

Переход от аренды (Vast.ai) к собственным или colocated стойкам. Там, где это имеет смысл, будем работать с операторами AI-датацентров. Цель - самый дешевый и надежный inference для open-source моделей на планете: весь стек и вся инженерия под нашим контролем.

Об этой странице

Строки сервисов запускают client-side probes из вашего браузера. Строки моделей отражают реальный 1-token probe, который наш backend отправляет каждые 3 минуты. Исторические бары показывают результаты недавних проверок, сохраненных в localStorage; при смене устройства история очищается.

Публичное отслеживание аптайма началось 2026-04-16. Если вам нужен контрактный SLA и история, отслеживаемая третьей стороной, свяжитесь с нами.

Системный статус QuickSilver Pro

Сервисы

Доступность моделей

Roadmap: как мы становимся настоящей inference-компанией

Сейчас - запущены на курируемом каталоге

Q2 2026 - собственный inference-стек на H100/H200

H2 2026 - colocated data center + партнерства с AIDC

Об этой странице