Системный статус QuickSilver Pro

Все системы работают нормально
Проверка...

Сервисы

История за 90 дней · измерения в клиенте
Inference API
api.quicksilverpro.io
Проверка...
·
Бэкенд панели
pay.quicksilverpro.io
Проверка...
·
Сайт
quicksilverpro.io
Проверка...
·

Доступность моделей

Синтетический probe · обновление каждые 3 мин
DeepSeek V4 Flash
deepseek-v4-flash
1M контекста · дешевый чат, думает по умолчанию
Проверка...
·
DeepSeek V4 Pro
deepseek-v4-pro
1M контекста · премиальный reasoning
Проверка...
·
DeepSeek V3
deepseek-v3
128K контекста · универсальная модель
Проверка...
·
DeepSeek R1
deepseek-r1
128K контекста · reasoning
Проверка...
·
Qwen3.7 Max
qwen3.7-max
1M контекста · Qwen 3.7 флагман · agent
Проверка...
·
Qwen3.7 Plus
qwen3.7-plus
262K контекста · Qwen 3.7 agent · кодинг
Проверка...
·
Qwen3.6 Plus
qwen3.6-plus
1M контекста · 1T-MoE флагман · думает по умолчанию
Проверка...
·
Qwen3.6-35B-A3B
qwen3.6-35b
3B active · 262K контекста · обновленная MoE
Проверка...
·
Qwen3.5-35B-A3B
qwen3.5-35b
3B active · 262K контекста · MoE
Проверка...
·
Kimi K2.6
kimi-k2.6
256K контекста · agentic / planning
Проверка...
·
Kimi K2.7 Code
kimi-k2.7-code
256K контекста · agentic-кодинг
Проверка...
·
GLM 5.2
glm-5.2
1M контекста · рассуждения · agentic-кодинг
Проверка...
·

Roadmap: как мы становимся настоящей inference-компанией

1

Сейчас - запущены на курируемом каталоге

Live

Клиенты экономят 20% уже сегодня на курируемом каталоге по низким прейскурантным ценам. Узкая операционная поверхность - это и есть то, что удерживает разрыв честным, и тот же интерфейс продолжается в Phase 2 без изменений.

2

Q2 2026 - собственный inference-стек на H100/H200

Запланировано

Self-hosted serving на выделенных GPU с использованием SGLang + continuous batching, EAGLE-3 speculative decoding, FP8 quantization через DeepGEMM и кастомных ядер SageAttention / ThunderMLA. На этом этапе system_fingerprint станет стабильным (он будет меняться только при обновлении стека), а repeatable-seed workflows начнут нормально работать. Цель: быть на 30-50% дешевле текущих цен на DeepSeek V3.

3

H2 2026 - colocated data center + партнерства с AIDC

Будущее

Переход от аренды (Vast.ai) к собственным или colocated стойкам. Там, где это имеет смысл, будем работать с операторами AI-датацентров. Цель - самый дешевый и надежный inference для open-source моделей на планете: весь стек и вся инженерия под нашим контролем.

Об этой странице

Строки сервисов запускают client-side probes из вашего браузера. Строки моделей отражают реальный 1-token probe, который наш backend отправляет каждые 3 минуты. Исторические бары показывают результаты недавних проверок, сохраненных в localStorage; при смене устройства история очищается.

Публичное отслеживание аптайма началось 2026-04-16. Если вам нужен контрактный SLA и история, отслеживаемая третьей стороной, свяжитесь с нами.