Бонус к запуску100% к первой покупке кредитов — до $50 бесплатно

Open-source инференс,на 20% дешевле остальных.

9 самых популярных open-source моделей — DeepSeek V4 Flash и Pro, V3, R1, Qwen 3.7 Max + 3.6 Plus + 3.6 + 3.5, Kimi K2.6 — через OpenAI-совместимый API. Дешевле любого другого реселлера. Меняете одну строку кода.

Получить API-ключ Посмотреть цены

или попробуйте модели на HuggingFace — без регистрации.

Без подписки
Совместимо с OpenAI
Оплата по мере использования
Текст + изображения

Работает с

OpenAI SDK
Aider
Cursor
Cline
Continue.dev
LangChain
Vercel AI SDK

python

1# Меняется одна строка. И всё.
2from openai import OpenAI
3 
4client = OpenAI(
5    base_url="https://api.quicksilverpro.io/v1",
6    api_key="your-api-key",
7)

Цены

Самый дешевый open-source inference

Для текстовых моделей цены указаны за 1M токенов; для изображений и аудио — за изображение или минуту, где это отмечено.

Модель

Контекст

Вход

Выход

Экономия

DeepSeek V4 FlashНовое

deepseek-v4-flash

быстрый чат и кодинг, 1M контекст, thinking включен по умолчанию

$0.08$0.10

$0.16$0.20

−20%

DeepSeek V4 ProНовое

deepseek-v4-pro

премиальный reasoning, 1M контекст

$0.348$0.435

$0.696$0.87

−20%

DeepSeek V3

deepseek-v3

чат, кодинг, структурированный вывод

128K

$0.16$0.20

$0.616$0.77

−20%

DeepSeek R1Reasoning

deepseek-r1

математика, многошаговое reasoning, логика

128K

$0.56$0.70

$2.00$2.50

−20%

Qwen3.7 MaxНовое

qwen3.7-max

Qwen 3.7 флагман, agent / кодинг, 1M контекст

$2.00$2.50

$6.00$7.50

−20%

Qwen3.7 PlusНовое

qwen3.7-plus

Qwen 3.7 agent-флагман, долгосрочное программирование

262K

$0.256$0.32

$1.024$1.28

−20%

Qwen3.6 PlusНовое

qwen3.6-plus

флагман, думает по умолчанию, 1M контекст

$0.26$0.325

$1.56$1.95

−20%

Qwen3.6-35B-A3B

qwen3.6-35b

long-context RAG, drop-in апгрейд 3.5

262K

$0.12$0.15

$0.80$1.00

−20%

Qwen3.5-35B-A3B

qwen3.5-35b

длинный контекст, RAG, суммаризация

262K

$0.111$0.139

$0.80$1.00

−20%

Kimi K2.6

kimi-k2.6

agentic / planning уровня Opus

256K

$0.584$0.73

$2.79$3.49

−20%

Kimi K2.7 CodeНовое

kimi-k2.7-code

Долгосрочное agentic-программирование

256K

$0.60$0.75

$2.80$3.50

−20%

Claude Opus 4.8Новое

claude-opus-4-8

топовые рассуждения, кодинг, агенты

$4.00$5.00

$20.00$25.00

−20%

Claude Opus 4.6Новое

claude-opus-4-6

глубокие рассуждения и кодинг

$4.00$5.00

$20.00$25.00

−20%

Claude Sonnet 4.6Новое

claude-sonnet-4-6

сбалансированный средний класс, быстрый

$2.40$3.00

$12.00$15.00

−20%

Claude Haiku 4.5Новое

claude-haiku-4-5

быстрый, недорогой, высокая нагрузка

200K

$0.80$1.00

$4.00$5.00

−20%

Whisper Large V3 TurboНовое

whisper-large-v3-turbo

быстрый speech-to-text через /v1/audio/transcriptions

Audio

$0.0004/min$0.000667/min

—

−40%

FLUX.2 ProНовое

flux.2-pro

флагманская генерация изображений

—

$0.027/img$0.031/img

−13%

FLUX.1 SchnellНовое

flux.1-schnell

быстрая генерация изображений

—

$0.0025/img$0.003/img

−17%

Gemini 2.5 FlashНовое

gemini-2.5-flash

мультимодальный чат, 1M контекст

$0.255$0.30

$2.125$2.50

−15%

Gemini 2.5 Flash ImageНовое

gemini-2.5-flash-image

генерация изображений

$0.255$0.30

$25.50$30.00

−15%

Gemini 2.5 Flash LiteНовое

gemini-2.5-flash-lite

массовые дешёвые задачи

$0.085$0.10

$0.34$0.40

−15%

Gemini 3 Flash PreviewНовое

gemini-3-flash-preview

flash reasoning нового поколения

$0.425$0.50

$2.55$3.00

−15%

Gemini 3 Pro Image PreviewНовое

gemini-3-pro-image-preview

генерация изображений про-уровня

$1.70$2.00

$102.00$120.00

−15%

Gemini 3.1 Pro PreviewНовое

gemini-3.1-pro-preview

флагман reasoning, 1M контекст

$1.70$2.00

$10.20$12.00

−15%

Gemini 3.5 FlashНовое

gemini-3.5-flash

следующее поколение Flash (GA), 1M контекст

$1.275$1.50

$7.65$9.00

−15%

Gemini 2.5 ProНовое

gemini-2.5-pro

профи-рассуждения, 1M контекст

$1.0625$1.25

$8.50$10.00

−15%

Gemini 3.1 Flash LiteНовое

gemini-3.1-flash-lite

новейшая бюджетная модель, большие объёмы

$0.2125$0.25

$1.275$1.50

−15%

Сравнение текстовых моделей идет с OpenRouter, Together AI и Fireworks AI. Для изображений и аудио показаны публичные цены QSP на май 2026 года.

Построчное сравнение цен со всеми конкурентами

DeepSeek V3 для tool-calling агентов →

Reasoning

DeepSeek R1 для математики и алгоритмов →

Длинный контекст

Qwen3.5-35B-A3B для 262K RAG →

Все сравнения →

Калькулятор

Сколько вы бы сэкономили?

Подставьте свой месячный объем — и увидите стоимость у QSP и у каждого конкурента.

Типовой месячный объём (10:1 вход/выход):

Для reasoning-моделей выходные токены включают цепочку рассуждений, которая обычно в 3-10 раз длиннее видимого ответа.

Входных токенов / месяц1M

Выходных токенов / месяц300K

QuickSilver Pro

$0.13самый дешевый

OpenRouter

$0.16+25%

OpenAIclosed model analog

$0.33+2.6×

QSP экономит 3¢/month в месяц по сравнению с OpenRouter (20% cheaper).

CLIqsp

Сделано для терминалов и AI-агентов. --json вывод с устойчивыми кодами завершения — Claude Code, Cursor и Aider могут вызывать его без разбора HTML.

PyPI GitHub Quickstart →

FAQ

Частые вопросы

Что такое QuickSilver Pro?

Это OpenAI-совместимый HTTP API для 9 ведущих open-source LLM — DeepSeek V4 Flash и Pro, V3, R1, Qwen 3.7 Max, 3.6 Plus, 3.6 и 3.5-35B-A3B, а также Kimi K2.6. Достаточно направить официальный OpenAI SDK на наш base URL, и вы получите тот же интерфейс chat-completions, но на 20% дешевле конкурирующих реселлеров.

В чем разница между V3 и V4 Flash?

V4 Flash — новейшая модель DeepSeek (выпущена в апреле 2026): выход примерно на 74% дешевле, чем у V3, контекст 1M против 128K, и по умолчанию «думает» (chain-of-thought reasoning) — поэтому однотокеновое «Hi» может вернуть около 175 reasoning-токенов. Если вам нужен дешевый чат в стиле V3 без накладных расходов на размышления, передайте `reasoning: { enabled: false }` в теле запроса. Существующая V3 продолжает работать без изменений.

Насколько дешевле OpenRouter / OpenAI?

На 20% дешевле публичных цен за токен у OpenRouter, Together AI, Fireworks AI и DeepInfra на тех же open-source моделях. V4 Flash: $0.08 / $0.16. V4 Pro: $0.348 / $0.696. V3: $0.16 / $0.616. R1: $0.56 / $2.00. Qwen 3.7 Max: $2.00 / $6.00. Qwen 3.6 Plus: $0.26 / $1.56. Qwen 3.6: $0.12 / $0.80. Qwen 3.5: $0.111 / $0.80. Kimi K2.6: $0.584 / $2.79. Закрытые модели (GPT-4, Claude) мы не обслуживаем.

Это действительно drop-in замена OpenAI?

Да. Просто смените base_url на https://api.quicksilverpro.io/v1 в официальных openai SDK для Python / Node / Swift. Streaming, tool calling, strict mode для json_schema и учет usage.cost работают из коробки.

Есть ли бесплатный тариф?

Бонус к запуску: на первую покупку кредитов от $5 до $50 мы добавляем 100% сверху. Платите $5 — получаете $10. Платите $50 — получаете $100. Только на первой покупке, начисляется автоматически. Дальше — стандартная оплата по мере использования.

Смотреть все вопросы

Начните экономить на inference уже сегодня

Создайте аккаунт, пополните баланс и получите API-ключ за 30 секунд.

Получить API-ключ