Бонус к запуску

Open-source инференс,на 20% дешевле остальных.

9 самых популярных open-source моделей — DeepSeek V4 Flash и Pro, V3, R1, Qwen 3.7 Max + 3.6 Plus + 3.6 + 3.5, Kimi K2.6 — через OpenAI-совместимый API. Дешевле любого другого реселлера. Меняете одну строку кода.

или попробуйте модели на HuggingFace — без регистрации.

  • Без подписки
  • Совместимо с OpenAI
  • Оплата по мере использования
  • Текст + изображения
Работает с
  • OpenAI SDK
  • Aider
  • Cursor
  • Cline
  • Continue.dev
  • LangChain
  • Vercel AI SDK
python
1# Меняется одна строка. И всё.
2from openai import OpenAI
3 
4client = OpenAI(
5 base_url="https://api.quicksilverpro.io/v1",
6 api_key="your-api-key",
7)
Цены

Самый дешевый open-source inference

Для текстовых моделей цены указаны за 1M токенов; для изображений и аудио — за изображение или минуту, где это отмечено.

Модель
Контекст
Вход
Выход
Экономия
deepseek-v4-flash
быстрый чат и кодинг, 1M контекст, thinking включен по умолчанию
1M
$0.08$0.10
$0.16$0.20
−20%
DeepSeek V4 ProНовое
deepseek-v4-pro
премиальный reasoning, 1M контекст
1M
$0.348$0.435
$0.696$0.87
−20%
deepseek-v3
чат, кодинг, структурированный вывод
128K
$0.16$0.20
$0.616$0.77
−20%
DeepSeek R1Reasoning
deepseek-r1
математика, многошаговое reasoning, логика
128K
$0.56$0.70
$2.00$2.50
−20%
Qwen3.7 MaxНовое
qwen3.7-max
Qwen 3.7 флагман, agent / кодинг, 1M контекст
1M
$2.00$2.50
$6.00$7.50
−20%
Qwen3.7 PlusНовое
qwen3.7-plus
Qwen 3.7 agent-флагман, долгосрочное программирование
262K
$0.256$0.32
$1.024$1.28
−20%
Qwen3.6 PlusНовое
qwen3.6-plus
флагман, думает по умолчанию, 1M контекст
1M
$0.26$0.325
$1.56$1.95
−20%
qwen3.6-35b
long-context RAG, drop-in апгрейд 3.5
262K
$0.12$0.15
$0.80$1.00
−20%
qwen3.5-35b
длинный контекст, RAG, суммаризация
262K
$0.111$0.139
$0.80$1.00
−20%
kimi-k2.6
agentic / planning уровня Opus
256K
$0.584$0.73
$2.79$3.49
−20%
Kimi K2.7 CodeНовое
kimi-k2.7-code
Долгосрочное agentic-программирование
256K
$0.60$0.75
$2.80$3.50
−20%
Claude Opus 4.8Новое
claude-opus-4-8
топовые рассуждения, кодинг, агенты
1M
$4.00$5.00
$20.00$25.00
−20%
Claude Opus 4.6Новое
claude-opus-4-6
глубокие рассуждения и кодинг
1M
$4.00$5.00
$20.00$25.00
−20%
Claude Sonnet 4.6Новое
claude-sonnet-4-6
сбалансированный средний класс, быстрый
1M
$2.40$3.00
$12.00$15.00
−20%
Claude Haiku 4.5Новое
claude-haiku-4-5
быстрый, недорогой, высокая нагрузка
200K
$0.80$1.00
$4.00$5.00
−20%
Whisper Large V3 TurboНовое
whisper-large-v3-turbo
быстрый speech-to-text через /v1/audio/transcriptions
Audio
$0.0004/min$0.000667/min
−40%
FLUX.2 ProНовое
flux.2-pro
флагманская генерация изображений
$0.027/img$0.031/img
−13%
FLUX.1 SchnellНовое
flux.1-schnell
быстрая генерация изображений
$0.0025/img$0.003/img
−17%
gemini-2.5-flash
мультимодальный чат, 1M контекст
1M
$0.255$0.30
$2.125$2.50
−15%
Gemini 2.5 Flash ImageНовое
gemini-2.5-flash-image
генерация изображений
1M
$0.255$0.30
$25.50$30.00
−15%
gemini-2.5-flash-lite
массовые дешёвые задачи
1M
$0.085$0.10
$0.34$0.40
−15%
gemini-3-flash-preview
flash reasoning нового поколения
1M
$0.425$0.50
$2.55$3.00
−15%
Gemini 3 Pro Image PreviewНовое
gemini-3-pro-image-preview
генерация изображений про-уровня
1M
$1.70$2.00
$102.00$120.00
−15%
gemini-3.1-pro-preview
флагман reasoning, 1M контекст
1M
$1.70$2.00
$10.20$12.00
−15%
gemini-3.5-flash
следующее поколение Flash (GA), 1M контекст
1M
$1.275$1.50
$7.65$9.00
−15%
Gemini 2.5 ProНовое
gemini-2.5-pro
профи-рассуждения, 1M контекст
1M
$1.0625$1.25
$8.50$10.00
−15%
gemini-3.1-flash-lite
новейшая бюджетная модель, большие объёмы
1M
$0.2125$0.25
$1.275$1.50
−15%

Сравнение текстовых моделей идет с OpenRouter, Together AI и Fireworks AI. Для изображений и аудио показаны публичные цены QSP на май 2026 года.

Калькулятор

Сколько вы бы сэкономили?

Подставьте свой месячный объем — и увидите стоимость у QSP и у каждого конкурента.

Типовой месячный объём (10:1 вход/выход):
Для reasoning-моделей выходные токены включают цепочку рассуждений, которая обычно в 3-10 раз длиннее видимого ответа.
1M
300K
QuickSilver Pro
$0.13самый дешевый
OpenRouter
$0.16+25%
OpenAIclosed model analog
$0.33+2.6×
QSP экономит 3¢/month в месяц по сравнению с OpenRouter (20% cheaper).
CLIqsp

Сделано для терминалов и AI-агентов. --json вывод с устойчивыми кодами завершения — Claude Code, Cursor и Aider могут вызывать его без разбора HTML.

FAQ

Частые вопросы

Это OpenAI-совместимый HTTP API для 9 ведущих open-source LLM — DeepSeek V4 Flash и Pro, V3, R1, Qwen 3.7 Max, 3.6 Plus, 3.6 и 3.5-35B-A3B, а также Kimi K2.6. Достаточно направить официальный OpenAI SDK на наш base URL, и вы получите тот же интерфейс chat-completions, но на 20% дешевле конкурирующих реселлеров.

V4 Flash — новейшая модель DeepSeek (выпущена в апреле 2026): выход примерно на 74% дешевле, чем у V3, контекст 1M против 128K, и по умолчанию «думает» (chain-of-thought reasoning) — поэтому однотокеновое «Hi» может вернуть около 175 reasoning-токенов. Если вам нужен дешевый чат в стиле V3 без накладных расходов на размышления, передайте `reasoning: { enabled: false }` в теле запроса. Существующая V3 продолжает работать без изменений.

На 20% дешевле публичных цен за токен у OpenRouter, Together AI, Fireworks AI и DeepInfra на тех же open-source моделях. V4 Flash: $0.08 / $0.16. V4 Pro: $0.348 / $0.696. V3: $0.16 / $0.616. R1: $0.56 / $2.00. Qwen 3.7 Max: $2.00 / $6.00. Qwen 3.6 Plus: $0.26 / $1.56. Qwen 3.6: $0.12 / $0.80. Qwen 3.5: $0.111 / $0.80. Kimi K2.6: $0.584 / $2.79. Закрытые модели (GPT-4, Claude) мы не обслуживаем.

Да. Просто смените base_url на https://api.quicksilverpro.io/v1 в официальных openai SDK для Python / Node / Swift. Streaming, tool calling, strict mode для json_schema и учет usage.cost работают из коробки.

Бонус к запуску: на первую покупку кредитов от $5 до $50 мы добавляем 100% сверху. Платите $5 — получаете $10. Платите $50 — получаете $100. Только на первой покупке, начисляется автоматически. Дальше — стандартная оплата по мере использования.

Начните экономить на inference уже сегодня

Создайте аккаунт, пополните баланс и получите API-ключ за 30 секунд.

Получить API-ключ