Open-source инференс,на 20% дешевле остальных.
9 самых популярных open-source моделей — DeepSeek V4 Flash и Pro, V3, R1, Qwen 3.7 Max + 3.6 Plus + 3.6 + 3.5, Kimi K2.6 — через OpenAI-совместимый API. Дешевле любого другого реселлера. Меняете одну строку кода.
или попробуйте модели на HuggingFace — без регистрации.
- Без подписки
- Совместимо с OpenAI
- Оплата по мере использования
- Текст + изображения
- OpenAI SDK
- Aider
- Cursor
- Cline
- Continue.dev
- LangChain
- Vercel AI SDK
1# Меняется одна строка. И всё.2from openai import OpenAI34client = OpenAI(5 base_url="https://api.quicksilverpro.io/v1",6 api_key="your-api-key",7)
Самый дешевый open-source inference
Для текстовых моделей цены указаны за 1M токенов; для изображений и аудио — за изображение или минуту, где это отмечено.
deepseek-v4-flashclaude-opus-4-8claude-opus-4-6claude-sonnet-4-6claude-haiku-4-5whisper-large-v3-turbogemini-2.5-flash-imagegemini-3-pro-image-previewСравнение текстовых моделей идет с OpenRouter, Together AI и Fireworks AI. Для изображений и аудио показаны публичные цены QSP на май 2026 года.
Построчное сравнение цен со всеми конкурентами
Сколько вы бы сэкономили?
Подставьте свой месячный объем — и увидите стоимость у QSP и у каждого конкурента.
qspСделано для терминалов и AI-агентов. --json вывод с устойчивыми кодами завершения — Claude Code, Cursor и Aider могут вызывать его без разбора HTML.
Частые вопросы
Это OpenAI-совместимый HTTP API для 9 ведущих open-source LLM — DeepSeek V4 Flash и Pro, V3, R1, Qwen 3.7 Max, 3.6 Plus, 3.6 и 3.5-35B-A3B, а также Kimi K2.6. Достаточно направить официальный OpenAI SDK на наш base URL, и вы получите тот же интерфейс chat-completions, но на 20% дешевле конкурирующих реселлеров.
V4 Flash — новейшая модель DeepSeek (выпущена в апреле 2026): выход примерно на 74% дешевле, чем у V3, контекст 1M против 128K, и по умолчанию «думает» (chain-of-thought reasoning) — поэтому однотокеновое «Hi» может вернуть около 175 reasoning-токенов. Если вам нужен дешевый чат в стиле V3 без накладных расходов на размышления, передайте `reasoning: { enabled: false }` в теле запроса. Существующая V3 продолжает работать без изменений.
На 20% дешевле публичных цен за токен у OpenRouter, Together AI, Fireworks AI и DeepInfra на тех же open-source моделях. V4 Flash: $0.08 / $0.16. V4 Pro: $0.348 / $0.696. V3: $0.16 / $0.616. R1: $0.56 / $2.00. Qwen 3.7 Max: $2.00 / $6.00. Qwen 3.6 Plus: $0.26 / $1.56. Qwen 3.6: $0.12 / $0.80. Qwen 3.5: $0.111 / $0.80. Kimi K2.6: $0.584 / $2.79. Закрытые модели (GPT-4, Claude) мы не обслуживаем.
Да. Просто смените base_url на https://api.quicksilverpro.io/v1 в официальных openai SDK для Python / Node / Swift. Streaming, tool calling, strict mode для json_schema и учет usage.cost работают из коробки.
Бонус к запуску: на первую покупку кредитов от $5 до $50 мы добавляем 100% сверху. Платите $5 — получаете $10. Платите $50 — получаете $100. Только на первой покупке, начисляется автоматически. Дальше — стандартная оплата по мере использования.
Начните экономить на inference уже сегодня
Создайте аккаунт, пополните баланс и получите API-ключ за 30 секунд.
Получить API-ключ