Сравнение

QuickSilver Pro vs OpenAI

Для тех нагрузок, где open-source модель уже дает сопоставимое качество, QuickSilver Pro может быть до 30 раз дешевле OpenAI. DeepSeek V4 Flash заменяет GPT-4o-mini примерно на 73% дешевле; V3 заменяет GPT-4o с output cost ниже примерно в 16 раз; V4 Pro заменяет o3-mini с output cost ниже примерно в 6 раз; R1 заменяет o1 с output cost ниже примерно в 30 раз. Для vision, audio, image generation и Assistants API разумнее оставаться на OpenAI. Эта страница честно показывает, где премия OpenAI оправдана, а где нет.

Кратко

ПараметрQuickSilver Proopenai
Каталог9 open-source LLM (V4 Flash + Pro, V3, R1, Qwen 3.7 Max + 3.6 Plus + 3.6 + 3.5, Kimi K2.6)GPT-4, o1/o3-mini, DALL-E, Whisper, TTS
Веса моделейОткрытые (MIT / Apache)Закрытые
Цена дешевого чата (GPT-4o-mini / DeepSeek V4 Flash)$0.08 / $0.16$0.15 / $0.60
Цена обычного чата (GPT-4o / DeepSeek V3)$0.16 / $0.616$2.50 / $10.00
Цена premium reasoning (o3-mini / DeepSeek V4 Pro)$0.348 / $0.696$1.10 / $4.40
Цена топового reasoning (o1 / DeepSeek R1)$0.56 / $2.00$15.00 / $60.00
Vision (входные изображения)НетДа (GPT-4o)
Audio (Whisper / TTS)НетДа
Генерация изображений (DALL-E)НетДа
Assistants API + встроенные инструментыНетДа
OpenAI-compatible chat + tools + JSONДаДа (оригинал)
Минимальное пополнение$5$5

Цены (за 1 млн токенов, USD)

Публичные прайс-листы на апрель 2026 года.

МодельQSP inputQSP outputopenai inputopenai outputЭкономия
deepseek-v4-flash vs gpt-4o-mini$0.08$0.16$0.15$0.60~73%
deepseek-v3 vs gpt-4o$0.16$0.616$2.50$10.00~94%
deepseek-v4-pro vs o3-mini$0.348$0.696$1.10$4.40~84%
deepseek-r1 vs o1$0.56$2.00$15.00$60.00~97%
qwen3.6-35b vs gpt-4o$0.12$0.80$2.50$10.00~92%
qwen3.5-35b vs gpt-4o$0.111$0.80$2.50$10.00~92%
kimi-k2.6$0.584$2.79specialist tier

Миграция - две строки

После - QuickSilver Pro
from openai import OpenAI

client = OpenAI(
    base_url="https://api.quicksilverpro.io/v1",
    api_key=os.environ["QSP_KEY"],
)

r = client.chat.completions.create(
    model="deepseek-v3",
    messages=[{"role": "user", "content": "Hi"}],
)

FAQ

DeepSeek V4 Flash против GPT-4o-mini: примерно на 47% дешевле по input и на 73% дешевле по output. DeepSeek V3 против GPT-4o: примерно в 16 раз дешевле по input и в 16 раз по output. DeepSeek V4 Pro против o3-mini: примерно в 3 раза дешевле по input и в 6 раз по output. DeepSeek R1 против o1: примерно в 27 раз дешевле по input и в 30 раз по output. На большинстве чисто текстовых задач качество сопоставимо.

Для премиальных reasoning-нагрузок с длинным контекстом DeepSeek V4 Pro довольно прямо сопоставляется с o3-mini: 1M контекста против 200K у o3-mini и цена $0.348/$0.696 против $1.10/$4.40 — примерно в 6 раз дешевле по output. Kimi K2.6 ближе к agentic / planning-нише уровня Claude Opus; у OpenAI здесь нет такого же чистого аналога.

Да. Меняются только base_url, api_key и model. Streaming, tool calling, strict json_schema и usage accounting поддерживаются. Модели новой волны V4 (V4 Flash, V4 Pro, Kimi K2.6) думают по умолчанию; для дешевого чата в стиле V3 передайте `reasoning: { enabled: false }`.

Когда нужны vision inputs, Whisper / TTS, DALL-E, Assistants API, embeddings или когда GPT-4 заметно выигрывает на ваших собственных evals. Для текстового чата, который проходит ваши evals, выгоднее QSP.

Попробуйте с удвоенным депозитом — до $50 бесплатно

Измените две строки и сразу экономьте 20%.

Получить API-ключ