QuickSilver Pro vs OpenAI
Для тех нагрузок, где open-source модель уже дает сопоставимое качество, QuickSilver Pro может быть до 30 раз дешевле OpenAI. DeepSeek V4 Flash заменяет GPT-4o-mini примерно на 73% дешевле; V3 заменяет GPT-4o с output cost ниже примерно в 16 раз; V4 Pro заменяет o3-mini с output cost ниже примерно в 6 раз; R1 заменяет o1 с output cost ниже примерно в 30 раз. Для vision, audio, image generation и Assistants API разумнее оставаться на OpenAI. Эта страница честно показывает, где премия OpenAI оправдана, а где нет.
Кратко
| Параметр | QuickSilver Pro | openai |
|---|---|---|
| Каталог | 9 open-source LLM (V4 Flash + Pro, V3, R1, Qwen 3.7 Max + 3.6 Plus + 3.6 + 3.5, Kimi K2.6) | GPT-4, o1/o3-mini, DALL-E, Whisper, TTS |
| Веса моделей | Открытые (MIT / Apache) | Закрытые |
| Цена дешевого чата (GPT-4o-mini / DeepSeek V4 Flash) | $0.08 / $0.16 | $0.15 / $0.60 |
| Цена обычного чата (GPT-4o / DeepSeek V3) | $0.16 / $0.616 | $2.50 / $10.00 |
| Цена premium reasoning (o3-mini / DeepSeek V4 Pro) | $0.348 / $0.696 | $1.10 / $4.40 |
| Цена топового reasoning (o1 / DeepSeek R1) | $0.56 / $2.00 | $15.00 / $60.00 |
| Vision (входные изображения) | Нет | Да (GPT-4o) |
| Audio (Whisper / TTS) | Нет | Да |
| Генерация изображений (DALL-E) | Нет | Да |
| Assistants API + встроенные инструменты | Нет | Да |
| OpenAI-compatible chat + tools + JSON | Да | Да (оригинал) |
| Минимальное пополнение | $5 | $5 |
Цены (за 1 млн токенов, USD)
Публичные прайс-листы на апрель 2026 года.
| Модель | QSP input | QSP output | openai input | openai output | Экономия |
|---|---|---|---|---|---|
| deepseek-v4-flash vs gpt-4o-mini | $0.08 | $0.16 | $0.15 | $0.60 | ~73% |
| deepseek-v3 vs gpt-4o | $0.16 | $0.616 | $2.50 | $10.00 | ~94% |
| deepseek-v4-pro vs o3-mini | $0.348 | $0.696 | $1.10 | $4.40 | ~84% |
| deepseek-r1 vs o1 | $0.56 | $2.00 | $15.00 | $60.00 | ~97% |
| qwen3.6-35b vs gpt-4o | $0.12 | $0.80 | $2.50 | $10.00 | ~92% |
| qwen3.5-35b vs gpt-4o | $0.111 | $0.80 | $2.50 | $10.00 | ~92% |
| kimi-k2.6 | $0.584 | $2.79 | — | — | specialist tier |
Миграция - две строки
from openai import OpenAI
client = OpenAI(
base_url="https://api.quicksilverpro.io/v1",
api_key=os.environ["QSP_KEY"],
)
r = client.chat.completions.create(
model="deepseek-v3",
messages=[{"role": "user", "content": "Hi"}],
)FAQ
DeepSeek V4 Flash против GPT-4o-mini: примерно на 47% дешевле по input и на 73% дешевле по output. DeepSeek V3 против GPT-4o: примерно в 16 раз дешевле по input и в 16 раз по output. DeepSeek V4 Pro против o3-mini: примерно в 3 раза дешевле по input и в 6 раз по output. DeepSeek R1 против o1: примерно в 27 раз дешевле по input и в 30 раз по output. На большинстве чисто текстовых задач качество сопоставимо.
Для премиальных reasoning-нагрузок с длинным контекстом DeepSeek V4 Pro довольно прямо сопоставляется с o3-mini: 1M контекста против 200K у o3-mini и цена $0.348/$0.696 против $1.10/$4.40 — примерно в 6 раз дешевле по output. Kimi K2.6 ближе к agentic / planning-нише уровня Claude Opus; у OpenAI здесь нет такого же чистого аналога.
Да. Меняются только base_url, api_key и model. Streaming, tool calling, strict json_schema и usage accounting поддерживаются. Модели новой волны V4 (V4 Flash, V4 Pro, Kimi K2.6) думают по умолчанию; для дешевого чата в стиле V3 передайте `reasoning: { enabled: false }`.
Когда нужны vision inputs, Whisper / TTS, DALL-E, Assistants API, embeddings или когда GPT-4 заметно выигрывает на ваших собственных evals. Для текстового чата, который проходит ваши evals, выгоднее QSP.
Попробуйте с удвоенным депозитом — до $50 бесплатно
Измените две строки и сразу экономьте 20%.
Получить API-ключ