DeepSeek V3 用于编程
DeepSeek V3 是一个开源的 671B MoE 模型(37B 激活参数),代码生成基准很强,并完整支持 OpenAI 工具调用。在 QuickSilver Pro 上,它的价格是每 100 万 tokens 输入 $0.16、输出 $0.616;对于需要 GPT-4 级质量、但希望成本低 5-10 倍的编程代理和 PR 机器人,它是最实用的默认选择。
V3 在编程上的强项
代码生成:在 HumanEval、MBPP 和 LiveCodeBench 上表现很强。能生成地道的 Python、JavaScript、Go、Rust、TypeScript,并且在 128K 上下文内处理多文件重构也很稳。
工具调用:实现了 OpenAI tools / function calling。可直接替换 LangChain agent、LlamaIndex ReAct loop、Aider、Cline、Cursor 中的 GPT-4,凡是依赖 tool_calls 的框架基本都能接。
结构化输出:支持 response_format: json_schema 严格模式。适合返回类型化 diff 的代码评审机器人、输出 JSON patch 的修复器,或自动生成 API 文档的流程。
编程场景下什么时候用 V3,什么时候用 R1
常规代码生成、重构、PR review、文档撰写,默认优先用 V3。它更便宜、更快,输出也更短更直接,不会先吐一大段思维链。
当任务需要一步步推导时,再升级到 R1:比如竞赛算法、棘手并发 bug、把数学规格翻译成代码,或排查间歇性故障时,推理过程比最终代码本身更重要。
具体来说,R1 的输出价格是每 100 万 tokens $2.00,而且会多生成 3-5 倍 token(它的 thinking trace 也是输出的一部分)。对日常编程来说,用 R1 往往贵 10-15 倍,却没有明显质量收益。
快速上手代码
from openai import OpenAI
client = OpenAI(
base_url="https://api.quicksilverpro.io/v1",
api_key="sk-qsp-...",
)
resp = client.chat.completions.create(
model="deepseek-v3",
messages=[
{"role": "system", "content": "You are a senior Python engineer. Write clean, idiomatic code."},
{"role": "user", "content": "Implement an LRU cache in Python without using functools.lru_cache."},
],
temperature=0.2,
)
print(resp.choices[0].message.content)
print(f"Cost: ${resp.usage.cost:.6f}")tools = [
{
"type": "function",
"function": {
"name": "read_file",
"description": "Read a file from disk",
"parameters": {
"type": "object",
"properties": {"path": {"type": "string"}},
"required": ["path"],
},
},
},
{
"type": "function",
"function": {
"name": "write_file",
"description": "Write content to a file",
"parameters": {
"type": "object",
"properties": {
"path": {"type": "string"},
"content": {"type": "string"},
},
"required": ["path", "content"],
},
},
},
]
resp = client.chat.completions.create(
model="deepseek-v3",
messages=[{"role": "user", "content": "Refactor app.py to extract the auth helpers."}],
tools=tools,
tool_choice="auto",
)
for call in resp.choices[0].message.tool_calls or []:
print(call.function.name, call.function.arguments)常见问题
在公开基准(HumanEval、MBPP、LiveCodeBench)上,DeepSeek V3 与 GPT-4o 的成绩是有竞争力的。真实世界中的开发者主观感受会随任务变化;在主流语言里,V3 往往能给出更干净、更符合习惯的代码。对于边缘语言或强领域代码(例如 Verilog、COBOL),GPT-4 依然更强。
可以。三者都支持自定义 OpenAI base URL。Aider 可用:aider --openai-api-base https://api.quicksilverpro.io/v1 --openai-api-key $QSP_KEY --model deepseek-v3。Cline 和 Cursor 里也都有“自定义 OpenAI-compatible provider”设置,填相同参数即可。
支持。传 response_format: {type: "json_schema", json_schema: {...}} 即可。模型会输出符合 schema 的合法 JSON;严格模式会把解码过程约束在语法范围内。
在 QuickSilver Pro 上是 131,072 tokens。对于大多数仓库,这已经足够完成多文件重构。更大的代码库建议结合检索,只送入相关文件;或者改用 262K 上下文的 Qwen3.5-35B-A3B。