DeepSeek V4 已上线 InstantClaw。若您在 API 上使用 deepseek-chat,您已在使用 DeepSeek-V4-Flash。无需操作。DeepSeek 已确认 deepseek-chat 与 deepseek-reasoner 会路由到 V4-Flash。这些旧名称的完全停用时间为 2026 年 7 月 24 日 15:59 UTC;在 InstantClaw 上的使用方式上,升级已经生效。
DeepSeek 让长上下文推理变得实用
DeepSeek 发布了两个版本的 V4。对于 InstantClaw 用户来说,最重要的是 V4-Flash:总共 284B 参数,每个 token 激活 13B 参数,基于混合专家(Mixture-of-Experts)架构构建。它不是大模型的精简版本——它是单独训练的,对于大多数日常任务,Flash 和完整 Pro 版本之间的差距出奇地小。
主要改进(完整表格以 DeepSeek 模型卡与技术报告为准):
- 100 万 token 上下文,大约相当于 15–20 本小说;在环境允许时,可一次性放入完整代码库、长法律文件或多月聊天记录。
- Think Max:对最强推理模式,DeepSeek 建议 至少 384K token 的上下文,以便承载很长的多步任务。这是针对上下文的建议,与官方文档中各模式对应,并非简单的「最大输出」单独规格。
- 非思考与两个思考档(快答与更深推理,另有 Think Max 用于最难任务)。
- 在 DeepSeek 的 instruct 表中,V4-Flash 的 Think Max 在 MMLU-Pro 为 86.2、在 LiveCodeBench 为 91.6;其他档位分数不同,需按模式理解。
长上下文过去会很快变贵。V4 针对百万级上下文把算力与内存曲线压到更现实;您仍为用量付费,只是大提示时的成本结构比以前合理得多。
预训练在超过 32T token 上完成;发布的权重在 Hugging Face 上为混合 FP4/FP8(见各模型说明)。开放权重以 MIT 许可证发布,与 V3 同属一个许可家族,商业用途请直接阅读各仓库中的 LICENSE。
真正重要的数字
DeepSeek 发布了与 Kimi K2.6、Claude Opus 4.6、GPT-5.4 和 Gemini 3.1 Pro 的完整基准测试对比。诚实的解读是:V4-Pro 有赢有输。
V4 获胜的领域:
- Codeforces: 3206 分评分 — 击败 GPT-5.4(3168)并确立 V4 作为竞技编程最佳开源权重模型的地位
- LiveCodeBench: 93.5 对比 K2.6 的 89.6 — 短格式代码生成是明显优势
- Chinese-SimpleQA: 84.4 对比次佳的 76.8 — 对于中文产品,这是第一个与最佳闭源选项持平的开源权重模型
V4 落后的领域:
- SWE-Pro: 55.4 对比 K2.6 的 58.6 — 实际的 GitHub 问题修复仍然略微偏爱 Kimi
- MRCR 1M(长上下文检索): 83.5 对比 Opus 4.6 的 92.9 — Claude 仍然在干草堆中找针方面保持冠军
- 使用工具的 HLE: 48.2 对比 K2.6 的 54.0
这对 InstantClaw 用户意味着什么
轻松版($59.90/月,含 5 天试用;定价以 instantclaw.co 与 llms-full.txt 为准)在包含的 DeepSeek 通道上使用 V4-Flash,无额外费用;升级已在后台完成,通常无需改配置或轮换密钥。
专业版($79.90/月)可自带 DeepSeek API 密钥使用 V4-Pro(1.6T 总参、49B 激活)。官方标价的 API 费用相对 Claude Opus 4.7 等前沿模型会便宜很多,若您跑高量请求会明显。V4-Pro 在部分榜单上的 Codeforces 等分数见上文对照表(以 DeepSeek 表为准)。
在 InstantClaw 上,deepseek-chat 名称停用主要是直接调用官方 API 的人需要留意;我们侧过渡已在进行,截止时间为上文 UTC。
可以怎么用
有了百万 token 上下文,您可以减少把长材料切成小块的操作。对真正难的题,用与任务匹配的思考档(并预期延迟和费用会不同)。若后果严重,请仍要自行核对,基准分再高也不等于在您这份文件上一定对。
简要结论
V4 在开放权重与长上下文效率上都是明显一代。轻松版已走包含的 V4-Flash 路径,专业版可自带密钥使用 V4-Pro 与 OpenClaw 支持的其它模型。在我们托管方式下,您不必为「换一代模型」自己做大迁移;若您在 InstantClaw 以外直接调用 DeepSeek 官方 API,才更需要盯旧模型名停用时间。
想要更聪明的 AI 助手而无需维护?
在一分钟内部署。无需服务器。无需更新。无需模型迁移。
InstantClaw