DeepSeek V4 已上线 InstantClaw — 有什么变化以及为什么重要

DeepSeek V4 已上线 InstantClaw。若您在 API 上使用 deepseek-chat，您已在使用 DeepSeek-V4-Flash。无需操作。DeepSeek 已确认 deepseek-chat 与 deepseek-reasoner 会路由到 V4-Flash。这些旧名称的完全停用时间为 2026 年 7 月 24 日 15:59 UTC；在 InstantClaw 上的使用方式上，升级已经生效。

DeepSeek 让长上下文推理变得实用

DeepSeek 发布了两个版本的 V4。对于 InstantClaw 用户来说，最重要的是 V4-Flash：总共 284B 参数，每个 token 激活 13B 参数，基于混合专家（Mixture-of-Experts）架构构建。它不是大模型的精简版本——它是单独训练的，对于大多数日常任务，Flash 和完整 Pro 版本之间的差距出奇地小。

主要改进（完整表格以 DeepSeek 模型卡与技术报告为准）：

100 万 token 上下文，大约相当于 15–20 本小说；在环境允许时，可一次性放入完整代码库、长法律文件或多月聊天记录。
Think Max：对最强推理模式，DeepSeek 建议 至少 384K token 的上下文，以便承载很长的多步任务。这是针对上下文的建议，与官方文档中各模式对应，并非简单的「最大输出」单独规格。
非思考与两个思考档（快答与更深推理，另有 Think Max 用于最难任务）。
在 DeepSeek 的 instruct 表中，V4-Flash 的 Think Max 在 MMLU-Pro 为 86.2、在 LiveCodeBench 为 91.6；其他档位分数不同，需按模式理解。

长上下文过去会很快变贵。V4 针对百万级上下文把算力与内存曲线压到更现实；您仍为用量付费，只是大提示时的成本结构比以前合理得多。

预训练在超过 32T token 上完成；发布的权重在 Hugging Face 上为混合 FP4/FP8（见各模型说明）。开放权重以 MIT 许可证发布，与 V3 同属一个许可家族，商业用途请直接阅读各仓库中的 LICENSE。

真正重要的数字

DeepSeek 发布了与 Kimi K2.6、Claude Opus 4.6、GPT-5.4 和 Gemini 3.1 Pro 的完整基准测试对比。诚实的解读是：V4-Pro 有赢有输。

V4 获胜的领域：

Codeforces： 3206 分评分 — 击败 GPT-5.4（3168）并确立 V4 作为竞技编程最佳开源权重模型的地位
LiveCodeBench： 93.5 对比 K2.6 的 89.6 — 短格式代码生成是明显优势
Chinese-SimpleQA： 84.4 对比次佳的 76.8 — 对于中文产品，这是第一个与最佳闭源选项持平的开源权重模型

V4 落后的领域：

SWE-Pro： 55.4 对比 K2.6 的 58.6 — 实际的 GitHub 问题修复仍然略微偏爱 Kimi
MRCR 1M（长上下文检索）： 83.5 对比 Opus 4.6 的 92.9 — Claude 仍然在干草堆中找针方面保持冠军
使用工具的 HLE： 48.2 对比 K2.6 的 54.0

这对 InstantClaw 用户意味着什么

轻松版（$59.90/月，含 5 天试用；定价以 instantclaw.co 与 llms-full.txt 为准）在包含的 DeepSeek 通道上使用 V4-Flash，无额外费用；升级已在后台完成，通常无需改配置或轮换密钥。

专业版（$79.90/月）可自带 DeepSeek API 密钥使用 V4-Pro（1.6T 总参、49B 激活）。官方标价的 API 费用相对 Claude Opus 4.7 等前沿模型会便宜很多，若您跑高量请求会明显。V4-Pro 在部分榜单上的 Codeforces 等分数见上文对照表（以 DeepSeek 表为准）。

在 InstantClaw 上，deepseek-chat 名称停用主要是直接调用官方 API 的人需要留意；我们侧过渡已在进行，截止时间为上文 UTC。

可以怎么用

有了百万 token 上下文，您可以减少把长材料切成小块的操作。对真正难的题，用与任务匹配的思考档（并预期延迟和费用会不同）。若后果严重，请仍要自行核对，基准分再高也不等于在您这份文件上一定对。

简要结论

V4 在开放权重与长上下文效率上都是明显一代。轻松版已走包含的 V4-Flash 路径，专业版可自带密钥使用 V4-Pro 与 OpenClaw 支持的其它模型。在我们托管方式下，您不必为「换一代模型」自己做大迁移；若您在 InstantClaw 以外直接调用 DeepSeek 官方 API，才更需要盯旧模型名停用时间。

DeepSeek 原文链接

API 新闻（路由、模型 ID、UTC 停用时间）与 Hugging Face 上的技术报告 PDF。

API 发布公告技术报告（PDF）

想要更聪明的 AI 助手而无需维护？

在一分钟内部署。无需服务器。无需更新。无需模型迁移。

InstantClaw