InstantClaw

DeepSeek V4 已上线 InstantClaw — 有什么变化以及为什么重要

DeepSeek V4 已经上线 InstantClaw。如果您一直在 API 上使用 DeepSeek-chat,您已经悄悄升级到 DeepSeek-V4-Flash。无需任何操作。以下是 V4 带来的改进以及它为何对您的助手很重要。

Published 2026-04-24 · By InstantClaw Team

在 InstantClaw 上,包含的 DeepSeek 通道已切到 V4-Flash。专业版可用您自己的 DeepSeek 密钥使用 V4-Pro。我们在服务侧已切换;您已部署的助手无需重新接入。

DeepSeek V4 已上线 InstantClaw。若您在 API 上使用 deepseek-chat,您已在使用 DeepSeek-V4-Flash。无需操作。DeepSeek 已确认 deepseek-chatdeepseek-reasoner 会路由到 V4-Flash。这些旧名称的完全停用时间为 2026 年 7 月 24 日 15:59 UTC;在 InstantClaw 上的使用方式上,升级已经生效。

01

DeepSeek 让长上下文推理变得实用

DeepSeek 发布了两个版本的 V4。对于 InstantClaw 用户来说,最重要的是 V4-Flash:总共 284B 参数,每个 token 激活 13B 参数,基于混合专家(Mixture-of-Experts)架构构建。它不是大模型的精简版本——它是单独训练的,对于大多数日常任务,Flash 和完整 Pro 版本之间的差距出奇地小。

主要改进(完整表格以 DeepSeek 模型卡与技术报告为准):

  • 100 万 token 上下文,大约相当于 15–20 本小说;在环境允许时,可一次性放入完整代码库、长法律文件或多月聊天记录。
  • Think Max:对最强推理模式,DeepSeek 建议 至少 384K token 的上下文,以便承载很长的多步任务。这是针对上下文的建议,与官方文档中各模式对应,并非简单的「最大输出」单独规格。
  • 非思考与两个思考档(快答与更深推理,另有 Think Max 用于最难任务)。
  • 在 DeepSeek 的 instruct 表中,V4-Flash 的 Think Max 在 MMLU-Pro 为 86.2、在 LiveCodeBench 为 91.6;其他档位分数不同,需按模式理解。

长上下文过去会很快变贵。V4 针对百万级上下文把算力与内存曲线压到更现实;您仍为用量付费,只是大提示时的成本结构比以前合理得多。

预训练在超过 32T token 上完成;发布的权重在 Hugging Face 上为混合 FP4/FP8(见各模型说明)。开放权重以 MIT 许可证发布,与 V3 同属一个许可家族,商业用途请直接阅读各仓库中的 LICENSE

02

真正重要的数字

DeepSeek 发布了与 Kimi K2.6、Claude Opus 4.6、GPT-5.4 和 Gemini 3.1 Pro 的完整基准测试对比。诚实的解读是:V4-Pro 有赢有输。

V4 获胜的领域:

  • Codeforces: 3206 分评分 — 击败 GPT-5.4(3168)并确立 V4 作为竞技编程最佳开源权重模型的地位
  • LiveCodeBench: 93.5 对比 K2.6 的 89.6 — 短格式代码生成是明显优势
  • Chinese-SimpleQA: 84.4 对比次佳的 76.8 — 对于中文产品,这是第一个与最佳闭源选项持平的开源权重模型

V4 落后的领域:

  • SWE-Pro: 55.4 对比 K2.6 的 58.6 — 实际的 GitHub 问题修复仍然略微偏爱 Kimi
  • MRCR 1M(长上下文检索): 83.5 对比 Opus 4.6 的 92.9 — Claude 仍然在干草堆中找针方面保持冠军
  • 使用工具的 HLE: 48.2 对比 K2.6 的 54.0
03

这对 InstantClaw 用户意味着什么

轻松版($59.90/月,含 5 天试用;定价以 instantclaw.collms-full.txt 为准)在包含的 DeepSeek 通道上使用 V4-Flash,无额外费用;升级已在后台完成,通常无需改配置或轮换密钥。

专业版($79.90/月)可自带 DeepSeek API 密钥使用 V4-Pro(1.6T 总参、49B 激活)。官方标价的 API 费用相对 Claude Opus 4.7 等前沿模型会便宜很多,若您跑高量请求会明显。V4-Pro 在部分榜单上的 Codeforces 等分数见上文对照表(以 DeepSeek 表为准)。

在 InstantClaw 上,deepseek-chat 名称停用主要是直接调用官方 API 的人需要留意;我们侧过渡已在进行,截止时间为上文 UTC。

04

可以怎么用

有了百万 token 上下文,您可以减少把长材料切成小块的操作。对真正难的题,用与任务匹配的思考档(并预期延迟和费用会不同)。若后果严重,请仍要自行核对,基准分再高也不等于在您这份文件上一定对。

简要结论

V4 在开放权重与长上下文效率上都是明显一代。轻松版已走包含的 V4-Flash 路径,专业版可自带密钥使用 V4-Pro 与 OpenClaw 支持的其它模型。在我们托管方式下,您不必为「换一代模型」自己做大迁移;若您在 InstantClaw 以外直接调用 DeepSeek 官方 API,才更需要盯旧模型名停用时间。

DeepSeek 原文链接

API 新闻(路由、模型 ID、UTC 停用时间)与 Hugging Face 上的技术报告 PDF。

想要更聪明的 AI 助手而无需维护?

在一分钟内部署。无需服务器。无需更新。无需模型迁移。

InstantClaw