InstantClaw

DeepSeek V4 已上线 InstantClaw — 有什么变化以及为什么重要

DeepSeek V4 已经上线 InstantClaw。如果您一直在 API 上使用 DeepSeek-chat,您已经悄悄升级到 DeepSeek-V4-Flash。无需任何操作。以下是 V4 带来的改进以及它为何对您的助手很重要。

Published 2026-04-24 · By InstantClaw Team

DeepSeek V4 是目前最强大的开源权重模型,它已经运行在 InstantClaw 上。Easy 层用户自动获得 V4-Flash。Premium 层用户可以使用自己的密钥访问 V4-Pro。最好的模型变得更好了。而您无需做任何事。

DeepSeek V4 现已上线 InstantClaw。如果您一直在 API 上使用 DeepSeek-chat,您已经悄然升级到 DeepSeek-V4-Flash。无需任何操作。DeepSeek 已确认旧的模型 ID(deepseek-chat 和 deepseek-reasoner)现在路由到 V4-Flash。正式停用日期是 2026 年 7 月 24 日,但从实际应用角度来看,您今天就已经在使用 V4 了。

01

DeepSeek 让长上下文推理变得实用

DeepSeek 发布了两个版本的 V4。对于 InstantClaw 用户来说,最重要的是 V4-Flash:总共 284B 参数,每个 token 激活 13B 参数,基于混合专家(Mixture-of-Experts)架构构建。它不是大模型的精简版本——它是单独训练的,对于大多数日常任务,Flash 和完整 Pro 版本之间的差距出奇地小。

主要改进:

  • 1M token 上下文窗口 — 大约相当于 15-20 本小说的文本量。可以在单个会话中上传整个代码库、一年的法律文件或数月的聊天记录。
  • 384K 最大输出 — 用于生成长篇内容、分析或代码重构。
  • 具有三个努力级别的思考模式 — 根据任务选择快速响应或深度推理。
  • 能力的实质性提升 — V4-Flash 在 MMLU-Pro 上达到 86.2 分,在 LiveCodeBench 上达到 91.6 分。对于大多数任务,它的表现可与成本高 50 倍的模型竞争。

简单来说: 以前每次您向提示中添加更多上下文时,计算成本都会快速攀升。V4 拉平了这条曲线。您可以在不使助手运行变慢或耗尽预算的情况下,向助手提供整个代码库。

该模型使用混合 FP4 和 FP8 精度在 32 万亿个 token 上进行了预训练。权重在 Hugging Face 上以 Apache 2.0 许可证发布 — 比 V3 的 MIT 许可证提供更强的专利保护,这对商业部署很重要。

02

真正重要的数字

DeepSeek 发布了与 Kimi K2.6、Claude Opus 4.6、GPT-5.4 和 Gemini 3.1 Pro 的完整基准测试对比。诚实的解读是:V4-Pro 有赢有输。

V4 获胜的领域:

  • Codeforces: 3206 分评分 — 击败 GPT-5.4(3168)并确立 V4 作为竞技编程最佳开源权重模型的地位
  • LiveCodeBench: 93.5 对比 K2.6 的 89.6 — 短格式代码生成是明显优势
  • Chinese-SimpleQA: 84.4 对比次佳的 76.8 — 对于中文产品,这是第一个与最佳闭源选项持平的开源权重模型

V4 落后的领域:

  • SWE-Pro: 55.4 对比 K2.6 的 58.6 — 实际的 GitHub 问题修复仍然略微偏爱 Kimi
  • MRCR 1M(长上下文检索): 83.5 对比 Opus 4.6 的 92.9 — Claude 仍然在干草堆中找针方面保持冠军
  • 使用工具的 HLE: 48.2 对比 K2.6 的 54.0

V3.2 到 V4-Pro 的 Arena Code Elo 提升了 88 分 — 大约相当于当前排行榜上第 3 名和第 13 名之间的差距。这是真正的代际跨越,不是简单刷新。

03

这对 InstantClaw 用户意味着什么

对于 Easy 层订阅用户($59.90/月),V4-Flash 无需额外费用。模型升级已自动完成 — 您的助手在使用时变得更聪明了。无需配置更改,无需 API 密钥轮换,无需任何批准。

对于 Premium 层用户($79.90/月),V4-Pro(总共 1.6T,激活 49B)可通过使用您自己的 DeepSeek API 密钥获得。API 定价($1.74/M 输入,$3.48/M 输出)比 Claude Opus 4.7 便宜约 21 倍,如果您运行高容量工作负载,这很重要。V4-Pro 更进一步,Codeforces 评分为 3206 — 在竞技编程基准测试中击败了 GPT-5.4。

对于 InstantClaw 用户来说,7 月 24 日的 deepseek-chat 弃用是一个无关紧要的事件。过渡已经在透明地进行。当 DeepSeek 正式停用旧模型 ID 时,您的助手甚至不会注意到。

04

为什么了解这一点很重要

知道您的助手运行着更好的模型可以帮助您以不同的方式使用它。那个 1M token 的上下文窗口意味着您可以停止分割文档。改进的推理能力意味着您可以信任它在复杂任务上的分析。当您了解升级后,您自然会从中获得更多价值。

总结

DeepSeek V4 是目前最强大的开源权重模型,它已经运行在 InstantClaw 上。Easy 层用户自动获得 V4-Flash。Premium 层用户可以使用自己的密钥访问 V4-Pro。最好的模型变得更好了。而您无需做任何事。

想要技术细节?

在 DeepSeek 官方博客上阅读完整的 DeepSeek V4 公告和基准测试结果。

查看 DeepSeek

想要更聪明的 AI 助手而无需维护?

在一分钟内部署。无需服务器。无需更新。无需模型迁移。

InstantClaw