Claude Sonnet 4 上下文窗口扩容至 1M Token

Anthropic 宣布，旗下主力模型 Claude Sonnet 4 上下文窗口扩容至 1M Token。这项「长上下文」功能目前正处于公测阶段，你可以通过 Anthropic API 和 Amazon Bedrock 进行调用，并将于近期登陆 Google 的 Vertex AI 平台。

Claude Sonnet 4 支持 1M Token

1M Token 大致相当于 75 万个英文单词。这意味着，模型可以直接对海量数据进行推理和分析，不用再依赖 RAG（检索增强生成）等相对复杂的技术方案。

回顾一下，Anthropic 在今年 5 月发布新一代模型时，Sonnet 4 和 Opus 4 的上下文窗口都是 200K Token。这个容量对大多数应用场景来说已经够用，但在「长上下文赛道」上，竞争早已白热化：

Anthropic 在公告中强调，长上下文将解锁不少强力场景，例如：

当然，功能更强，意味着成本也会推高：

不过你可以用「提示词缓存」来显著降低成本和延迟，再加上批处理模式的话，费用还能再省大约 50%。

业内一直在讨论，大语言模型在处理超大上下文时，效能到底如何。

所以，即便上下文窗口越来越大，「上下文工程」这门技能在短期内恐怕也还会是「刚需」。