上下文窗口预算规划器

长任务里哪些信息进 prompt · 哪些进文件 · 哪些先压缩 · 哪些走检索

方法论 & 怎么算的

1 · 预算与任务

2 · 你的资料清单

按你手上真实的资料填。大小可以填 token,也可以填中文字数 / 英文词数 / 代码行数,自动折算。

纯前端计算,不联网、不上传、不调用任何模型。token 数为工程估算,用于规划而非精确计费。

🧭

左边填任务和资料,右边就是一份能照着做的上下文装载计划

你会拿到:token 预算拆解(窗口 − 输出预留 − 安全余量 = 可用输入)、每份资料的放置策略(进 prompt / 附件按需读 / 压缩摘要 / 外部检索 / 丢弃)、需要压缩的目标压缩比、放不下时的分段执行计划,以及 prompt 缓存与滚动摘要建议。可一键复制 / 下载 Markdown 与 JSON。

  • 不再靠感觉往 prompt 里塞资料,塞到爆窗口或稀释重点
  • 给 Claude Code / Agent 长任务前,先想清楚每份资料放哪
  • 把"该带什么上下文"沉淀成可复用、可交付给客户的清单

方法论 · 上下文预算是怎么算的

① 先算可用输入预算

可用输入 = 上下文窗口 − 留给模型输出的 token − 安全余量。顶满窗口会截断、变慢、还容易"忘掉"开头,所以真正能装资料的空间远小于窗口标称值。

② 每份资料按三维定位

大小必要性(必需 / 相关 / 可选)和变动频率(静态 / 偶尔 / 高频)决定它进 prompt、进附件按需读、先压缩、走检索,还是这次先丢掉。

③ 大而必需的先压缩

必需但太大的资料(长文档、整个代码库)不逐字进 prompt,而是给出目标压缩比和方法:抽结构 / 代码骨架 / 结构化摘要,把体积降到预算内。

④ 放不下就分段执行

当必需资料仍超预算,工具给出分段计划:每段只装当前需要的资料,段间用摘要接力。再叠加 prompt 缓存(静态内容前置)和对话历史滚动摘要建议。

本工具产出的是上下文装载计划,不读取你的文件、不调用模型、不做真实压缩。适合在开跑一个长 Agent / 编码 / 研究任务前做 2 分钟规划,或作为给客户讲"上下文工程"时的可交付初稿。token 折算为经验估算(中文≈1.6 token/字,英文≈1.33 token/词,代码≈12 token/行),用于预算规划而非精确计费。