上下文窗口预算规划器

1 · 预算与任务

模型上下文窗口任务阶段 影响分配偏好

留给模型输出 回复 / 代码 / 思考 安全余量 防止顶满窗口

2 · 你的资料清单

按你手上真实的资料填。大小可以填 token，也可以填中文字数 / 英文词数 / 代码行数，自动折算。

纯前端计算，不联网、不上传、不调用任何模型。token 数为工程估算，用于规划而非精确计费。

🧭

左边填任务和资料，右边就是一份能照着做的上下文装载计划

你会拿到：token 预算拆解（窗口 − 输出预留 − 安全余量 = 可用输入）、每份资料的放置策略（进 prompt / 附件按需读 / 压缩摘要 / 外部检索 / 丢弃）、需要压缩的目标压缩比、放不下时的分段执行计划，以及 prompt 缓存与滚动摘要建议。可一键复制 / 下载 Markdown 与 JSON。

不再靠感觉往 prompt 里塞资料，塞到爆窗口或稀释重点
给 Claude Code / Agent 长任务前，先想清楚每份资料放哪
把"该带什么上下文"沉淀成可复用、可交付给客户的清单

方法论 · 上下文预算是怎么算的

① 先算可用输入预算

可用输入 = 上下文窗口 − 留给模型输出的 token − 安全余量。顶满窗口会截断、变慢、还容易"忘掉"开头，所以真正能装资料的空间远小于窗口标称值。

② 每份资料按三维定位

用大小、必要性（必需 / 相关 / 可选）和变动频率（静态 / 偶尔 / 高频）决定它进 prompt、进附件按需读、先压缩、走检索，还是这次先丢掉。

③ 大而必需的先压缩

必需但太大的资料（长文档、整个代码库）不逐字进 prompt，而是给出目标压缩比和方法：抽结构 / 代码骨架 / 结构化摘要，把体积降到预算内。

④ 放不下就分段执行

当必需资料仍超预算，工具给出分段计划：每段只装当前需要的资料，段间用摘要接力。再叠加 prompt 缓存（静态内容前置）和对话历史滚动摘要建议。

本工具产出的是上下文装载计划，不读取你的文件、不调用模型、不做真实压缩。适合在开跑一个长 Agent / 编码 / 研究任务前做 2 分钟规划，或作为给客户讲"上下文工程"时的可交付初稿。token 折算为经验估算（中文≈1.6 token/字，英文≈1.33 token/词，代码≈12 token/行），用于预算规划而非精确计费。