用Claude Code或者其他AI编码工具的人,大多碰过两个问题:要么半个月就用完月度额度,要么API账单超预期。很少有人意识到,你花的钱里80%都浪费在了冗余输出、重复读取全代码库、没用的命令日志和堆叠的对话历史上。
在此之前零散介绍过一些项目节约token:
用Claude Code啃大代码库太费token?这个开源工具砍了92%工具调用
tokens烧钱太快?试试这个四层模型组合
像原始人一样和AI对话,费用可直接砍掉40%
近期社区博主Charly一次性整理出10款专门解决这个问题的开源工具,适配几乎所有主流AI编码工具,最高能把大项目的Token消耗砍到原来的1/49。
一、输出压缩类:直接砍AI废话的Token
最容易见效的类别,不需要改工作流,装完直接生效。
Slogan是"why use many token when few do trick",核心是让AI砍掉所有冗余套话,只输出核心内容,实测平均减少65%输出Token,最高到87%,技术准确率100%,同时响应速度快3倍。
举个实际对比:
useMemo."实测基准:
任务 | 普通Claude Token | Caveman Token | 节省比例 |
|---|---|---|---|
解释React重渲染Bug | 1180 | 159 | 87% |
修复Auth中间件Token过期 | 704 | 121 | 83% |
Debug PostgreSQL竞态条件 | 1200 | 232 | 81% |
实现React错误边界 | 3454 | 456 | 87% |
额外功能:支持一键生成符合规范的短Commit信息、单行PR评论、压缩项目文档,还能统计累计节省的Token和对应美元金额。
支持30+AI工具:Claude Code、Cursor、Windsurf、Copilot、Gemini等,安装一行命令搞定:
# macOS/Linux/WSL
curl -fsSL https://raw.githubusercontent.com/JuliusBrussee/caveman/main/install.sh | bash仓库地址:http://github.com/juliusbrussee/caveman
AI编码工具执行命令时,会把所有输出全部塞进上下文,大部分是没用的进度条、重复日志、boilerplate,这部分占了日常Token消耗的大头。
Rust写的高性能CLI代理,无依赖,启动overhead不到10ms,自动过滤所有命令的冗余输出,实测30分钟的Claude Code会话,总Token从11.8万降到2.39万,省80%。
工作原理:
Without rtk: With rtk:
Claude --git status--> shell --> git Claude --git status--> RTK --> git
^ | ^ | |
| ~2,000 tokens (raw) | | ~200 tokens | filter |
+-----------------------------------+ +------- (filtered) ---+----------+30分钟会话实测Token节省:
操作 | 标准Token | RTK优化后Token | 节省比例 |
|---|---|---|---|
ls/tree | 2000 | 400 | 80% |
cat/read | 40000 | 12000 | 70% |
grep/rg | 16000 | 3200 | 80% |
git status | 3000 | 600 | 80% |
git diff | 10000 | 2500 | 75% |
cargo test/npm test | 25000 | 2500 | 90% |
合计 | ~118000 | ~23900 | 80% |
核心优化场景还包括构建/Lint输出、云服务/容器命令等,平均省80%。支持13款AI编码工具:Claude Code、Cursor、Copilot、Windsurf、Gemini CLI等,安装后自动挂钩,不需要手动改命令,一行安装:
brew install rtk
# 或Linux/macOS通用
curl -fsSL https://raw.githubusercontent.com/rtk-ai/rtk/refs/heads/master/install.sh | sh隐私方面:默认关闭遥测,不会收集任何代码、文件路径、命令参数。 仓库地址:http://github.com/rtk-ai/rtk
这是浪费最严重的场景:AI处理大项目时,每次任务都会重读整个代码库,99%的内容和当前任务完全无关。
核心是用Tree-sitter把整个代码库解析成结构图谱(节点是函数、类、导入,边是调用、继承、测试关联),每次任务只给AI传和当前需求相关的代码,不是全库读取,实测平均减少8.2倍Token,Next.js monorepo 27732个文件,只需要读15个,省49倍Token。

核心功能:

实测基准:
项目 | 平均全量读取Token | 平均图谱优化后Token | 节省比例 |
|---|---|---|---|
Gin | 21972 | 1153 | 16.4x |
Flask | 44751 | 4252 | 9.1x |
Next.js | 9882 | 1249 | 8.0x |
FastAPI | 4944 | 614 | 8.1x |
支持14款AI编码工具,自动检测配置:

一行安装自动配置所有支持的平台:
pip install code-review-graph
code-review-graph install
code-review-graph build仓库地址:http://github.com/tirth8205/code-review-graph
剩下的工具针对特定场景,按需选用:
把原始输出存在本地SQLite,不占用上下文,日志和GitHub相关内容的上下文消耗减少98%,适合经常处理大量日志、GitHub Issue/PR的场景。 仓库:http://github.com/mksglu/context-mode
优化项目级提示词模板,把项目文档从11k Token压缩到1.3k,省90%,适合固定项目长期使用。 仓库:http://github.com/nadimtuhin/claude-token-optimizer
扫描上下文里的隐形幽灵Token(比如看不见的格式字符、冗余标记),修复后能恢复10-30%的上下文空间,还能保护上下文质量。 仓库:http://github.com/alexgreensh/token-optimizer
给所有MCP工具加aggressive缓存和压缩,平均省95%以上的MCP相关Token,适合重度用MCP工具的用户。 仓库:http://github.com/ooples/token-optimizer-mcp
Zilliz推出的混合向量搜索MCP,把整个代码库变成可检索的上下文,成本比直接传全库低40%,适合中等规模项目。 仓库:http://github.com/zilliztech/claude-context
只需要往仓库根目录丢一个CLAUDE.md文件,就能强制AI输出严格简洁,零代码改动,适合不想装额外工具的用户。 仓库:http://github.com/drona23/claude-token-efficient
按代码符号(函数、类)导航,不是读取整个文件,代码导航相关的Token消耗减少97%,还有持久内存功能,不用重复传上下文。 仓库:http://github.com/mibayy/token-savior
不用全装,根据自己的核心痛点选2-3个就行:
除了工具,调整使用习惯就能省至少50%的Token,很多人每天都在犯这些错误:
这些工具全都是MIT协议开源,本地运行,没有云依赖,不会泄露代码,很多开发者用了之后直接从Claude Max套餐降到Pro,每月省几百刀。
社区里有用户反馈,坚持用这些工具和习惯,几乎再也碰不到额度上限,那么省下来的额度怎么办呢?
再介绍一个项目Local LLM Proxy,可以利用他们贡献出来,存下来下个月使用,我为人人,人人为我,都不再为token使用太多触发限额发愁,也不再为这几天没有使用token额度浪费而可惜。

跨时间,跨区域,跨模型复用,做到AI时代的新互助社区。对这个项目感兴趣的也可以进群讨论。

地址:https://github.com/wink-run/local-llm-proxy