Claude Code /cost 详解:你的 AI 编程到底花了多少钱
目录
为什么需要 /cost
用 Claude Code 开发,你最关心什么?
除了代码质量和效率,恐怕就是钱了。
如果你是 API Key 用户,每次对话都在产生费用。一个复杂的 debug 会话、一次大规模重构,到底花了多少钱?不看不知道,看了可能吓一跳。
如果你是 Max/Pro 订阅用户,虽然不按次收费,但你肯定想知道自己的额度用了多少,是不是快超了。
/cost 就是让你随时掌握花费的命令。
/cost 是什么
/cost 是 Claude Code 的会话成本查看命令。它显示当前会话中累计的 API 调用费用、时间消耗和代码变更统计。
在交互模式下输入:
/cost
你会看到类似这样的输出:
Total cost: $0.4832
Total duration (API): 3 mins 12 secs
Total duration (wall): 8 mins 45 secs
Total code changes: 156 lines added, 43 lines removed
Usage by model:
claude-opus-4-6: 12,450 input, 3,280 output, 45,600 cache read, 8,200 cache write ($0.42)
claude-sonnet-4-6: 2,100 input, 890 output ($0.02)
一目了然。
谁能看到 /cost
这里有个重要的区分:
API Key 用户
如果你使用 API Key 访问 Claude Code,/cost 会显示完整的费用明细。每一笔调用都在计费,你需要知道花了多少。
Max/Pro 订阅用户
如果你是 Claude.ai 的订阅用户,/cost 命令默认是隐藏的。因为你用的是订阅制,不按调用收费。
输入 /cost 后,你会看到:
You are currently using your subscription to power your Claude Code usage
或者如果你的订阅额度用完了,正在使用超额部分:
You are currently using your overages to power your Claude Code usage.
We will automatically switch you back to your subscription rate limits when they reset
想看详细费用? 可以通过环境变量强制显示:设置 DISABLE_COST_WARNINGS=false 不会改变这个行为,因为订阅用户的成本显示逻辑是独立的。这个功能主要面向 API Key 用户。
费用怎么算的
这部分是硬核干货。Claude Code 内置了完整的模型定价表,基于 API 官方价格实时计算费用。
模型定价(每百万 Token)
| 模型 | 输入 | 输出 | 缓存读取 | 缓存写入 |
|---|---|---|---|---|
| Haiku 3.5 | $0.80 | $4 | $0.08 | $1.00 |
| Haiku 4.5 | $1 | $5 | $0.10 | $1.25 |
| Sonnet 4.x | $3 | $15 | $0.30 | $3.75 |
| Opus 4 / 4.1 | $15 | $75 | $1.50 | $18.75 |
| Opus 4.5 | $5 | $25 | $0.50 | $6.25 |
| Opus 4.6 | $5 | $25 | $0.50 | $6.25 |
| Opus 4.6 (fast) | $30 | $150 | $3.00 | $37.50 |
注意两个关键点:
-
Opus 4.6 的 fast 模式贵 6 倍。这就是
/fast的代价——同样的模型,更快的输出,但每个 Token 的价格翻了 6 倍。所以/fast适合短任务,不适合长篇大论。 -
缓存读取只有输入价格的 10%。Claude Code 大量使用 Prompt Cache(系统提示、CLAUDE.md 等),这意味着重复上下文的成本非常低。
计算公式
费用 = 输入 Token × 输入单价
+ 输出 Token × 输出单价
+ 缓存读取 Token × 缓存读取单价
+ 缓存写入 Token × 缓存写入单价
+ 网络搜索次数 × $0.01
每次 API 调用完成后,Claude Code 从响应头中提取实际 Token 用量,乘以对应模型的单价,累加到会话总费用中。
/cost 显示哪些信息
/cost 的输出包含五个维度:
1. 总费用(Total cost)
当前会话累计的 API 调用费用,单位美元,精确到小数点后四位。
如果会话中使用了不在定价表中的模型(比如某个内测模型),会显示警告:费用可能不准确。
2. API 时间(Total duration - API)
所有 API 调用的纯耗时之和。不包括你思考的时间、工具执行的时间,只算 Claude 在”想”的时间。
3. 总时间(Total duration - wall)
从会话开始到现在的实际挂钟时间。API 时间 vs 总时间的差距,就是你”等待之外”的时间。
4. 代码变更(Total code changes)
当前会话中新增和删除的代码行数。让你直观地感受到”这次对话的产出”。
5. 模型明细(Usage by model)
按模型分别列出 Token 用量:输入、输出、缓存读取、缓存写入,以及每个模型的费用小计。
如果你在会话中切换了模型(比如先用 Opus 做分析,再切 Sonnet 做简单修改),这里会分别列出。
费用持久化
Claude Code 会把费用数据保存到项目配置中,包括:
- 总费用金额
- API 调用总时长
- 各模型 Token 用量明细
- 会话 ID(用于判断是否是同一个会话)
这意味着如果你用 /resume 恢复了之前的会话,费用数据也会一起恢复,保持连续性。
但要注意:这个持久化是按会话的。新会话的费用从零开始。
实际使用建议
定期检查
养成习惯,在长会话中定期输入 /cost 看看花了多少。特别是在做以下事情时:
- 大规模重构(大量代码上下文 = 大量 Token)
- 反复调试(多轮对话 = 累积费用)
- 使用 max effort(更长的思考链 = 更多输出 Token)
关注缓存比例
如果你发现缓存读取 Token 远大于输入 Token,说明 Prompt Cache 在发挥作用,你的成本得到了优化。
反之,如果缓存读取很少,可能是你的 CLAUDE.md 或系统提示太短,没有充分利用缓存。
fast 模式的费用感知
/fast 模式下 Opus 4.6 的价格是普通模式的 6 倍。如果你只是做个简单修改就开了 fast,可能得不偿失。建议:
- 短任务 + fast:快速完成,总费用可控
- 长任务 + 普通模式:慢一点,但省得多
/cost vs /usage vs /stats
这三个命令容易混淆,区别是:
| 命令 | 面向用户 | 显示内容 |
|---|---|---|
/cost | API Key 用户 | 实际美元花费 |
/usage | 订阅用户 | 订阅额度和速率限制 |
/stats | 所有用户 | 会话统计和活动指标 |
简单记:花钱看 /cost,额度看 /usage,数据看 /stats。
省钱技巧
既然知道了费用怎么算,分享几个省钱的实用技巧:
- 善用
/compact:上下文太长时压缩一下,减少后续每次调用的输入 Token - 善用
/effort:简单任务用 low 或 medium,别让 Claude 过度思考 - 善用缓存:写好 CLAUDE.md,让常用上下文走缓存读取(只要输入价的 10%)
- 慎用
/fast:除非时间真的很紧,否则普通模式性价比更高 !前缀:对不需要 AI 介入的命令用感叹号前缀,完全不产生 API 调用
写在最后
/cost 的核心价值是透明。
AI 编程助手不是免费午餐。每一次对话、每一个 Token 都有成本。/cost 让你看到这些成本,从而做出更明智的决策——什么时候该全力以赴,什么时候该节省开支。
知道花了多少,才能花得值得。
相关推荐
Claude Code Agent Loop:拆解 AI 编程助手的心脏
Claude Code 是怎么一步步理解你的需求、调用工具、自我修复的?从源码角度拆解 Agent Loop 的核心架构——流式响应、并行工具执行、自动压缩、错误恢复,一次讲透。
Claude Code settings.json 详解(一):配置文件在哪里、谁说了算
全面介绍 Claude Code 的配置文件体系——五个配置来源的路径、优先级规则、数组合并与单值覆盖的区别、企业管理设置的多种下发方式。
Claude Code settings.json 详解(二):permissions 权限系统全解析
深入解析 Claude Code 的 permissions 配置——allow/deny/ask 三类规则、通配符语法、MCP 工具权限、defaultMode 各模式含义,以及 additionalDirectories 的作用。
Claude Code settings.json 详解(三):hooks 钩子全解析
深入解析 Claude Code 的 hooks 配置——四种钩子类型、核心事件(PreToolUse/PostToolUse/Stop/Notification)、stdin/stdout 协议、exit code 语义,以及实用配置示例。
Claude Code settings.json 详解(四):env、模型、认证与其他实用字段
全面介绍 Claude Code settings.json 中的 env 环境变量注入、模型配置、身份认证辅助、Git 提交署名、会话清理、语言与界面、思考深度、自动更新、记忆系统等实用字段。