AI编程总半途摆烂？Codex & Claude Code 上线/goal命令，彻底告别手动催更

文本是《AI咨询（共172篇）》专题的第 172 篇。阅读本文前，建议先阅读前面的文章：

不知道各位开发者有没有遇过这种扎心场景：

给 AI 编程工具下达一个大任务，比如整模块旧 API 迁移、批量重构代码、修复一批历史 Bug，本以为能坐等完工，结果 AI 只做了三五步，就自行判定 “任务完成” 直接停摆。

等你回头检查才发现：还有十几个 API 调用点没修改、部分逻辑未适配新版本、测试用例完全没跑通…… 最后还是要自己接手收拾烂摊子。

而最近，AI 编程领域迎来了一个重磅解决方案：OpenAI Codex CLI、Claude Code 先后正式推出 /goal 命令，直击 AI 编程 “提前摆烂、自行收尾” 的行业通病，彻底改写 AI 代码协作的模式。

一、先搞懂：AI 编程为啥总爱半途而废？

要理解 /goal 命令的价值，首先要看透 AI 编程 Agent 的底层工作逻辑。

主流 AI 编程工具都是回合制运行：模型每完成一轮代码修改、文件编辑、命令执行，就进入判断环节 ——由执行任务的同一个模型，自行评估任务是否完成。

问题的核心矛盾就在这：
干活的人，同时当裁判。

模型很容易被已经完成的部分工作干扰，产生乐观预估偏差：只看到改好的部分，自动忽略隐藏的调用点、未适配逻辑、未通过的测试，草率判定 “已完工”，直接终止任务。

这种自我校验的模式，注定扛不住大型、多轮、有明确验收标准的开发任务，也是开发者一直吐槽 AI 编程 “不靠谱、不省心” 的根源。

而 /goal 命令的诞生，核心思路只有一句话：把 “干活” 和 “判完工” 拆分，执行者只负责做事，独立评估者负责判定是否收尾。

二、OpenAI Codex CLI /goal：持久化任务状态机

OpenAI 在 Codex CLI 0.128.0 版本中，正式原生接入 /goal 功能，它不只是一条简单指令，而是一套可托管、可暂停、可约束的持久化任务状态机。

基础用法极其简洁

直接在命令行下达明确目标即可：
/goal 把 billing 模块完整迁移到新版API，直到编译和所有测试通过

核心亮点特性

任务状态持久化
/goal 不是一次性 Prompt，而是绑定在会话线程上的常驻状态。哪怕关闭会话、跨窗口恢复，设定的任务目标依然保留，不会中途丢失。
全生命周期可控
内置完整管理指令：

/goal pause 暂停任务
/goal resume 恢复继续执行
/goal clear 清空当前目标
直接输入 /goal 查看实时任务状态

开发者可以随时介入、随时接管，掌控力拉满。

内置预算防失控
支持添加令牌约束，例如 \-\-tokens 250K，避免模型无限制循环执行、浪费资源，从源头杜绝死循环跑任务的问题。

三、Claude Code /goal：独立模型做专职裁判

紧随其后，Claude Code 在 v2.1.139 版本上线原生 /goal 命令，和 Codex 思路同源，但实现机制更偏向独立模型分层校验。

基础使用示例

/goal test/auth 目录下所有测试用例通过，且Lint校验无报错

核心工作机制

每一轮任务执行结束后，Claude 不会自己判断是否完工，而是把预设完成条件 + 当前全部对话上下文，交给一个轻量化高速独立模型做专职评估。

评估只输出两个结果：Yes 完成 / No 未完成，同时附上详细理由。

若判定 No：评估理由会自动作为引导信息，传给主模型，精准告诉它还差哪些工作、哪里没达标，继续迭代；
若判定 Yes：自动结束任务，标记目标完成。

实用高阶能力

支持超详细验收条件
最多可编写 4000 字的规则描述，能清晰定义成功标准、约束条件、验证方式，复杂项目也能精准落地。
状态可视化可查
输入 /goal 无参数，即可查看当前目标、运行时长、执行轮数、Token 消耗、最新评估理由，进度一目了然。
完美适配无人值守模式
搭配 Claude Auto Mode 效果翻倍：Auto Mode 省去每次工具调用的手动确认，/goal 省去每轮结束等待用户指令，两者结合真正实现全自动无人迭代。
支持非交互命令行运行
可直接在终端后台下达任务：
claude \-p "/goal CHANGELOG\.md 补全本周所有合并PR更新记录"
适合离线批量任务、定时自动化流程。

四、Codex 与 Claude Code /goal 核心异同

两者底层逻辑高度统一：剥离执行模型的验收权限，用独立规则 / 模型做完工判定，解决 AI 提前收尾痛点。

细微差异集中在实现思路：

Codex 侧重状态机持久化，主打任务托管、跨会话恢复、资源预算管控；
Claude Code 侧重独立小模型实时评估，主打精细化条件校验、自动迭代引导、适配无人值守自动化。

对于开发者而言，不用纠结选型，只需根据日常使用的 CLI 工具直接上手即可。

五、哪些任务适合用 /goal？哪些不适合？

两大工具官方给出了统一的适用标准：有清晰验收标准、需要多轮迭代才能完成的任务，都是 /goal 的最佳场景。

✅ 非常适合使用：

整模块旧 API 迁移，直至全调用点编译 + 测试通过
按设计文档落地功能，满足所有验收条件
批量修复标记 Issue，直到任务队列清空
提升模块测试覆盖率，覆盖全部关键业务路径
迭代优化 Prompt，直至评测分数达标

❌ 不建议使用：

没有明确完成标准、依赖大量人工主观判断的任务
简单需求，一两轮对话就能搞定的小事
创意类、无固定验收规则的创作型任务

六、不止一个新命令：AI 编程迎来范式变革

/goal 看似只是新增了一条指令，背后却是AI 编程协作模式的一次重大升级：

过去：结对编程模式

你说一步，AI 做一步；做完你检查，再下达下一步指令。全程需要人盯着、催着、把控进度，本质是人带着 AI 干活。

现在：任务委托模式

你只需要描述最终结果、定下验收标准，AI 自主规划步骤、多轮迭代、自我校验，只有遇到卡点或全部完工时，才主动找你。

这已经不再是简单的对话写代码，而是把重复性开发任务，直接委派给 AI “虚拟工程师”。

往后，开发者可以从繁琐的代码迁移、批量重构、测试补全、版本适配中解放出来，只专注架构设计、核心逻辑决策，把机械重复的迭代工作全权交给 AI。

写在最后

/goal 命令的普及，标志着 AI 编程正式从 “聊天式辅助”，迈入 “任务式托管” 时代。

再也不用忍受 AI 做一半就摆烂、再也不用逐步手动催促、再也不用接手遗留烂摊子。只要定好清晰目标，剩下的迭代、校验、收尾，AI 都能自主搞定。

随着 Codex、Claude Code 这类工具持续迭代，未来普通开发者的编码效率，还将迎来新一轮量级提升。

欢迎关注[一步API] https://yibuapi.com ，我们还会持续分享更多AI咨询、AI工具、实战经验、踩坑记录，助力你高效玩转AI开发、避开行业弯路。

AI编程总半途摆烂？Codex & Claude Code 上线/goal命令，彻底告别手动催更

想了解更多细节、获取专属支持，可添加客服微信：xuexiv5876 \ YibuDev，随时咨询交流～

AI编程总半途摆烂？Codex & Claude Code 上线/goal命令，彻底告别手动催更

一、先搞懂：AI 编程为啥总爱半途而废？

二、OpenAI Codex CLI /goal：持久化任务状态机

基础用法极其简洁

核心亮点特性

三、Claude Code /goal：独立模型做专职裁判

基础使用示例

核心工作机制

实用高阶能力

四、Codex 与 Claude Code /goal 核心异同

五、哪些任务适合用 /goal？哪些不适合？

六、不止一个新命令：AI 编程迎来范式变革

过去：结对编程模式

现在：任务委托模式

写在最后

评测上限被捅破！Claude Mythos超指数进化：AGI奇点，提前降临？

🚀 Claude Opus 4.5 横空出世，国内调用教程（附 Python 示例）

【保姆级教程】手把手教你安装 OpenClaw并配置使用一步API

OpenRouter 访问受限后：国内可靠的替代方案——一步API

Claude Code CLI 安装与配置完整教程 | 支持 Windows 与 macOS 的 AI 编程助手

详细教程：国内调用 Google Gemini 3.0 Pro API 接口（附 Python 示例）

OpenClaw 完整配置教程（含第三方中转接入，从零到实操）

AI小白选择指南：别慌，我教你

关于本站

帮助中心

网站索引

关注交流