当前位置:首页>文章>使用指南>AI编程总半途摆烂?Codex & Claude Code 上线/goal命令,彻底告别手动催更

AI编程总半途摆烂?Codex & Claude Code 上线/goal命令,彻底告别手动催更

文本是《AI咨询(共172篇)》专题的第 172 篇。阅读本文前,建议先阅读前面的文章:

不知道各位开发者有没有遇过这种扎心场景:

给 AI 编程工具下达一个大任务,比如整模块旧 API 迁移、批量重构代码、修复一批历史 Bug,本以为能坐等完工,结果 AI 只做了三五步,就自行判定 “任务完成” 直接停摆。

等你回头检查才发现:还有十几个 API 调用点没修改、部分逻辑未适配新版本、测试用例完全没跑通…… 最后还是要自己接手收拾烂摊子。

而最近,AI 编程领域迎来了一个重磅解决方案:OpenAI Codex CLI、Claude Code 先后正式推出 /goal 命令,直击 AI 编程 “提前摆烂、自行收尾” 的行业通病,彻底改写 AI 代码协作的模式。

一、先搞懂:AI 编程为啥总爱半途而废?

要理解 /goal 命令的价值,首先要看透 AI 编程 Agent 的底层工作逻辑。

主流 AI 编程工具都是回合制运行:模型每完成一轮代码修改、文件编辑、命令执行,就进入判断环节 ——由执行任务的同一个模型,自行评估任务是否完成

问题的核心矛盾就在这:
干活的人,同时当裁判

模型很容易被已经完成的部分工作干扰,产生乐观预估偏差:只看到改好的部分,自动忽略隐藏的调用点、未适配逻辑、未通过的测试,草率判定 “已完工”,直接终止任务。

这种自我校验的模式,注定扛不住大型、多轮、有明确验收标准的开发任务,也是开发者一直吐槽 AI 编程 “不靠谱、不省心” 的根源。

/goal 命令的诞生,核心思路只有一句话:把 “干活” 和 “判完工” 拆分,执行者只负责做事,独立评估者负责判定是否收尾

二、OpenAI Codex CLI /goal:持久化任务状态机

OpenAI 在 Codex CLI 0.128.0 版本中,正式原生接入 /goal 功能,它不只是一条简单指令,而是一套可托管、可暂停、可约束的持久化任务状态机

基础用法极其简洁

直接在命令行下达明确目标即可:
/goal 把 billing 模块完整迁移到新版API,直到编译和所有测试通过

核心亮点特性

  1. 任务状态持久化
    /goal 不是一次性 Prompt,而是绑定在会话线程上的常驻状态。哪怕关闭会话、跨窗口恢复,设定的任务目标依然保留,不会中途丢失。

  2. 全生命周期可控
    内置完整管理指令:

  • /goal pause 暂停任务

  • /goal resume 恢复继续执行

  • /goal clear 清空当前目标

  • 直接输入 /goal 查看实时任务状态

开发者可以随时介入、随时接管,掌控力拉满。

  1. 内置预算防失控
    支持添加令牌约束,例如 \-\-tokens 250K,避免模型无限制循环执行、浪费资源,从源头杜绝死循环跑任务的问题。

三、Claude Code /goal:独立模型做专职裁判

紧随其后,Claude Code 在 v2.1.139 版本上线原生 /goal 命令,和 Codex 思路同源,但实现机制更偏向独立模型分层校验

基础使用示例

/goal test/auth 目录下所有测试用例通过,且Lint校验无报错

核心工作机制

每一轮任务执行结束后,Claude 不会自己判断是否完工,而是把预设完成条件 + 当前全部对话上下文,交给一个轻量化高速独立模型做专职评估。

评估只输出两个结果:Yes 完成 / No 未完成,同时附上详细理由。

  • 若判定 No:评估理由会自动作为引导信息,传给主模型,精准告诉它还差哪些工作、哪里没达标,继续迭代;

  • 若判定 Yes:自动结束任务,标记目标完成。

实用高阶能力

  1. 支持超详细验收条件
    最多可编写 4000 字的规则描述,能清晰定义成功标准、约束条件、验证方式,复杂项目也能精准落地。

  2. 状态可视化可查
    输入 /goal 无参数,即可查看当前目标、运行时长、执行轮数、Token 消耗、最新评估理由,进度一目了然。

  3. 完美适配无人值守模式
    搭配 Claude Auto Mode 效果翻倍:Auto Mode 省去每次工具调用的手动确认,/goal 省去每轮结束等待用户指令,两者结合真正实现全自动无人迭代

  4. 支持非交互命令行运行
    可直接在终端后台下达任务:
    claude \-p "/goal CHANGELOG\.md 补全本周所有合并PR更新记录"
    适合离线批量任务、定时自动化流程。

四、Codex 与 Claude Code /goal 核心异同

两者底层逻辑高度统一:剥离执行模型的验收权限,用独立规则 / 模型做完工判定,解决 AI 提前收尾痛点。

细微差异集中在实现思路:

  • Codex 侧重状态机持久化,主打任务托管、跨会话恢复、资源预算管控;

  • Claude Code 侧重独立小模型实时评估,主打精细化条件校验、自动迭代引导、适配无人值守自动化。

对于开发者而言,不用纠结选型,只需根据日常使用的 CLI 工具直接上手即可。

五、哪些任务适合用 /goal?哪些不适合?

两大工具官方给出了统一的适用标准:有清晰验收标准、需要多轮迭代才能完成的任务,都是 /goal 的最佳场景。

✅ 非常适合使用:

  • 整模块旧 API 迁移,直至全调用点编译 + 测试通过

  • 按设计文档落地功能,满足所有验收条件

  • 批量修复标记 Issue,直到任务队列清空

  • 提升模块测试覆盖率,覆盖全部关键业务路径

  • 迭代优化 Prompt,直至评测分数达标

❌ 不建议使用:

  • 没有明确完成标准、依赖大量人工主观判断的任务

  • 简单需求,一两轮对话就能搞定的小事

  • 创意类、无固定验收规则的创作型任务

六、不止一个新命令:AI 编程迎来范式变革

/goal 看似只是新增了一条指令,背后却是AI 编程协作模式的一次重大升级

过去:结对编程模式

你说一步,AI 做一步;做完你检查,再下达下一步指令。全程需要人盯着、催着、把控进度,本质是人带着 AI 干活

现在:任务委托模式

你只需要描述最终结果、定下验收标准,AI 自主规划步骤、多轮迭代、自我校验,只有遇到卡点或全部完工时,才主动找你。

这已经不再是简单的对话写代码,而是把重复性开发任务,直接委派给 AI “虚拟工程师”

往后,开发者可以从繁琐的代码迁移、批量重构、测试补全、版本适配中解放出来,只专注架构设计、核心逻辑决策,把机械重复的迭代工作全权交给 AI。

写在最后

/goal 命令的普及,标志着 AI 编程正式从 “聊天式辅助”,迈入 “任务式托管” 时代。

再也不用忍受 AI 做一半就摆烂、再也不用逐步手动催促、再也不用接手遗留烂摊子。只要定好清晰目标,剩下的迭代、校验、收尾,AI 都能自主搞定。

随着 Codex、Claude Code 这类工具持续迭代,未来普通开发者的编码效率,还将迎来新一轮量级提升。

欢迎关注[一步API] https://yibuapi.com ,我们还会持续分享更多AI咨询、AI工具、实战经验、踩坑记录,助力你高效玩转AI开发、避开行业弯路。

AI编程总半途摆烂?Codex & Claude Code 上线/goal命令,彻底告别手动催更

想了解更多细节、获取专属支持,可添加 客服微信:xuexiv5876 \ YibuDev,随时咨询交流~

使用指南

评测上限被捅破!Claude Mythos超指数进化:AGI奇点,提前降临?

2026-5-12 8:03:29

使用指南

🚀 Claude Opus 4.5 横空出世,国内调用教程(附 Python 示例)

2025-11-29 23:02:07

搜索