文本是《AI咨询(共125篇)》专题的第 125 篇。阅读本文前,建议先阅读前面的文章:
- 1.Gemini 3.0 要掀桌子了?它到底能不能影响到 GPT 和 Claude——以及**
- 2.🤖到底哪种AI才适合你?
- 3.Claude”全能模型”?我来给你扒一扒他的真实战力
- 4.为什么国内模型这么多,还是有很多人用国外的模型?
- 5.2025编程AI模型终极省钱指南:又便宜又能干的”码农助手”怎么选?
- 6.AI小白选择指南:别慌,我教你
- 7.公司批量跑图片数据?2025年最新模型全景选型指南
- 8.AI模型这么多,我难道要一个一个接入?
- 9.纯小白的大模型API使用指南:从”这是啥”到”我会了”
- 10.AI赋能企业:从”人工智障”到”人工智能”的华丽转身
- 11.AI酒馆玩家必读:API中转站的六大核心优势
- 12.Claude Code写代码的好处:让AI当你的编程助手
- 13.Gemini 3全面评测:比Gemini 2.5强在哪?性能对比+实战测试【2025最新】
- 14.详细教程:国内调用 Google Gemini 3.0 Pro API 接口(附 Python 示例)
- 15.🚀 Claude Opus 4.5:Anthropic 2025年发布的旗舰级AI模型,全面升级!
- 16.🚀 Claude Opus 4.5 横空出世,国内调用教程(附 Python 示例)
- 17.无需翻墙!YibuAPI中转站带你直连Google Gemini 3,多模态AI能力即刻解锁
- 18.Google Gemini 3.0 Pro国内接入指南:API中转破解三重困境
- 19.最全 调用 Gemini 3.0 Pro 完整教程-附完整python代码(2025最新版)
- 20.🚀 Google Gemini 3.0 Pro国内直连:API中转破困境,3步接入教程
- 21.GPT-5:国内开发者零门槛接入指南,低价多模态API实战方案
- 22.Gemini3:国内开发者零门槛接入指南,原生多模态 API 实战方案
- 23.Claude 4合规接入教程:国内支付+250万Token免费领,多模态API实战
- 24.Java调用大模型API实战指南:从环境搭建到生产级适配
- 25.GPT-5 API国内直连解决方案:开发者接入指南
- 26.无需费脑!YibuAPI中转站直连Claude Opus 4.5,解锁新一代超智能AI交互体验
- 27.9步配置Sider+一步API:打造网页浏览最强AI助手(开发者避坑指南)
- 28.打工人狂喜!GPT-5.2强势来袭,办公效率翻倍,YIBUAPI零门槛解锁
- 29.GPT-5.1与GPT-5.2全面评测及落地手册:能力迭代解析与一步API接入实操
- 30.破解AI模型集成的”多端适配困局”:一站式解决方案的技术实践
- 31.纯小白入门大模型API:从零基础到实战通关
- 32.详细教程:国内调用 GPT-5.2 API 接口(附 Python 示例)
- 33.gpt-image-1.5 国内直连指南:解锁多模态AI创作新体验
- 34.step-audio-2 解锁跨模态音频新纪元:国内无缝接入指南
- 35.小米MiMo-V2-Flash:开源大模型的效率革命与全能突破
- 36.GPT-Image-1.5 性能巅峰!国内直连攻略(无壁垒接入)
- 37.Mistral 3系列模型国内直连指南:突破壁垒的API中转方案
- 38.PHP 项目调用大模型 API 全流程实战(适配 OpenAI/国内大模型)
- 39.Claude Opus 4.5:凭何加冕编程新王?
- 40.Gemini 3.0 Pro:多模态重塑编程生态,开启智能开发新纪元
- 41.GLM-4.7:开源大模型的全能进化,重新定义人机协同边界
- 42.DeepSeek-V3.2重磅开源:340B混合专家架构,重塑开源大模型性能新标杆
- 43.国内外主流AI大模型全景对比与国外大模型高效接入方案
- 44.解锁 AI 大模型价值:从低门槛接入到未来布局
- 45.开源突围VS闭源巅峰:DeepSeek-V3.2与GPT-5.2全方位实力对决
- 46.双雄对决:DeepSeek-V3.2与Gemini 3.0 Pro的AI技术路径博弈
- 47.GLM-4.7与GPT-5.2全面对比及一步API接入指南
- 48.Grok-4.1:马斯克的AI新王,重新定义人机交互新范式
- 49.Grok-4.1横空出世:双商驱动重构大模型竞争新秩序
- 50.一步API:赋能企业高效链接全球AI大模型的核心枢纽
- 51.一步API:轻松打通GPT-5.2接入链路,赋能全场景AI应用
- 52.一步API:打通全球顶尖AI的桥梁,Gemini 3.0 Pro接入指南全解析
- 53.Sora Video2:次世代AI视频生成引擎,从功能突破到API实战接入
- 54.Sora Video2:重塑AI视频生成生态,附完整API接入指南
- 55.Sora Video2深度解析:核心能力与一步API接入全指南
- 56.DeepSeek-V3.2:技术革新与一步API平台接入指南
- 57.Sora Video2:重塑AI视频创作生态,一步API解锁国内零门槛接入
- 58.Kimi K2.5:多模态全能模型的突破与一步API接入指南
- 59.Kimi K2.5:全能开源AI新标杆,一步API接入实战指南
- 60.ClaudeBox入门到实战:容器化AI编程环境+国内合规API接入全指南
- 61.Clawdbot+一步API:破解国内AI智能体落地难题,打造本地化“数字员工”新范式
- 62.Clawdbot 与一步 API 深度集成:打造个人 AI 管家
- 63.Clawdbot(Moltbot):本地优先的全能AI助手与一步API接入实战指南
- 64.OpenClaw+一步API接入指南:打通企业级AI能力,10分钟落地数字协作者
- 65.揭秘AI漫剧制作全流程:从0到1低成本创作,一步API助力效率飙升
- 66.Sora2政策收紧,Veo 3.1能否撑起AI漫剧生产力大旗?
- 67.AI漫剧制作新纪元:4K高清+稳如磐石,一步API解锁创作新可能
- 68.4K高清时代降临!Veo 3.1模型正式上线,一步API零门槛接入
- 69.实测一步API跑Veo 3.1 4K:2026商用漫剧,画质与稳定才是生死线
- 70.今日首发|Claude Opus 4.6重磅登场,核心能力全面跃升,新功能解锁高效体验
- 71.Claude Opus 4.6 版本特性解析及一步API接入指南
- 72.双雄炸场!Claude Opus 4.6与GPT-5.3-Codex对决,AI编程迈入全能协作新纪元
- 73.GPT-5.3-Codex重磅发布|OpenAI最强编程智能体,一步API便捷接入适配全场景
- 74.doubao-Seedance-2.0:字节自研Seed基座重构AI视频创作,一步API接入开启全场景生产力
- 75.阿里Qwen-Image-2.0重磅发布:生编一体焕新AI图像创作,一步API平台便捷接入
- 76.GLM-5重磅来袭:开源SOTA旗舰模型,一步API轻松解锁全能AI能力
- 77.豆包大模型2.0重磅发布 一步API开启企业AI升级高效接入新路径
- 78.除夕开源重磅:Qwen3.5重构大模型范式,开启效率与能力双优新时代
- 79.跨代升级来袭!豆包大模型Seed-2.0正式发布,全维度解锁AI新能力
- 80.谷歌Gemini 3.1 Pro重磅发布:推理性能翻倍,一步API快速接入指南
- 81.大年初二重磅!Anthropic 最强 Sonnet 来袭:Claude Sonnet 4.6 发布,一步API一键直连
- 82.Seedance-2.0:重构AI视频创作范式,开启导演级创作新纪元
- 83.Seedance-2.0重构AI漫剧/短剧生态:新手零门槛量产,全群体可API接入抢占百亿风口
- 84.百亿赛道突围:Seedance-2.0重构AI漫剧/短剧创作逻辑,全群体均可API接入量产
- 85.Seedream 5.0 Lite重磅上线:三大能力革新,一步API轻松接入解锁全场景创作
- 86.阿里千问Qwen3.5-Flash重磅开源 一步API同步上线便捷接入通道
- 87.OpenRouter 全面封堵后:国内唯一稳定替代方案——一步API
- 88.Nano Banana 2重磅发布!通过一步API平台,解锁闪电级AI图像生成能力
- 89.【保姆级教程】手把手教你安装 OpenClaw并配置使用一步API
- 90.Seedance 2.0 创作指南:告别AI视频“抽卡式”生成,解锁导演级精准控片
- 91.200+可安装AI Skills全整理:让Agent秒变全能打工人,一步API加持更稳更强
- 92.2026短剧行业大洗牌:真人退潮,AI上岸,一步API助力抓住生存线
- 93.GPT-5.3 Instant治愈AI“爹味”,一步API解锁开发者高效落地新姿势
- 94.保姆级教程|OpenClaw 飞书机器人对接,新手也能10分钟上手
- 95.GPT-5.4重磅发布!原生操控电脑,一步API带你抢占智能体时代先机
- 96.小米miclaw封测来袭!OpenClaw 3.2降智避坑|AI落地靠它稳了
- 97.小龙虾接入QQ!官方直连超简单,无云主机无公网IP
- 98.企业微信正式接入OpenClaw!超简单,打工人AI办公神器来了|附一步API强力加持
- 99.微信直连!腾讯QClaw重磅上线,OpenClaw平替一键本地部署
- 100.OpenClaw 完整配置教程(含第三方中转接入,从零到实操)
- 101.OpenClaw 安装运行使用常见错误总结与解决方案(Windows/macOS/Linux全平台)
- 102.教你如何解决 OpenClaw 安装飞书插件失败的问题
- 103.OpenClaw 完全上手指南:用聊天软件操控你的电脑,AI 员工时代正式开启
- 104.OpenClaw MCP Adapter 完整教程:让任意 AI 客户端驱动 OpenClaw
- 105.保姆级教程:Ubuntu 安装 OpenClaw + 接入飞书 + 配置 AKShare MCP
- 106.OpenClaw 实战:搭建企业级 AI 客服与自动化销售系统
- 107.用什么电脑?选哪个模型?接哪个软件?养虾(OpenClaw)全攻略一篇搞定
- 108.国家应急中心点名了,养虾(OpenClaw)前这几个安全设置你必须做
- 109.Gemini Embedding 2登场,多模态RAG新基准诞生,延迟狂降70%+一步API速用
- 110.OpenClaw Skills 热门技能排行榜 Top 10|搭配一步API,AI开发效率直接拉满!
- 111.OpenClaw Skill 自制指南:零代码,10分钟拥有专属AI技能
- 112.还在部署OpenClaw?有人用AI当「赛博皇帝」,搭出全套数字化三省六部!
- 113.智谱GLM-5-Turbo首发, OpenClaw专属优化,一步API一键接入
- 114.OpenClaw优化设置指南(完整清单):装完必看,少走弯路
- 115.MiniMax M2.7震撼发布!首个自进化大模型,一步API快速接入解锁新可能
- 116.炸场!小米一口气发布3个大模型,霸榜OpenRouter,国内第一梯队稳了
- 117.重磅!腾讯QClaw全面开放,无需邀请码!微信直接遥控电脑干活
- 118.微信重磅更新!官方支持OpenClaw,人人都能养专属“龙虾”
- 119.Claude Code 究极配置指南:10个月实战验证,凭这套配置,效率直接翻5倍
- 120.开源 Claude Code 工程级开发插件 Superpowers 完整上手攻略:安装 + 实战 + 技巧全解析
- 121.刚开源就爆火!MiniMax 官方开源压箱底技能包,AI 编程直接封神
- 122.暴涨48.2K Stars!字节开源DeerFlow 2.0,让AI智能体搞定所有复杂任务
- 123.一文掌握 Claude Code 最全快捷键与命令手册(2026最新版)
- 124.飞书CLI正式开源,Claude Code无缝接管你的全量工作数据
最近,AI 编程圈流传着一句扎心的话:Prompt 工程过时了,Context 工程也过时了,现在学好 Harness 工程才是王道。
短短一个月,Harness Engineering 从一篇博客文章里的概念,迅速成为开发者社区的高频词,甚至有人说,它正在重塑 AI 智能体编程的底层逻辑。
其实核心真相很简单:在 AI 智能体编程领域,决定结果好坏的最大变量,从来不是模型有多聪明,而是模型之外那一整套状态、工具、环境、反馈回路与约束系统。
如果 AI 终将成为软件开发流程中的长期参与者,那么软件工程系统本身,也需要一场对应的进化。
LangChain 作者 Vivek Trivedy 在《The Anatomy of an Agent Harness》中,就试图回答这个越来越关键,但行业内总说不清楚的词:Harness。
一、核心定义:Agent = Model + Harness
有一句很绝对,但直击本质的话:如果你不是模型,那就是 Harness。
Harness 本质上就是模型之外的一切——代码、配置,以及各种执行逻辑。模型本身只是能力的来源,就像一把锋利的刀,而 Harness 就是握住刀的手、使用刀的方法,只有通过它把状态、工具调用、反馈循环和约束机制串起来,模型才真正变成一个能自主工作的 Agent。
具体来说,Harness 通常包含这 5 个核心部分:
-
系统提示词:定义模型的角色和核心目标,相当于给 Agent 定好“岗位职责”;
-
工具、技能、MCP:模型可以调用的外部能力,是 Agent 完成任务的“工具箱”;
-
基础设施:文件系统、沙箱、浏览器等运行环境,是 Agent 工作的“办公场地”;
-
编排逻辑:子 Agent、任务拆分、模型路由等,相当于 Agent 的“工作流程指南”;
-
钩子/中间件:压缩、续写、代码检查等确定性流程,是 Agent 工作的“质量把关人”。
为什么要用「模型 vs Harness」来划分系统?因为这是最清晰的边界。很多关于 Agent 的定义都很模糊,但用这个方式去看,会逼你明确两件事:模型负责什么?剩下的系统要补什么?

二、关键问题:为什么一定要有 Harness?
答案很朴素,却戳中核心:有些事我们希望 Agent 能做,但模型本身做不到。
先搞清楚模型的边界,就懂了 Harness 的价值。大多数模型的输入是文本、图像、音频,输出也只是文本——它本质上就是一个“输入→输出”的函数,本身并不会做这些事:
-
在多轮交互中记住状态(比如聊天时记得上一轮的对话);
-
执行代码、运行程序;
-
获取实时信息(比如最新的 API 变化、新发布的库版本);
-
操作环境(比如装依赖、修改本地文件)。
这些能力,都不在模型里,而是靠 Harness 补回来的。
举个最常见的例子:聊天。我们觉得和 AI 聊天很自然,但其实模型本身并不会“聊天”。要实现这个体验,至少需要做 3 件事:
-
维护一段对话历史;
-
每次请求时把历史拼进上下文;
-
不断循环接收用户输入和模型输出。
本质上,就是用一个简单的循环,把模型“包起来”用——而这个循环,就是 Harness 的一部分。
这也是 Harness Engineering 的核心思路:不纠结于“调教模型能不能做到”,而是先想清楚“要它做到什么”,再把这些能力一个个补到 Harness 里。

三、拆解 Harness 核心组件:每一部分都在解决模型的“短板”
Harness 的每一个组件,都是为了弥补模型的不足,让 Agent 能真正自主、高效、安全地工作。我们逐一拆解最关键的几个核心模块。
1. 文件系统:Agent 的“工作笔记本”
我们希望 Agent 能用真实数据、能保存工作成果、能处理超出上下文窗口的内容,但模型只能处理当前上下文里的信息——没有文件系统,用户只能反复复制粘贴,Agent 根本无法自主工作。
所以 Harness 必须提供文件系统抽象和对应的读写操作,有了它,Agent 才算有了“工作空间”:
-
可以自由读写数据、代码和文档;
-
信息按需加载,不用一股脑塞进上下文(避免占用有限资源);
-
中间结果可以保存,状态能跨会话保留(比如这次没做完,下次可以继续);
-
文件本身就是协作接口:人和多个 Agent 可以围绕同一份文件协同工作。
如果再加上 Git 版本控制,就更完善了:可以记录每一步改动、出问题能回滚、还能开分支做不同尝试。
其实文件系统不是“附加功能”,而是最基础的 Harness 组件——后面的状态管理、协作、任务拆分,都要依赖它。
2. Bash + 代码执行:Agent 的“万能工具箱”
我们真正想要的,是让 Agent 能自己解决问题,而不是每一步都要我们提前设计好工具。但现在大多数 Agent 都有一个局限:只能用我们提前给好的工具,而我们不可能穷举所有工具。
更高效的做法是:不给一堆固定工具,直接给它一台“能干活的机器”——在 Harness 里提供 Bash + 代码执行能力。
一旦有了这个能力,Agent 的灵活性会瞬间提升:
-
可以自己写脚本解决问题,不用依赖预定义接口;
-
可以临时“造工具”,应对突发需求;
-
可以组合已有能力,拼出新的工作流。
本质上,我们不再是“设计工具列表”,而是给 Agent 提供一个通用执行环境——这才是让 Agent 真正“自主解决问题”的关键。
3. 沙箱环境和工具:Agent 的“安全工作间”
给了 Agent“能存”(文件系统)和“能执行”(Bash + 代码)的能力,还不够——它还需要一个能放心干活的地方。
如果直接在本地执行模型生成的代码,风险很高(比如误删文件、触发恶意代码);而且本地环境也很难支撑多任务、并发的 Agent 工作。所以更合理的做法是:把执行放进沙箱里。
沙箱主要解决两个核心问题:
① 安全性
-
隔离执行环境,避免影响本地系统;
-
可以限制命令、禁用网络、控制权限;
-
即使出错,也被限制在沙箱内部,不会造成全局损失。
② 可扩展性
-
可以按需创建环境,适配不同任务;
-
多个任务可以并行执行,互不干扰;
-
用完就销毁,不留下状态污染。
但光有沙箱还不够,还要让它“开箱能用”——Harness 会提前准备一套默认工具,比如语言运行时、常用依赖、Git、测试工具、浏览器等。
这些工具的价值,不只是“能用”,更是让 Agent 能观察自己的工作结果:看日志、跑测试、截图页面、检查输出,从而形成一个“写代码→运行→观察→修复→再运行”的自我验证循环——而这,正是 Harness 的核心职责之一。
4. 记忆与搜索:Agent 的“学习能力”
我们希望 Agent 不只是“当下聪明”,还要能记住东西、查到新信息,但模型本身没有“记忆”,也不能主动更新知识——它的知识只来自训练时的权重,和当前上下文里的信息。
要解决这个问题,关键只有一个:通过上下文注入,把新知识、新信息喂给模型。
这里,文件系统又成了基础设施。一种常见的做法是,让 Harness 维护一份“记忆文件”(比如 AGENTS.md):
-
Agent 运行时可以往里面写信息(比如学到的经验、遇到的问题);
-
下次启动时,这些内容会重新加载进上下文;
-
文件更新了,Agent 的“记忆”也会随之更新。
这是一种很朴素的“学习方式”——虽然没有修改模型权重,但已经能实现跨会话积累经验。
而针对“模型不知道现在发生了什么”的问题(比如最新的 API 变化、实时数据),Harness 会提供搜索和外部知识获取能力(比如 Web Search、Context7 等工具),把模型“看不到”的信息,拉进上下文里。
5. 对抗上下文衰减:让 Agent 不“越用越笨”
上下文是有限资源,一旦内容越来越长,模型的表现就会变差——这就是“上下文衰减”:有效信息比例下降、关键线索被淹没、推理能力不稳定。
而 Harness 的核心作用之一,就是把“上下文管理”工程化,让 Agent 在长时间工作中,始终用“干净”的上下文。主要有 3 种核心手段:
-
压缩(Compaction):上下文快满时,对已有内容做总结、保留关键信息,把细节移出上下文,避免信息冗余;
-
工具调用卸载:工具输出往往又长又杂,只保留开头和结尾的关键信号,完整内容写入文件系统,需要时再读取,避免“噪音”占据上下文;
-
技能延迟加载:不一开始就把所有工具说明、MCP 描述塞进上下文,而是按需加载——先给最小必要信息,需要某个能力时,再引入相关内容,相当于工具的“懒加载机制”。
6. 长期自主执行:让 Agent 能“从头做到尾”
我们真正想要的,是让 Agent 能把一件复杂的事从头做到尾,但现在的模型常常出现“提前结束”“任务拆解不清晰”“跨上下文工作不连贯”的问题——问题不在模型会不会写代码,而在能不能持续推进工作。
这需要多组能力叠加,而核心还是离不开 Harness:
-
文件系统 + Git:把工作过程“记下来”,中间结果落盘、历史变化可追溯,新的 Agent 能快速接手进度,多 Agent 协作也有了“共享笔记本”;
-
Ralph 循环:拦截模型“我要结束”的信号,给它一个干净的上下文,让它继续朝目标推进——关键是,上下文可以重置,但状态不能丢(这也是文件系统的重要性);
-
规划 + 自我验证:先把目标拆成步骤写进文件,持续更新,避免跑偏;每做完一步,通过跑测试、看日志、检查输出来验证,失败了就把错误信息喂回模型,继续修正,形成“执行→检查→反馈→修正”的闭环。
四、Harness 与模型:共同进化,而非相互替代
今天的 Agent 产品(比如 Claude Code、Codex),都是模型和 Harness 同时演化的结果——模型不仅学习生成文本,还被训练去更好地使用 Harness 提供的工具和流程(比如文件系统操作、Bash 执行、任务规划)。
这形成了一个良性反馈循环:
-
Harness 提供原语和操作能力;
-
模型学习如何使用这些原语;
-
训练结果反馈回下一代模型;
-
模型在相同 Harness 环境中表现越来越好。
但这种共同进化也有副作用:模型可能对特定工具或逻辑“过拟合”,换个 Harness 环境,性能就会下降。
比如 Codex-5.3 中,用于编辑文件的 apply_patch 工具,如果模型训练时只接触一种逻辑,切换补丁方法就可能出问题;Terminal Bench 2.0 测试也显示,Claude Code 中的 Opus 4.6,在不同 Harness 中的得分差距很大。
这也说明:最适合你任务的 Harness,不一定是模型训练时使用的那个。LangChain 的编码 Agent 就是最好的例子——通过优化 Harness(文档结构、验证回路、追踪系统),它在同一基准下的排名从全球第 30 位升到第 5 位,得分从 52.8% 提升到 66.5%。

五、结语:Harness 是舞台,模型是演员
有人说,随着模型越来越强大,Harness 会变得不那么重要——毕竟模型未来可能会吸收 Harness 的部分功能,在规划、自我验证、长时程任务连贯性上更可靠,对上下文注入的依赖也会减少。
但就像 Prompt 工程今天依然有价值一样,Harness Engineering 未来依然是构建高效 Agent 的关键——因为它不只是弥补模型的不足,更是一种“设计系统的方式”:
-
配置良好的环境,让模型不用“束手束脚”;
-
合适的工具,让模型能“大展拳脚”;
-
持久的状态和验证循环,让模型能“稳定输出”。
用一个很贴切的比喻来说:
Harness 是舞台和幕后控制系统,Agent 是舞台上的演员。无论演员多么出色,没有舞台、没有灯光、没有规则,也难以发挥全部能力。
在 AI 智能体时代,真正的核心竞争力,从来不是“选对模型”,而是“驾驭模型”——而 Harness Engineering,就是那套最关键的“驾驭之道”。
欢迎关注一步API(https://yibuapi.com) ,我们还会持续分享更多AI咨询、AI工具、实战经验、踩坑记录,助力你高效玩转AI开发、避开行业弯路。

想了解更多细节、获取专属支持,可添加客服微信:xuexiv5876 \ YibuDev,随时咨询交流~
