General Agents
这些工具不只是会说话:它们会做事。学会驾驭其中一个;本书后面的所有内容都建立在这项能力之上。
Foundations 教会了你 AI 是什么,以及在使用 AI 时如何保住自己的判断力。本节就是你拿起本书其余部分会一直使用的工具的地方:一个 general agent,也就是不只会回答、还会行动的 AI。它会打开你的文件、阅读它们、编写并运行代码,还会使用其他应用把任务完成。
进入本节有两扇门,走哪一扇只取决于你是谁:
- Claude Code 和 OpenCode:给和代码打交道的人。
- Cowork 和 OpenWork:给其他所有人。同样的能力,但放在面向专业与知识工作的桌面 app 里。
同一个想法,不同的受众:你指挥一个 AI 做真实工作,而不是只和它聊天。
这是整本书的枢纽。后面的几乎所有内容,都假设你能驾驭 general agent。Mode 1(一次性解决问题)和 Mode 2(制造永久 worker)本质上都是「你加一个 general agent」。就连可选的 Personal Agent Harnesses 过渡,也要通过其中一个工具来安装并运行它的 harness。所以这是你会反复使用的一项技能。之后,你在这里驾驭的同一个 general agent,会变成你用来构建 worker 的工具。还是同一个工具,只是任务变大了。
本节分三阶段
四门课程沿着一条线推进:从你每一秒都握着工具,到精确指挥它,再到设计一个替你运行它的 loop。

阶段 1:驾驭
学会把 general agent 操作好。先做适合你的课程;另一个以后也可以再学。
- Agentic Coding:Claude Code 和 OpenCode:给和代码打交道的人。Plan mode、context 管理、规则文件、skills、subagents、connectors(MCP):怎样驾驭一个 coding agent,让它读取你的文件、提出计划、完成修改,并让你检查结果。
- 面向专业人士的 Cowork 和 OpenWork:给其他所有人。同一类 agent,但放在为专业工作而建的桌面 app 里(文档、表格、幻灯片、研究),所以你不用碰终端,也能把它投入工作。
阶段 2:指挥
驾驭能让你得到结果;指挥能让你每次都得到正确的结果。
- Spec-Driven Development:停止给 agent 模糊指令,开始交给它一份写清楚的 spec:到底要做什么、作用在什么对象上、什么才算「完成」。清楚的 spec,是 agent 猜测和 agent 命中目标之间的差别;当你进入 Mode 2 时,它也是你首先带过去的东西。
阶段 3:委派 loop
本节最后一步,是你第一次尝到自主性的味道,而且仍然在你已经认识的工具之内。
- Loop Engineering:从一直握着工具,跳到设计一个替你提示 agent 的系统。你会构建一个小 loop:它醒来,查看发生了什么变化,判断什么值得做,把每项工作交给 agent,检查结果,并且只在真正需要人做决定时才叫你。真正有价值的技能,从你写的 prompt,转移到你设计的 loop。这也是通往后续一切的自然入口。
你需要先具备什么
先完成 Foundations 这一节,尤其是 AI 时代如何思考(保住自己的判断力)和 技能与连接器(general agent 用来触达你的工具和数据的插件)。你不需要是程序员:如果你不是,就走 Cowork 和 OpenWork 这扇门,你完全可以继续。
它通向哪里
一旦你能驾驭、指挥、并把 general agent 放进 loop,整本书的其余部分就打开了。如果你想拥有一个运行在自己基础设施上的 worker,可选的 Personal Agent Harnesses 就在前面。然后就是整本书围绕的分叉:Mode 1:问题解决,用 general agent 一次性解决一个问题;以及 Mode 2:制造,构建一个永久 worker,让它永远替你解决这个问题。
本书的弧线一句话概括就是:Foundations 用来理解,General Agents 用来驾驭,两种 mode 用来投入工作。
从适合你的那扇门开始:如果你和代码打交道,就从 Claude Code 和 OpenCode 开始;如果不是,就从 Cowork 和 OpenWork 开始。