Agent Factory 论纲:简明中文版本
熟悉 AI?阅读专业版 →
这个版本写给谁? 这个版本写给两类读者:刚接触技术和商业的人,以及英语不是第一语言的人。这里会尽量使用简单词句,句子更短,重要词汇第一次出现时都会解释。原始论纲也提供给已经熟悉这些词、想读更深入版本的读者。两个版本说的是同一件事。 它们只是走向结论的路径不同。
阅读本文的三种方式
10 分钟路径:只读下一节“从这里开始:2 页读完整个论纲”。这一节已经给出完整论证。
30 分钟路径:读第 1、5、9、13、15、17 节。你会得到核心思想和一个完整例子。
完整路径:按顺序读完每一节。大约 60 到 90 分钟。适合想要深度、证据和故事的读者。
三条路径最后都会抵达同一个地方。选择适合你时间的方式。
从这里开始:2 页读完整个论纲
如果你只有 10 分钟,就读这一节。它包含完整论证。后面的内容只是用更多例子、更慢的节奏讲同一个想法。
最大的变化
过去 20 年,科技公司把软件卖给你。你登录软件,自己做工作,每个月为访问权付费。
这个模式不再是唯一模式。一个新模式正在旁边兴起。新的公司正在被构建出来,在这些公司里,worker 是 AI,而不是工具。你不再从这些公司购买工具。你雇用它们的 AI 劳动力为你完成一项工作。
想象差别。Microsoft 卖给你 Word,你自己写文档。新模式卖给你的是写好的文档:由 AI worker 写成、经过质量检查、交付给你。你付费买的是结果,而不是工具。
先学会 3 个词
- AI Worker(也叫 Digital FTE,意思是由软件构成的 Full-Time Employee):为执行一个具体岗位而构建的 AI,就像人类员工有岗位一样。客户支持、记账、销售,每一个都是“岗位形状”的 AI。
- AI-Native Company:大多数 worker 都是 AI 的公司。它销售的是这些 worker 产出的东西。
- Agent Factory:构建 AI worker,以及由这些 worker 组成的公司的方法。它不是你购买的产品,而是你学习的一种实践。
工作如何分配
人类设定方向。AI 完成工作。人类检查结果。
这就是 10-80-10 节奏:
- 前 10%:人类写出清晰计划,包括目标、限制和预算
- 中间 80%:AI worker 完成实际工作
- 最后 10%:人类检查并批准
有 3 件事始终留在人类手里,不会交给 AI:意图(知道自己想要什么)、验证(知道自己是否真的得到了它)、结果所有权(对结果负责)。
未来公司的两层
一个人无法手动管理 20 个 AI worker。所以公司会有两层:
- 边缘层:每个人都有一个个人 AI agent,也就是 delegate,它了解这个人并代表这个人行动。
- AI 劳动力层:专业化 AI worker 执行实际工作,由管理层协调。
你和自己的 delegate 对话。delegate 和劳动力对话。结果再回到你手里。
使用强大 AI 工具的两种方式
当你坐下来使用一个通用 AI 工具时,你实际上在做两件事之一:
- 问题解决:你现在有一个问题,想得到一个完成的答案,然后会话结束。例如修复 bug、分析报告。
- 制造:你正在构建一个新的 AI worker,它会在这次会话结束后继续运行。输出不是一个答案,而是一个以后不断产生答案的永久 worker。
一种模式解决今天的问题。另一种模式制造明天的 worker。
7 条不会改变的规则
任何 AI-Native Company 的架构都遵守 7 条规则:
- 人类负责。 每个行动都能追溯到设定方向的人。
- 每个人都需要一个 delegate。 一个 AI agent 代表你并替你行动。
- 劳动力需要管理层。 它招聘 worker、分配工作、控制预算。
- 每个 worker 使用正确的 engine。 重要工作用可靠 engine,例行工作用便宜 engine。
- 每个 worker 使用记录系统。 AI worker 从公司的官方记忆读取,也写回那里。
- 劳动力能在规则内增长。 出现缺口时,系统会在人的限制内招聘新 worker。
- 公司运行在神经系统上。 事件自动在 worker 之间流动,能承受崩溃,并控制流量。
规则不变。今天填充这些规则的具体产品(OpenClaw、Paperclip、Inngest 等)会改变,这没有问题。工具会变,规则留下。
为什么这是真实情况,而不是预测
这不是 2030 年预测。截至 2026 年:
- AI agent 已经能使用 4 个开放支付标准(ACP、AP2、x402、MPP)自主付款。
- 一些只有个位数人类员工的公司,已经报告接近或达到每年 10 亿美元收入,背后劳动力几乎完全由 AI 运营。
- 美国历史上第一次,用于建造 AI worker 工作场所(数据中心)的钱,超过用于建造人类工作场所(办公室)的钱。
- Cursor 自家产品中 35% 的代码变更由 AI agent 自主完成,人类只设定问题并审查结果。
这对你意味着什么
- 如果你是开发者,你会从 coder 被提升为结果设计师。你不再写每一行代码,而是指挥 AI worker 构建完整产品。
- 如果你经营业务,你会从购买工具转向雇用劳动力。定价单位从“每个席位”转向“每个结果”。
- 如果你还在学习,最有价值的技能不再是打字快,而是写清晰 spec、选择正确记录系统,并验证质量。
记住 5 个部分
如果你只记住本文的一点,就记住 AI-Native Company 的这 5 个部分:
- 人类决定应该发生什么。
- 个人 agent(delegate)代表人类并承载权限。
- 管理层把工作分配给 AI worker 并控制预算。
- AI worker执行实际工作,每一个都像一个岗位。
- 记录系统存放真相,也就是公司真正知道什么。
本书其余内容都是这 5 个部分之上的细节。如果你读着读着迷路,就回到这个列表。
下一步读哪里
如果这个总结说得通,你想读更深入内容,可以按下面走:
- 第 1 节:大图景,什么是 AI-Native Company,它卖什么
- 第 5 节:本书反复使用的 4 个词
- 第 9 节:生产引擎如何工作,这是架构核心
- 第 13 节:双层模型
- 第 15 节:7 条规则的细节
- 第 17 节:一个完整例子,用 5 步构建支持工单 AI worker
这 6 节就是 30 分钟路径。也可以按顺序读完整篇,每个想法都会建立在上一个之上。
这就是完整论纲。后面的内容只是更慢地讲同一件事。
术语速览
下面是本书最重要的词。每个词第一次正式出现时还会再解释。如果后面读着读着迷路,就回到这里。
- AI Worker(或 Digital FTE):为执行一个具体岗位而构建的 AI 系统,例如客户支持代表或财务分析师。FTE 指 Full-Time Employee。
- AI-Native Company:大多数 worker 是 AI,而不是人的公司。也叫 Agentic Enterprise。
- Agent Factory:构建 AI-Native Company 的方法。不是产品,而是一种工作方式。
- Delegate:你的个人 AI agent。它了解你并替你行动。也叫 identic AI 或 personal agent。
- System of Record:公司的官方记忆,保存真相:客户、订单、资金、合同。AI worker 从中读取并写回。
- MCP:AI 的通用连接器,全称 Model Context Protocol。像 AI 版 USB,让任何 AI worker 通过同一个标准连接任何工具或数据源。
- Spec:清楚写下来的指令,告诉 AI worker 要做什么。不是随意聊天,而是认真写好的计划。
- Skill:一个小型、可移植的软件包,教 AI worker 把一件具体事情做好。
- Invariant:不改变的规则。设计中的结构性要求。
- Reference Implementation:今天用来遵守某条规则的具体产品。明天可以替换,不会破坏规则。
- Engagement:人类与通用 AI agent 共同工作的单次会话。两种模式:问题解决(现在解决一件事,会话结束)和 制造(为公司构建一个永久 AI worker)。
📚 教学辅助
这个论纲也有幻灯片版本。 有些读者更适合从幻灯片学习,而不是长文。相同思想,配有视觉材料:在 Google Slides 查看完整演示
1. 一种新公司正在诞生
先想想今天科技公司如何赚钱。
Microsoft 卖给你 Word。Salesforce 卖给你跟踪客户的工具。Zoom 卖给你视频通话。你每个月付费,登录进去,自己做工作。软件是一个_工具_。它有用,但只有在人类按按钮时才有用。
这种销售软件的方式叫 SaaS,全称 Software-as-a-Service。你不拥有软件,只是租用它。过去 20 年,SaaS 一直是科技行业的主要商业模式。
这个模式不再是唯一模式。一个新模式正在旁边兴起。
在 AI 时代,最有价值的公司不会卖给你工具。它们会构建 AI worker,然后把这些 worker 租给你。
慢慢解释。
AI worker 是为执行一个具体岗位而构建的 AI 系统,做的是人类员工会做的那类工作。例如:
- 一个处理客户支持的 AI worker:读取问题、检查客户账户、写回复,并把复杂问题交给人类。
- 一个做记账的 AI worker:分类支出、核对账户、准备月度报告。
- 一个做销售、法律合同审查或数据分析的 AI worker。
每一个都是岗位形状的 AI。它接受指令,使用工具,完成工作。
本书也把这些 AI worker 叫作 Digital FTE。FTE 是 Full-Time Employee,也就是公司统计正式员工的方式。一个 FTE 表示一份全职工作。所以 Digital FTE 就是“由软件而不是人构成的一名全职员工”,可以 24/7 工作,承担完整角色,而不只是帮你做一个任务。
围绕这些 AI worker 构建的公司叫 AI-Native Company。在这种公司里,大多数 worker 不是人,而是 AI。公司销售的是它的 AI worker 生产的东西:软件、决策、服务、建议、交易,或任何完成的工作。
最大的变化是:
你不是从这些公司购买产品。你雇用它们的 AI 劳动力为你完成工作。 这就像今天企业会雇用会计师事务所结账,或雇用律师团队起草合同。你付费买的不是工具,而是完成的工作。
更进一步,AI worker 很快会成为独立经济参与者。这意味着它们会:
- 自主购买服务。
- 支付所需算力。
- 购买所需数据。
- 付费请其他 AI worker 帮忙。
这些都不需要人类批准每一笔小支出。
这比一种新软件更大。这是一种新公司。
本书讲的就是如何构建它。
Agent Factory 是构建这类公司的方法。它是一套规则、一种设计和一种纪律。你用它设计 AI worker、让它们工作,并围绕它们运营业务。Factory 这个词很重要。真正的工厂用清晰、可重复的方法制造汽车或手机。Agent Factory 用清晰、可重复的方法制造 AI worker。它不是你可以买的产品,而是你学习并使用的一种工作方式。

完整图景分 5 个阶段:(1) 人类设定方向,包括目标、预算和规则。(2) Agent Factory 构建 AI worker。(3) worker 进入不同部门,例如支持、财务、销售。(4) 它们共同运行 AI-Native Company。(5) 公司向客户交付完成的结果。
2. AI 已经可以付款
当我们说 AI worker 会成为“独立经济参与者”时,听起来像科幻。其实不是。让 AI agent 付款的基础系统,在 2026 年已经开始工作。
下面是 4 个为 AI agent 买卖而构建的支付系统。你不需要记住名字。重点是:这件事今天已经真实存在。
- ACP:由 OpenAI(ChatGPT 背后的公司)和 Stripe(大型在线支付公司)构建。当 ChatGPT 在聊天中替你购买某个商品时,ACP 处理支付。
- AP2:Google 的版本。60 多家公司支持它。它像一张数字授权书。人类签下一张授权书,说明“这个 AI agent 本月最多可以在云服务上花 $500”。agent 付款时携带这张授权书。授权书有强数字签名,无法伪造。
- x402:围绕加密货币构建的支付标准,最早由 Coinbase 推出。2026 年初,Stripe 把它接入常规支付系统,让 crypto 支付和银行卡支付可以使用同一个 agent 支付系统。
- MPP:为极小额、重复支付构建。想象一个 AI agent 流式使用服务,每秒支付几分钱。普通信用卡手续费会吞掉这类付款。MPP 让这种微支付成为可能。
管道已经铺好。它改变的是工作本身的形状。
3. 从工具转向结果
SaaS 卖订阅。你每个月为访问权付费。不管你把工具用得好还是坏,卖方都拿到同样的钱。卖方给你访问权,你自己做工作。
Agent Factory 时代卖的是_结果_。人类说出想要什么。AI agent 完成工作。人类检查结果是否正确。
中间那步,也就是打字、点击、连接系统、执行工作,会被 AI 吸收。留给人类的是机器无法替我们做的部分:知道自己想要什么,以及知道自己是否得到了它。
3 件事留在人类手中:
- 意图:知道你想要什么,并清楚表达。
- 验证:检查 AI 的工作是否好、是否正确。
- 结果所有权:成为对结果负责的人。
你不能把这 3 件事交给 AI。判断、价值、“足够好”的标准,都必须来自人。AI 负责中间部分。
4. 你的个人 AI 助手
问题来了。如果一家公司有许多 AI worker 做许多事情,没有一个人能手动指导所有 worker。你不可能整天给每个 worker 写指令。那你如何保持掌控?
答案是:你拥有自己的个人 AI agent,一个了解_你_的 agent,并通过它指挥劳动力。
这个个人 AI agent 有不同名字。我们称它为 delegate。有些人叫它 personal agent。商业思想家 Don Tapscott 称它为 identic AI。identic 意味着“携带身份”。这个 agent 携带的是_你的_身份。它理解你的判断、偏好,以及你作出决定的权限。它不是任何人都能用的通用助手,而是你的代表。它替你说话,做出符合你价值观的选择,并把工作交给正确的 AI worker。
可以把它看作与你并行运行的第二个自己。它知道你会说什么、在乎什么、会批准什么。当小事出现时,例如例行回复、日程选择、普通的是或否,它按你的方式处理。真正需要你时,它会停下来问。它不是你的老板;在你忙别的事时,它轻量地代表你。
所以图景是:
- Agent Factory 构建公司的 AI 劳动力。
- identic AI(你的个人 agent)是每个人控制这支劳动力的方式。
你设定方向。你的个人 agent 把方向转成具体指令。AI 劳动力完成工作。你检查结果。
5. 你需要知道的词
继续之前,先锁定 4 个重要词。它们听起来相似,但意思不同。混淆它们是最常见的困惑来源。
Agent Factory 是方法。它是一种谨慎设计、构建和使用 AI worker 的方式。Agent Factory 是你学习使用的东西。它不是你购买的产品,而是你采用的一种实践,就像采用一种新的厨房运行方式或团队运行方式。
AI-Native Company 是产物。它是 Agent Factory 产出的正在运行的公司。它的大多数员工是 AI worker。管理层把它们组织起来。人类在顶部和边缘指挥一切。AI-Native Company 是你最终运营的东西。本书也把它叫作 Agentic Enterprise。
AI Worker 是劳动力。它们是 AI-Native Company 内部基于角色的 AI agent。它们被招聘、分配工作、保留在团队里,并在角色结束时退休。我们也叫它们 Digital FTE 或 Digital Worker。它们是公司的实际劳动。
记录系统 是基础。它是公司的官方记忆,保存真相:客户记录、资金记录、库存数量、合同、支持工单,以及业务的所有真实事实。AI worker 从这里读取,也写回这里。没有它,AI worker 只是在说话,工作没有地方落地。
合起来说:Factory 构建 Company。Company 雇用 Worker。Worker 依托记录系统工作。
还有一对词要在这里介绍,因为后面会反复使用。
Engagement 是人类与通用 AI agent 共同工作的单次会话。它有两类:
- 问题解决 engagement:你坐下来和 AI agent 解决一个问题,拿到答案。例如开发者用 AI coding helper 修复 bug。会话开始,工作完成,会话结束。
- 制造 engagement:你坐下来和 AI agent 构建新的 AI worker。这个新 worker 会在会话结束后继续工作。例如构建一个每天运行、回答工单的客户支持 AI。
同样的工具,不同的目标。后面我们会回到这个区别。
6. 不变的规则和会变化的工具
接下来我们会描述 AI-Native Company 的设计。你会看到两类陈述。它们看起来相似,但含义完全不同。
不变量 是必须始终成立的结构性规则。可以把它想成建筑规则:“每栋建筑都必须有坚固的墙来支撑屋顶。” 这个规则不规定墙用什么材料。砖、混凝土、钢,都可以。但必须有东西支撑屋顶。
参考实现 是我们现在用来遵守那条规则的具体产品。它是今天的最佳选择。明年可能出现更好的选择。到那时,你替换产品,系统其余部分继续工作,因为系统围绕规则构建,而不是围绕产品构建。
本书命名产品时,例如“我们用 OpenClaw 作为 personal agent”,产品只是参考实现。规则是“每个人都需要 personal agent”。OpenClaw 是遵守这条规则的一种方式。明年可能有更好的 personal agent。你可以换掉它,而不破坏其他部分。
这一点非常重要。技术变化很快。今天使用的产品,两年后可能不存在。但规则变化慢得多。家具会换,建筑还在。
阅读本书时记住一个简单原则:不要死记产品名。记住每个产品承担的工作。 工作会留下,产品会变化。
7. 旧世界 vs 新世界
下面是过去如何运作,以及 Agent Factory 时代如何运作的对照。

一张图看懂变化。旧模式:你租用软件,自己做工作。新模式:你雇用 AI worker,它们把完成的结果交给你。下表给出完整拆解。
| 问题 | SaaS 时代(工具) | Agent Factory 时代(劳动力) |
|---|---|---|
| 卖的是什么? | 软件工具 | AI worker |
| 如何定价? | 月费,通常按用户或“席位” | 按交付结果 |
| 谁做工作? | 人类使用工具做 | AI 做,人类监督 |
| 谁购买工作所需资源? | 人类购买工具和服务 | AI agent 自主购买算力、数据和服务 |
| 人类的工作是什么? | 操作者,按按钮的人 | 监督者,设定方向并检查质量的人 |
| 工具如何连接? | 一对一自定义连接 | 一个叫 MCP 的通用连接器 |
| 关注点 | 工作_如何_完成 | 工作_是否_完成,并且是否正确 |
从“按席位”到“按结果”是最大的变化之一。今天,公司为每名员工每月支付 $30 使用某个工具。在新世界里,公司为结果付费:每关闭一个支持工单 $5,每个合格销售线索 $50,每次完成月结 $200。你付费的对象与你收到的东西相匹配。
8. 三层:意图、引擎、结果
Agent Factory 有 3 个高层部分:
- 意图:计划。你想做什么?目标是什么?限制是什么?预算是多少?允许什么?
- 生产引擎:把意图转成结果的系统。下一节会解释。
- 结果:完成的工作,交付给你,检查正确性,并通过反馈持续改进。
你写下意图。引擎产生结果。人类检查并改进。这就是循环。
9. 生产引擎如何工作
生产引擎是本书最重要的思想。它把你想要的东西,转成你得到的东西。你的指令和最终结果之间发生的一切,都在这个引擎里。
它不是你下载的 app,也不是安装的一块软件。它是一种_设计_。它是一个计划,加上一组规则,用来构建 AI worker 被创建、组合并投入工作的系统。
汽车工厂例子。 想象一家汽车工厂。原材料,钢材、橡胶、玻璃,从一端进入。钢材进入焊接工位,在那里被塑造成车身框架。车身进入喷漆工位,上色。再进入装配工位,安装发动机、座椅、轮胎和电子部件。最后,一辆完成的汽车离开产线,经过检查,可以上路。
Agent Factory 的工作方式相同,只是:
- 原材料是你的意图,也就是你想完成什么。
- 工位是 AI worker,每个 worker 处理工作的一部分。
- 成品是经过检查的结果,也就是真实答案,并且已经确认正确。
4 件事驱动这座工厂。
Spec 是写下来的指令。它告诉 AI worker 要做什么:目标、限制、成功标准。spec 不是随意聊天消息,而是认真写好的计划,就像项目经理为人类团队写的计划。写好 spec 的技能叫 spec-driven development。
Skill 是每个 AI worker 带到岗位上的能力。skill 是小型、可移植的软件包,教 AI worker 把一件具体事情做好。例如“如何写专业邮件”或“如何阅读销售合同”。Skill 遵循开放的 Agent Skills 格式。Anthropic 创建了这个标准,现在整个行业都在采用。因为 skill 遵循共享格式,你可以把它们从一个 AI 系统移动到另一个 AI 系统,就像 USB 盘可以插进任何电脑。
反馈循环 是系统学习的方式。每次结果交付后,都要审查结果。学到的东西反馈回系统。错误被修复,好模式被保留。工厂会随着时间变得更好。
MCP 是通用连接器。MCP 全称 Model Context Protocol。理解 MCP 最简单的方式:把它看成 AI 版 USB。USB 之前,每个设备都有自己的特殊线缆。打印机一种,鼠标一种,相机又一种,一团乱。USB 解决了这个问题。现在设备使用同一个连接标准。MCP 对 AI 做同样的事。它让任何 AI worker 通过一个共享标准连接任何工具或数据源。没有 MCP,每个 AI worker 都需要为每个工具做自定义连接。有了 MCP,任何获得权限的 AI worker 都能访问重要数据存储。
合起来:Skill 给 AI worker 能力。MCP 给它们连接。这两个开放标准构成工厂地板。
所有东西之下,是前面提到的记录系统,也就是公司的官方记忆。AI worker 的每个动作,都从这份记忆读取或写回。记录系统是业务真相。

生产引擎一图概览。左侧输入意图(目标、限制、预算)。它流经 spec,再流经 skill 和 MCP,然后进入 AI worker。右侧输出经过检查的结果。整个引擎位于记录系统之上,也就是公司的官方记忆之上。
10. 能买东西的 AI agent
前面提到过这一点。现在深入一点。这会改变经济学。
今天的 AI agent 执行任务。明天的 AI agent 会_参与市场_。变化是从“AI 作为工具”转向“AI 作为买方”。

AI worker 作为经济参与者。AI worker 可以购买算力、数据、云服务,甚至请其他 AI worker 帮忙,但只能在人的护栏内行动:预算限制、规则遵守、每个动作的审计轨迹,以及风险决策的审批门。
想象一个 AI worker 的目标是:“把客户流失率降低 15%。”(Churn 指客户离开业务的比率。)为了达成这个目标,AI worker 可能需要:
- 购买算力,训练预测哪些客户可能流失的模型。
- 向数据提供商购买更丰富的客户数据。
- 设置并支付运行解决方案的云服务。
所有这些,都在人的 supervisor 预先设定的预算和规则之内。
注意 AI worker _没有_做什么。它没有要求人类批准每一个小决定。人类设定预算和规则。在规则内,AI worker 自主行动。
这里的难题不是能力。AI 已经可以做工作。真正难的是信任:确保 AI 留在规则内。因此重点转向:
- 遵守规则:确保 agent 留在人类设定的限制内。
- 审计轨迹:完整记录 agent 的每个选择和每笔交易,之后可以检查。
- 责任归属:当事情出错时,弄清谁在法律上负责。
当 AI worker 能买东西时,AI-Native Company 的资金侧会深刻改变。公司不再只是使用人类分配给它的资源。它会_自己寻找资源_。它会寻找所需,比较选项,实时购买。公司变成一个能够照料自身需求的系统。
给构建者的启示:从第一天起,就为买卖设计你的 AI agent 和系统。Agent 需要预算,而不只是权限。它们需要结果合同,而不只是访问 key。把这件事做对的公司,会捕获下一波价值,就像从订阅转向按结果定价的公司正在捕获这一波价值。
11. 人类没有被替代,而是被提升
常见恐惧是:AI agent 会替代人。
证据显示相反。对几乎所有任务来说,人类和 AI 一起工作,都比任何一方单独工作更好。Agent Factory 不会移除人类,而是提升人类。
- 从操作者 → 到监督者。
- 从打字员 → 到编辑。
- 从 coder → 到结果设计师。

人类被提升,而不是被替代。人类上升到更高角色。AI 接管中间步骤。人类保留开头(方向)和结尾(判断与责任)。
这会改变“技术专业人士”的含义。Web 开发者或移动开发者,不只是会用某种语言写代码的人。他们是技术专家。他们理解系统,理解数据如何流动,理解应用如何互相连接,理解用户真正需要什么。在 Agent Factory 时代,这种专业能力更有价值。它不再花在逐个手写按钮上,而是花在设计、部署并监督交付完整产品的 AI worker 上。
开发者不会消失。开发者会做更多。
Steve Jobs 很多年前就找到了这种工作节奏,当时他管理的是人类。我们可以直接借用。
12. 10-80-10 工作节奏
Steve Jobs 遵循后来被称为 10-80-10 规则的方式:
- 用前 10% 的时间设定愿景。
- 让团队用中间 80% 完成工作。
- 回来用最后 10% 打磨、改进并批准。
商业教师 Dan Martell 也这样解释:10% 用于想法,80% 用于执行,10% 用于改进和整合。
Jobs 一开始并不是这样。早期他以控制每个细节闻名,甚至曾告诉团队 Macintosh 计算器的每个像素应该如何显示。后来他改变了,学会把中间 80% 交给优秀的人。Apple 成为世界上最有价值的公司之一,部分原因正是这个转变。
现在把“优秀的人”替换成“AI worker”,你就得到 Agent Factory 的工作节奏。
| 步骤 | Jobs 在 Apple | Agent Factory |
|---|---|---|
| 前 10%:意图 | Jobs 设定愿景和限制 | 人类写 spec:目标、限制、预算、规则 |
| 中间 80%:工作 | Apple 团队构建产品 | AI worker 做工作:使用工具、把工作交给其他 AI worker、交付结果 |
| 最后 10%:检查 | Jobs 打磨并说“发布” | 人类审查、改进并批准经过检查的结果 |

10-80-10 工作节奏。前 10% 是人类方向。中间 80% 是 AI worker。最后 10% 是人类检查。
2026 年初,AI coding 公司 Cursor 报告,自家产品中 35% 的变更由运行在云计算机上的 AI agent 自主完成。人类开发者通过设定问题并审查完成的工作来指导 agent,而不是逐行指导代码。Cursor CEO Michael Truell 预计,一年内大部分软件开发都会是这种形态。
10-80-10 节奏不再是预测。它是领先公司已经如何工作的测量结果。
人类检查的对象也在改变。过去开发者逐行 review 代码。现在 AI agent 会在云计算机上工作数小时,然后返回它做了什么的短视频、可点击的工作预览和易读日志。你不会再逐行读代码,而是看一段短视频或点击预览来检查工作。这很重要:人类不可能同时读 12 组代码 diff,但可以同时扫 12 个预览。这让许多 AI agent 并行工作成为可能。
这种节奏不只用于 coding。它适用于每一种专业工作。前 10%,清晰思考、设定上下文、谨慎 prompting,只属于人类。中间 80%,总结、生成、分析、格式化、起草,是 AI 接管的部分。最后 10%,判断、改进、质量控制,又只属于人类。
你不再把 80% 的时间花在执行工作上。你会把 100% 的注意力放在只有人类能做的 20% 上:开头设定方向,结尾保证质量。
13. 两层:个人与劳动力
现在可以画出未来公司的完整图景。
AI worker 是工作被完成的方式。但人类不直接和每个 AI worker 对话,那太难管理。相反,人类和自己的个人 AI agent 对话,也就是前面说的 delegate 或 identic AI。个人 agent 把人类意图转成劳动力能执行的指令。
这给出了一个双层模型:
| 层 | 包含什么 | 服务谁 | 做什么 |
|---|---|---|---|
| 边缘层 | 你的个人 AI agent(delegate) | 个人 | 把你的意图转成指令,把工作交给 AI worker,替你做选择 |
| AI 劳动力层 | 基于角色的 AI worker | 公司 | 执行任务、运行工作流、交付经过检查的结果 |

双层模型的运行方式。意图向下流动:你 → 你的个人 delegate → 劳动力协调者 → AI worker。结果向上返回给你,已经经过检查。你不手动管理每个 worker,而是通过 delegate 指挥劳动力。
两层都需要。
- 没有背后的 AI 劳动力,个人 agent 只是没有下属可指挥的聊天机器人。
- 没有边缘上的个人 agent,劳动力会闲置,等待人类逐条写指令。这正是 Agent Factory 要解决的问题。
双层模型完成了图景。公司中间有工业化劳动力,边缘有人类控制,二者之间用清晰书面 spec 作为语言。
14. 使用通用 AI agent 的两种模式
前面说过有两类 engagement。现在可以把它们放到正确位置。
通用 AI agent 是人类直接使用的强大 AI 工具。有些为工程师设计,例如 Claude Code 和 OpenCode。这些是工程师在 terminal 中使用的 AI 工具。有些为非工程师设计,例如 Claude Cowork 和 OpenWork。这些面向金融分析师、律师、营销人员、写作者等知识工作者。
人类以两种模式使用这些通用 agent。
| 模式 | 谁使用,使用什么 | 最后交付什么 | 由什么治理 |
|---|---|---|---|
| 问题解决 engagement | 工程师使用 Claude Code 或 OpenCode。领域专家使用 Claude Cowork 或 OpenWork。 | 给人类的完成结果 | 七项原则 |
| 制造 engagement | 任何人,始终使用 Claude Code 或 OpenCode | 加入劳动力的新 AI worker | 七个不变量 |

两种模式,一个核心区别。模式 1 是对话:你和 AI 交谈,拿到完成结果,会话结束。模式 2 是生产线:你用 AI 构建新的 AI worker,它会在会话结束后继续运行。一种解决今天的问题,另一种制造明天的 worker。
模式 1:问题解决。 开发者打开 Claude Code 改进软件。财务分析师打开 Claude Cowork 重建月度结账模型。会话开始,工作完成,会话结束。没有新的永久 AI worker 被构建。通用 agent 本身就是这次会话的 worker。会话结束,它也就结束。
问题解决 engagement 按受众分流。工程师使用 Claude Code 或 OpenCode,也就是面向 code、基础设施和系统工作的 terminal-native 工具。领域专家使用 Claude Cowork 或 OpenWork,也就是面向文档、电子表格、brief 和审阅的知识工作工具。模式相同,规则相同,只是界面家族不同。
这个模式由通用 agent 问题解决七项原则治理。这些原则来自数千次会话,包括成功的和失败的,覆盖 coding、合同审阅、财务模型、招聘和研究工作。同样的 7 条规则适用于 4 个工具,只是表面不同。
- Bash is the Key:让 AI 行动,而不只是说。 通用 AI agent 真正有用,是在它能真实_做事_时:运行命令、读文件、保存工作。确保 AI 能运行真实命令,不要只让它描述自己会怎么做。
- Code as Universal Interface:需要精确时使用结构。 如果需要精确结果,让 AI 输出结构化格式:表格、列表、代码块、清单、固定提纲。不要只要一段散文。结构让结果更清晰,也让错误更容易发现。
- Verification as Core Step:永远检查工作。 每个结果都需要检查。代码要跑测试。备忘录要按标准打分。可以让第二个 AI 审查第一个 AI 的工作。“看起来对”是不够的。
- Small, Reversible Decomposition:用小步,且可撤销。 把工作拆小。每一步保存后再继续。不要让 AI 连续跑一小时而没有保存点。一个大改动出错时可能抹掉数小时工作。
- Persisting State in Files:文件才是记忆。 聊天历史是暂时的,会消失。文件是持久的。任何跨会话值得记住的东西,包括决策、计划、约定、客户细节,都写入文件。
- Constraints and Safety:只给 AI 必要权限。 先从有限访问开始。先只读。先每步审批。观察 AI 的行为。只有在它能在严格限制内正确工作后,再给更多访问权。不要从第一天就给 AI 宽泛访问。
- Observability:看见 AI 做了什么。 看不见 AI 正在做什么,就无法信任它。每个动作都应可见,可以通过日志、步骤视图、短视频或可点击预览。如果看不见工作,就无法检查工作。
这些原则把强大的 AI 工具从聪明玩具变成可以交付真实工作的工具。前 5 条是日常纪律:行动、结构、验证、小步、文件作为记忆。后 2 条是让前 5 条保持安全的方式:约束和可观测性。

与通用 AI agent 进行良好会话的 7 个习惯。前 5 个是日常工作规则。后 2 个,也就是限制访问和看见发生了什么,保证工作安全。
模式 2:制造。 这是目标是_构建_某个会持续存在的东西:一个在这次会话结束后继续运行的新 AI worker。制造始终使用工程工具(Claude Code 或 OpenCode)。人类是财务分析师还是营销人员并不重要。构建 AI worker 本质上主要是 coding task。同一个开发者可以用 Claude Code 设计、构建并部署一个审查代码的 AI worker。财务分析师通常会和工程师合作,用 Claude Code 构建每个月执行月结的 AI worker。输出不是问题答案,而是以后一次又一次产生答案的 worker。这个模式由七个不变量治理,也就是任何 AI-Native Company 的设计规则。下一节会介绍。
原则指导_会话_。不变量指导_设计_。问题解决 engagement 由原则指导,因为它产出一个随着会话结束而结束的结果,没有持续架构需要遵守。制造 engagement 由不变量指导,因为它的输出必须进入一支跨会话、跨 agent、跨产品周期都能保持一致的劳动力。
两种模式都适用 10-80-10 节奏。不管你是用 AI 解决自己的问题,还是构建一个以后替你解决问题的 worker,你的时间仍然分成意图、工作和检查。
15. 七条不会改变的规则(七个不变量)
现在进入本书核心:任何 AI-Native Company 都必须遵守的 7 条设计规则,不管用什么产品来实现。
记住区别。不变量 是必须始终成立的规则。参考实现 是 2026 年用来遵守该规则的产品。规则是主旨,产品只是一个选择。
先命名参与者。在 AI-Native Company 中:
- 你 是领导者和所有者。你设定方向。
- delegate 是你的个人助手,也就是那个了解你的上下文并替你发声的 AI agent。
- 管理层 是公司的操作系统。它招聘 AI worker、分配工作、控制预算、决定每个 worker 可以做什么、保存记录,并在角色结束时让 worker 退休。
- AI worker 是交付结果的员工。
- runtime engine 是每个 worker 实际运行其工作的机器。不同 worker 可以根据岗位运行在不同 engine 上。
- 神经系统 在 worker 之间传递消息,让公司在崩溃后继续运行,并控制流量,使劳动力在高负载下仍然工作。
下面每条规则都描述这家公司如何运行。每个具名产品都只是可替换的一个选择。
规则 1:人类是 principal
规则。 公司中的每个行动都从人类开始。人类是 principal,即设定目标、给出预算、划定 AI 可做什么的边界,并拥有结果的人。没有例外。这一层永远不交给 AI。
为什么必须存在。 方向不会自己出现。判断、价值、花钱的权利和对结果的责任,都不能交给机器。一个没有人类负责的系统不是_独立_,而是_无主_。无主系统会产生没人能负责的结果。
没有它会出什么问题。 没有人负责。没有一个人的价值被系统遵循。预算没有主人。结果没有裁判。
今天如何实现。 通过书面 spec、审批点、声明预算和检查步骤。任何能捕捉人类意图、权限和责任,并把它们传递给下游系统的方法,都符合这条规则。
规则 2:每个人都需要一个 delegate
规则。 人类不能手动指挥几十个 AI worker。每个人都需要一个个人 AI agent。这个 agent 持有他们的上下文,替他们发声,承载他们的权限,并把工作交给正确位置。
为什么必须存在。 一个人不能同时指挥 20 个 AI worker。时间不够,而且人类打字比 AI 工作慢得多。没有 delegate,人类会被迫回到手工发指令,也就是 Agent Factory 要消除的失败模式。
没有它会出什么问题。 人类成为最慢点。AI 劳动力等待指令。整个系统降到人类打字速度。
今天如何实现。 本书使用 OpenClaw 作为 personal agent。任何能持有你的身份、上下文和权限,并把工作传给管理层的 personal agent,都符合这条规则。
规则 3:劳动力需要管理层
规则。 一群 AI worker 不是一家公司。劳动力需要一个协调层。这个层是公司的操作系统。它招聘 worker、分配工作、控制预算、审批风险选择、决定每个 worker 允许做什么、记录谁以什么成本做了什么,并在角色结束时让 worker 退休。
为什么必须存在。 协调、责任和成本控制不会自动出现。需要一个层知道谁在做什么、成本是多少、什么被允许、产出了什么,以及出错时发生了什么。AI worker 只有在单一层把它们变成可见单元,也就是能力、成本、速度和结果的单元时,才会作为劳动力变得可控。它们也只有在同一个层能按需关闭它们时,才会保持经济性。
没有它会出什么问题。 worker 重复做同一件事。预算泄漏。记录碎裂。财务回答不了劳动力花了多少钱。运营回答不了劳动力产出了什么。退休 worker 继续运行,因为没人负责停掉它们。
今天如何实现。 本书使用 Paperclip 作为管理层。它被构建为 AI-Native Company 的操作系统。任何能在正确权限下招聘、分配、治理、观察和退休 worker 的系统,都符合这条规则。
规则 4:每个 worker 选择自己的 engine
规则。 每个 AI worker 都必须运行在某种 engine 上,也就是实际运行工作的软件。engine 按 worker 选择,而不是按 公司 统一选择。不同 worker 可以使用不同 engine,匹配各自岗位真正需要的东西。
为什么必须存在。 有些工作很重要,不能静默失败或丢数据。这类工作需要强可靠 engine。其他工作是例行工作,可以承受小失败,可以使用更便宜、更轻的 engine。强迫所有 worker 使用一个 engine,意味着你要么为不需要的可靠性多付钱,要么为需要可靠性的工作付得不够。两者都不好。
没有它会出什么问题。 一个 engine 意味着一组取舍。公司要么负担不起可靠 worker,要么无法信任便宜 worker。
今天如何实现。 我们根据岗位使用多个 engine:Dapr Agents、Claude Managed Agents、OpenAI Agents SDK、Cursor SDK 和 OpenClaw-native。现在不必记住名字。重要的是规则:让 engine 适合岗位。
规则 5:每个 worker 都依托记录系统运行
规则。 engine 是 worker 运行_在其上_的东西;记录系统是 worker 运行_所依托_的东西。每个 AI worker 都从官方记忆存储读取并写回。这里保存公司的持久记录:客户、订单、库存、合同、资金条目、支持工单和业务真实事实。
为什么必须存在。 AI 的短期记忆,也就是 context window,是暂时的,会在会话结束后消失。记录系统是永久的。没有官方真相存储,AI agent 会开始编造事实、重复保存同一笔交易、在会话之间丢失工作,并产生没人能事后检查的结果。记录系统把真实工作和听起来很自信的编造回答分开。它还让劳动力可在事后阅读:worker 的每个动作都会在会话结束后仍然存在的系统里留下记录。
没有它会出什么问题。 结果漂离现实。两个 worker 因为短期记忆不同,向同一客户说出不同答案。责任无法追踪。公司变成一个制造自信输出、但底下没有真实基础的机器。
今天如何实现。 公司的现有数据库和运营系统充当记录系统,例如 CRM、ERP、支持工单系统、数据仓库、财务总账。前面提到的 MCP 是 AI worker 访问它们的方式。任何持久、可访问、受治理,并能让劳动力读写的存储,都符合这条规则。
规则 6:劳动力能在规则内自行增长
规则。 管理层必须能够_自动招聘新的 AI worker_。当出现缺口时,例如客户使用当前 worker 不会的语言,或者出现当前 worker 做不了的新工作,获得授权的 agent 应该能够为新 worker 写 spec、设置环境、注册到管理层,并投入工作。所有这些都在人的规则内完成。
为什么必须存在。 固定 worker 列表无法跟上变化的问题。如果每个新缺口都需要人类手动构建新 worker,系统会慢下来。劳动力必须能自行增长,但始终在人的限制内,而不是越界。
没有它会出什么问题。 worker 列表被冻结。每种新问题都需要人类。公司只能按人类手动构建新 worker 的速度增长。
今天如何实现。 我们使用 Claude Managed Agents 做这件事。任何能在运行时创建新 AI worker 并设置其环境,同时留在人类规则内的系统,都符合这条规则。
规则 7:劳动力运行在神经系统上
规则。 工作会自己到达。它在 worker 之间流动,不需要人类路由每一步。预定时间到了。客户填写网页表单,一个小消息发出。一个 worker 完成任务,把它交给下一个 worker。这些都由一个单一_事件系统_承载,就像公司的神经系统。它在有事要做时唤醒 worker,在工作中途崩溃时保留进度,并控制流量,避免一个忙碌客户阻塞所有其他客户。
为什么必须存在。 劳动力要在没有人类每步介入的情况下运行,必须满足 4 件事:
- 外部触发。 系统必须能自行醒来,例如预定时间到了、webhook 触发了,或客户发送请求。
- 内部交接。 worker 必须能把工作交给其他 worker,而不需要人类路由每次交接。
- 耐久性。 多步骤工作必须能在中途崩溃后继续。原因是每一步都有小概率失败。当 6 步串在一起时,小概率会相乘。如果每步成功率是 95%,连续 6 步的成功率只有 95% × 95% × 95% × 95% × 95% × 95% ≈ 74%。这意味着每 4 次运行就有 1 次会静默失败。有了正确耐久性,系统记住已完成部分,只重试失败部分,同一个任务完成率约为 99.7%。这就是能交付的劳动力和每 4 次丢 1 次任务的 demo 之间的差别。
- 流量控制。 如果一个客户突然发送 1000 个请求,系统必须处理这个峰值,而不让其他客户永远等待。
没有它会出什么问题。 没有外部触发,系统只有在人类 prompt 时才动,经济性退回聊天机器人。没有内部交接,worker 无法在无人类中介的情况下协调。没有耐久性,多步运行的可靠性会越跑越差。没有流量控制,一个忙碌客户会阻塞所有其他客户。
今天如何实现。 我们使用 Inngest 作为神经系统,一个同时承载这 4 个特性的系统。Day AI,一家构建 AI-native CRM 的真实公司,正是这样描述自己的 Inngest 层。创始工程师 Erik Munson 称其为产品的“神经系统”。这来自真实市场中的真实构建者,不是教科书措辞。
16. 一张图看完整设计
下面用一张表展示 7 条规则。
| 规则 | 需要什么 | 2026 年我们使用什么 | 什么可以替代它 |
|---|---|---|---|
| Principal | 设定意图、预算、权限和责任的人类 | — | — |
| Delegate | 持有你上下文和权限的个人 agent | OpenClaw | 任何能说 MCP 的 personal agent |
| 管理层 | 劳动力操作系统:招聘、分配、治理、观察、退休 | Paperclip | 任何满足管理合同的系统 |
| Engine | 匹配岗位的 per-worker runtime | Dapr / Claude Managed Agents / OpenAI SDK / Cursor / OpenClaw-native | 任何满足岗位可靠性需求的 runtime |
| 记录系统 | 劳动力读取和写入的官方存储 | 现有数据库、工作流、MCP 暴露的平台 | 任何持久、可访问、受治理的存储 |
| 劳动力增长 | 在规则下按需招聘新 worker 的能力 | Claude Managed Agents | 任何能在运行时创建新 agent 的系统 |
| 神经系统 | 在权限下承载事件、耐久性和流量控制 | Inngest(劳动力);Claude Code Routines(coding agent) | 任何具备耐久和流量控制的事件系统 |
7 条规则,一条链。明天可以替换中间列的任何产品,设计仍然成立,因为设计从来不是产品,而是规则。

AI-Native Company 的 7 条规则,一张图看完。这些是不会改变的规则。具体工具(OpenClaw、Paperclip、Dapr、Inngest)可以替换,规则保留。
现实中会是什么样?想象一位客户用 Bahasa Indonesia 写来一条支持消息,而当前没有任何 AI worker 会这种语言。会发生:
- 客户消息通过神经系统(Inngest)到达。
- 管理层(Paperclip)发现没有当前 worker 会这种语言,出现能力缺口。
- Paperclip 在人类设定的规则内调用自己的招聘系统(Claude Managed Agents),创建一个会 Bahasa 的新 worker。
- 新 worker 从记录系统读取客户历史,写回复,把对话保存回记录系统,并发送回复。
- 回复通过同一条链路到达客户。
- 新 worker 留在团队里,准备处理未来的 Bahasa 客户。
没有唤醒任何人类。 公司处理了新情况,在规则内扩展了自己的劳动力,服务了客户,并记录了整个事件,便于之后检查。这就是 7 条规则带来的能力。

客户使用一种新语言写来消息。劳动力发现缺口。新 worker 在人类规则内被创建。客户得到回复。新 worker 留在团队里,供下次使用。
17. 一个完整例子:用 5 步构建支持工单 AI worker
到目前为止,本书一直在讲思想。现在把它变具体。
想象你负责一家小型网店 Mehndi Mart 的客户支持。这是一家虚构的、面向全球客户销售 henna 产品的商店。你被支持工单淹没:退款请求、配送问题、产品咨询。你决定构建一个 AI worker,处理每个工单的第一轮回复。
下面是使用第 15 节七条规则和第 14 节七项原则的做法。
第 1 步:写 spec(规则 1:人类负责)
你打开 Claude Code 或 OpenCode(工程工具,见第 14 节模式 2)。你为 worker 写一个 spec。spec 只是书面计划,可能长这样:
WORKER: First-Response Support Agent for Mehndi Mart
GOAL:
- Read every incoming customer ticket
- Classify it: refund, shipping question, product question, or other
- Write a first draft reply
- Hand off to a human if the case is complex or angry
LIMITS:
- May not promise refunds above $100 without human approval
- May not commit to delivery dates not in the shipping system
- May not respond in any language the worker is not trained for
BUDGET:
- Maximum $200/month in compute costs
- Maximum 30 seconds per ticket
SUCCESS LOOKS LIKE:
- 80% of tickets get a useful first reply within 5 minutes
- Less than 5% of replies need human correction before sending
- All tickets are recorded in the support system of record
这个 spec 捕捉你的意图、预算和限制。你现在就是这个 worker 的 principal。你拥有它的结果。
第 2 步:选择记录系统(规则 5)
worker 必须从公司的官方记忆读取并写入。对于支持 worker,这意味着 3 个地方:
- 客户记录(你的 CRM,例如 HubSpot 或 Salesforce)
- 订单记录(你的电商平台,例如 Shopify)
- 支持历史(你的工单系统,例如 Zendesk 或 Freshdesk)
你通过 MCP 把这些系统连接到 AI worker。每个系统都作为 MCP server 暴露。worker 在获得权限时就能查询它们。
你决定:这个 worker 可以_读取_ 3 个系统,并_写入_工单系统。它不能写客户或订单记录,这些变更仍然需要人类。
第 3 步:附加 worker 需要的 skill
Skill 是一个小型、可移植的软件包,教 worker 把一件具体事情做好(第 9 节)。对这个支持 worker,你会附加:
- “如何写专业支持回复”:语气、结构、署名
- “如何分类支持工单”:工单类型列表,以及如何区分
- “如何阅读订单记录”:哪些字段重要,分别代表什么
- “何时升级给人类”:愤怒、法律威胁、复杂退款等触发条件
Skill 可以从 skill library 下载,也可以由你和团队编写。它们遵循开放的 Agent Skills 格式,所以能在任何 AI 系统中工作。
第 4 步:选择 engine 并设置护栏(规则 3、4、6)
你决定 worker 在哪里运行。对支持 worker 来说,可靠性重要,成本也重要,所以你选择中间级 engine。(之后可以更改。规则 4 说每个 worker 选择自己的 engine。)
然后你通过管理层设置护栏(Paperclip,或你使用的任何管理层):
- 预算上限:每月 $200,硬停止
- 审批门:超过 $100 的退款,在回复发送前需要人类确认
- 审计轨迹:worker 接触的每个工单都记录 worker 的动作、成本和耗时
- 速率限制:每分钟最多 50 个工单,避免消息洪水在 5 分钟内耗尽预算
worker 现在存在于清晰的能力边界内,知道自己能做什么、不能做什么。
第 5 步:验证并部署(规则 7 + 七项原则)
在让 worker 处理真实客户前,你先验证它。用一批历史工单运行它,例如 100 个过去工单,然后检查回复。它分类正确吗?回复专业吗?该升级的案例升级了吗?
你观察 worker 的每个动作:它打开的每个文件、运行的每一步、作出的每个决定。这就是可观测性:worker 做的事没有隐藏。你发现错误,调整 spec,重新测试。
满意后再部署。神经系统(Inngest,或你使用的任何事件系统)开始把真实工单在到达时喂给 worker。worker 处理它们。人类每天抽查一小部分。随着时间推移,你改进 spec、添加 skill,worker 会变得更好。
刚刚发生了什么
你写了 spec。你连接了记录系统。你附加了 skill。你设置了护栏。你验证并部署。你刚刚构建了一个 Digital FTE。
这个 worker 现在每周 7 天、每天 24 小时运行在你设定的规则内。当业务增长时,你不再靠雇更多人来分拣工单,而是通过收紧 spec 和添加 skill 来扩展。团队中的人类会沿价值链上移:复杂案例、客户关系、产品反馈、战略。
这就是 Agent Factory 做的事。一次构建一个 worker。
你的第一个 worker 清单
在交付任何 AI worker 前,先过一遍清单。如果每项都打勾,这个 worker 就满足七个不变量,可以部署。
- Spec 已写好:目标清楚、限制清楚、预算清楚、成功定义清楚
- Principal 已命名:有一个具体人类拥有这个 worker,并对结果负责
- 记录系统已选择:worker 知道从哪里读取公司真相,写回哪里
- MCP 连接已设置:worker 能访问需要的系统,而且只访问这些系统
- Skill 已附加:worker 需要的能力已作为可移植 skill package 加载
- Engine 已选择:runtime 匹配岗位可靠性和成本需求
- 预算上限已设置:管理层执行月度支出的硬限制
- 审计轨迹已启用:每个动作都有日志、可检查、可重放
- 审批门已设置:高风险动作发生前需要人类说“yes”
- 验证计划已准备:你知道如何检查 worker 的前 100 个输出
如果每个框都能打勾,你的 worker 就不再是聪明玩具。它是一个 Digital FTE。
18. 什么保持不变,什么会改变
下表展示了哪些部分是永久规则(左列,也就是主旨),哪些部分是今年的具体工具(右列,也就是 2026 年)。
| 稳定部分(规则,不变量) | 会改变的部分(具体工具,实现) |
|---|---|
| 拥有清晰权限的人类 principal | authoring 工具、审批界面、spec 格式 |
| 边缘上的个人 delegate | delegate 产品及其继任者 |
| 具备完整劳动力控制的管理层 | 管理层产品及其继任者 |
| per-worker engine 选择 | SDK、runtime、运行 agent 的平台 |
| 劳动力依托的官方存储 | 数据库引擎、CRM/ERP/工单产品、MCP server 列表 |
| 能在规则内增长的劳动力 | managed-agent API、设置系统 |
| 权限下的事件、耐久和流量 | scheduler、webhook 框架、durable-execution 平台 |
| 规范驱动的工作定义 | spec 语言、格式、工具 |
| 使用通用 agent 的七项操作原则 | 具体 agent 产品、命令行工具、prompt 模式 |
| 基于结果的商业模型 | 定价单位、合同格式 |
| agent 作为经济参与者 | 支付系统、责任框架 |
| 可观察、可审计运行 | tracing 系统、日志格式 |
| 层之间清晰接缝,使供应商锁定移动时不破坏设计 | 哪一层承载锁定:2024 年是 AI 模型层,2026 年是 harness 层,下一步可能是 orchestrator |
| 可按成本、速度、结果衡量的劳动力 | 财务系统、账本实现 |
| 作为可移植 skill 封装的能力 | skill 格式、registry、分发平台 |
左列是主旨。右列是 2026 年。
如果你按左列构建,公司能承受右列变化。如果你只按右列构建,却不理解左列,每两年就得重建一次。
19. 今天我们使用的具体工具
为了完整,下面列出 2026 年我们用来遵守每条规则的产品。这些是参考实现。 它们会改变,规则不会。记住:不要死记产品名。记住每个产品承担的工作。
- Delegate:OpenClaw,开源个人 AI agent
- 管理层:Paperclip,AI-native company 操作系统;它把 hire、assign、govern、observe、retire 暴露为其他系统可调用的函数
- Engine:Dapr Agents、Claude Managed Agents、OpenAI Agents SDK、Cursor SDK 和 OpenClaw-native,分别适合不同岗位画像
- Skill:来自 agentskills.io 的 Agent Skills 格式,一种封装 AI 能力的可移植文件夹格式
- 神经系统:Inngest,公司的主事件系统;Claude Code Routines,coding agent 的专门触发器
对规则 6(劳动力能自行增长),我们使用 Claude Managed Agents。同一项技术既是 engine 选项之一,也作为招聘系统,因为它能在运行时创建新 agent,正是“把招聘作为可调用函数”的基础。
现实支持。 这不只是理论。2026 年 2 月,Cursor CEO 用非常接近本书的语言描述公司从 AI coding tool 转向“agent factory”:一群 AI agent 像队友一样工作,人类定义问题并审查完成品,agent 在云计算机上并行工作,而不是被逐行指导。2026 年 5 月,The New Stack 报道同一模式已成为 Anthropic、OpenAI、Google、Microsoft 和 Cursor 之间的行业共识。
2026 年领先观点很清楚:AI 模型正在商品化。许多公司都能制造足够好的 AI 模型,一个模型可以被另一个替换。真正变得有价值的是 “harness”,也就是包裹模型、让模型能安全、可靠、规模化行动的软件。Google 一位高级领导者公开表示,公司已经不再在意开发者选择哪个 AI coding 工具。本书命名的接缝,人类、delegate、管理层、engine、记录系统和神经系统之间的接缝,正在真实生产系统中大规模形成。
这些规则不是预测,而是领先前沿已经所在位置的图像。
关于词语的小说明。 本书中,系统里的每个部分从技术上都可以称为 agent:OpenClaw 是 agent,Paperclip 是 agent,AI worker 也是 agent。但只有 AI worker 是_劳动力_,也就是被招聘、分配工作、保留在团队中并退休的部分。OpenClaw 和 Paperclip 是公司的永久部件,不是劳动力。所以当本书说 AI Worker,它指劳动力。当它说 agent,它可以指公司里的任何参与者:永久部件或劳动力。
20. 劳动力机会
AI 会把_工作拆开_成一个个任务。有些任务会完全由机器完成。但拆开工作也会创造新的组合:新角色、新业务、新市场。这些在工作被锁在固定岗位名称里时并不存在。
未来劳动力需要构建灵活技能组合,而不是依赖固定职业路径。学会与 AI 一起思考、每天使用 AI 工具,并把 AI 当成数字队友的专业人士,不只是会熬过转变,还会在转变中做得很好。
SaaS 时代为开发者、设计师和产品经理创造了数百万岗位。Agent Factory 时代会创造更多岗位:agent 设计师、结果架构师、验证专家,以及教机器理解本领域“正确”是什么的领域专家。
这也会成为历史上最大的劳动者培训机会之一。到 2030 年,World Economic Forum 估计全球每 100 名劳动者中有 59 名需要新培训,以适应新技术和新工作方式。

劳动力机会。同一个 Agent Factory 可以在每个业务职能中构建专业 AI worker:销售、财务、支持、工程、人力资源、法律。部门之间规则不变,只变角色和记录系统。
同一家工厂会在每个业务职能中制造专业 worker:
-
在 GTM(Go-To-Market,也就是把潜在买家变成付费客户的销售、营销和收入动作)中,一组 AI worker 可以处理很多任务:
- 寻找新线索。
- 发送 outreach 消息。
- 保持客户数据库干净。
- 分析销售管道。
- 编写提案。
- 定制 demo。
在 SaaS 时代由人手工完成的工作,现在被构建为 AI worker,并由人类 GTM lead 监督。
-
在财务中:月结、AR/AP(应收与应付),以及 FP&A(财务计划与分析)。
-
在客户支持中:分拣工单、解决问题、升级复杂案例。
-
在工程中:代码审查、重构、部署。
-
在人力资源中:寻找候选人、筛选、入职。
-
在法律中:合同审查、标注修改、事项 intake。
每个 AI worker 都通过 Paperclip 招聘,由对应部门的人类监督,并依托该部门的记录系统运行:销售用 CRM,财务用总账,支持用工单系统,工程用代码仓库。部门之间规则不变。只变角色定义和记录系统。
机会不是更小,而是更宽。它奖励适应的人。
21. 钱已经开始投入
如果你不确定这种变化是否真实,看钱流向哪里。
到 2026 年 1 月,美国数据中心建设达到年化 $420 亿,而办公室建设从峰值下降 35%。
历史上第一次,美国在 AI worker 工作场所(数据中心)上的建设支出,超过人类 worker 工作场所(办公室)。
数据中心以工业规模消耗铜和电。一座超大 AI 数据中心最多需要 5 万吨铜,约为普通数据中心的 10 倍。Meta、Google、Amazon 和 Microsoft 仅在 2026 年就计划在 AI 基础设施上投入超过 $6000 亿。
AI 时代的工厂不是想法。它们正在被建造。

美国建设支出。办公室建设,也就是人类 worker 的工作场所,正在下降。数据中心建设,也就是 AI worker 的工作场所,正在上升。两条线在 2025 年交叉。来源:U.S. Census Bureau, Value of Construction Put in Place Survey。
赢家不会用卖出多少软件订阅来衡量,而会用交付了多少结果来衡量。
22. 这一切指向哪里
收尾前,值得标记这份论纲已经站在哪里。AI-Native Company 不再是未来概念。到 2026 年中,只有个位数人类员工的公司,已经在 AI 运营劳动力之上报告年化 10 亿美元收入。这种公司类别在 3 年前还几乎不存在。具体公司会成功,也会失败。有些会遇到监管问题。但_类别_会留下。论纲预测了公司的形状,而公司已经到来。
这份论纲证明的是 Agent Factory 今天和近期构建的东西:软件 AI worker、组织成 AI-Native Company、在人类商业边缘工作。这是本书有资格主张的范围。
但设计会延伸得更远。有 3 个方向值得命名。
物理 AI worker。 构建软件 AI worker 的同一套工厂设计,也会延伸到_物理_ worker,也就是机器人。做仓库工作的机器人,自动配送车辆,工厂车间里的机器。每一个都可以是在同一规则下的 AI worker,通过同一管理层招聘,运行在驱动物理部件而不是软件调用的 engine 上。规则不变,只是计算机有了身体。随着物理 AI 成熟,AI-Native Company 的劳动力不会只包含数字 worker,也会包含由同一方法构建、由同一设计控制、对同一规则负责的物理 worker。
完全独立的经济 agent。 本论纲开头命名了这个方向。随着 AI worker 获得持久身份、支付系统、声誉和进入合同的法律能力,它们不再只是公司使用的工具。它们会成为自身意义上的经济参与者:从其他公司的 AI worker 购买服务,把能力卖给需要它的公司,积累资本,在没有人类批准每笔交易的情况下签订合同。Agent Factory 保持不变。变化的是被它制造出来的 worker 的独立程度。由此产生的问题,包括法律地位、责任、税收、反垄断,不是设计问题,但会变得紧迫,设计必须为它们做好准备。
AI worker 在公司之间流动。 今天,AI worker 由一家公司构建,只为这家公司工作。随着制造层成熟,AI worker 会变得_可移植_:被一家公司雇用,再转移到另一家公司,甚至同时为几家公司工作。招聘系统从公司内部扩展到公司之间。不同公司的权限规则在同一个 AI worker 上重叠,并由合同控制。AI worker 的劳动力市场会成为真实市场,有费率、声誉、专业方向和流动率。Agent Factory 交付 worker,市场负责路由。
这 3 个方向,物理 worker、完全独立、worker 流动,都是设计的_延伸_,不是偏离。
收尾
规则成立。工具变化。论纲站得住。
一种新公司正在被构建:由 AI worker 组成劳动力,由管理层协调,由人类通过个人 agent 指挥。构建它的方法是 Agent Factory。它产出的公司是 AI-Native Company。它雇用的 worker 是 Digital FTE。它们依托的真相是记录系统。它们遵守的规则是七个不变量。今天遵守这些规则的产品会改变,规则不会。
如果你刚接触这一切,这就是一段话读完整个论纲。本书其余部分,是构建它的设计、实践和工作。
注释与来源
-
Don Tapscott,HBR IdeaCast 访谈,“With Rise of Agents, We Are Entering the World of Identic AI”,Harvard Business Review,2026 年 2 月 17 日。
-
World Economic Forum,Future of Jobs Report 2025,2025 年 1 月。
-
Michael Truell,“The third era of AI software development”,Cursor Blog,2026 年 2 月 26 日。
-
Matthew Burns,“Cursor's $60 billion bet is on the harness, not the model”,The New Stack,2026 年 5 月 1 日。
-
Erik Munson,Day AI 创始工程师,引自 “Day AI – Customer Story”,Inngest,访问于 2026 年 5 月。
-
Jodie Cook,“The 2-Person $1 Billion Company Is The Real Business Goal — And How To Do It”,Forbes,2026 年 5 月 10 日。
这是 Agent Factory 论纲的初学者友好版本,使用简明中文。原始技术版本可在 agentfactory.panaversity.org 阅读。两个版本提出同一设计,并到达同一结论。这个版本使用更简单的词和更短的句子。原始版本使用行业词汇和更长句子。选择适合你当前位置的版本阅读,并在准备好时切换。