Skip to main content

Agent Factory 论纲:简明中文版本

简明中文版本

这个版本写给谁? 这个版本写给两类读者:刚接触技术和商业的人,以及英语不是第一语言的人。这里会尽量使用简单词句,句子更短,重要词汇第一次出现时都会解释。原始论纲也提供给已经熟悉这些词、想读更深入版本的读者。两个版本说的是同一件事。 它们只是走向结论的路径不同。

阅读本文的三种方式

10 分钟路径:只读下一节“从这里开始:2 页读完整个论纲”。这一节已经给出完整论证。

30 分钟路径:读第 1、5、9、13、15、17 节。你会得到核心思想和一个完整例子。

完整路径:按顺序读完每一节。大约 60 到 90 分钟。适合想要深度、证据和故事的读者。

三条路径最后都会抵达同一个地方。选择适合你时间的方式。


从这里开始:2 页读完整个论纲

如果你只有 10 分钟,就读这一节。它包含完整论证。后面的内容只是用更多例子、更慢的节奏讲同一个想法。

最大的变化

过去 20 年,科技公司把软件卖给你。你登录软件,自己做工作,每个月为访问权付费。

这个模式不再是唯一模式。一个新模式正在旁边兴起。新的公司正在被构建出来,在这些公司里,worker 是 AI,而不是工具。你不再从这些公司购买工具。你雇用它们的 AI 劳动力为你完成一项工作。

想象差别。Microsoft 卖给你 Word,你自己写文档。新模式卖给你的是写好的文档:由 AI worker 写成、经过质量检查、交付给你。你付费买的是结果,而不是工具。

先学会 3 个词

  • AI Worker(也叫 Digital FTE,意思是由软件构成的 Full-Time Employee):为执行一个具体岗位而构建的 AI,就像人类员工有岗位一样。客户支持、记账、销售,每一个都是“岗位形状”的 AI。
  • AI-Native Company:大多数 worker 都是 AI 的公司。它销售的是这些 worker 产出的东西。
  • Agent Factory:构建 AI worker,以及由这些 worker 组成的公司的方法。它不是你购买的产品,而是你学习的一种实践。

工作如何分配

人类设定方向。AI 完成工作。人类检查结果。

这就是 10-80-10 节奏

  • 10%:人类写出清晰计划,包括目标、限制和预算
  • 中间 80%:AI worker 完成实际工作
  • 最后 10%:人类检查并批准

有 3 件事始终留在人类手里,不会交给 AI:意图(知道自己想要什么)、验证(知道自己是否真的得到了它)、结果所有权(对结果负责)。

未来公司的两层

一个人无法手动管理 20 个 AI worker。所以公司会有两层:

  • 边缘层:每个人都有一个个人 AI agent,也就是 delegate,它了解这个人并代表这个人行动。
  • AI 劳动力层:专业化 AI worker 执行实际工作,由管理层协调。

你和自己的 delegate 对话。delegate 和劳动力对话。结果再回到你手里。

使用强大 AI 工具的两种方式

当你坐下来使用一个通用 AI 工具时,你实际上在做两件事之一:

  • 问题解决:你现在有一个问题,想得到一个完成的答案,然后会话结束。例如修复 bug、分析报告。
  • 制造:你正在构建一个新的 AI worker,它会在这次会话结束后继续运行。输出不是一个答案,而是一个以后不断产生答案的永久 worker。

一种模式解决今天的问题。另一种模式制造明天的 worker。

7 条不会改变的规则

任何 AI-Native Company 的架构都遵守 7 条规则:

  1. 人类负责。 每个行动都能追溯到设定方向的人。
  2. 每个人都需要一个 delegate。 一个 AI agent 代表你并替你行动。
  3. 劳动力需要管理层。 它招聘 worker、分配工作、控制预算。
  4. 每个 worker 使用正确的 engine。 重要工作用可靠 engine,例行工作用便宜 engine。
  5. 每个 worker 使用记录系统。 AI worker 从公司的官方记忆读取,也写回那里。
  6. 劳动力能在规则内增长。 出现缺口时,系统会在人的限制内招聘新 worker。
  7. 公司运行在神经系统上。 事件自动在 worker 之间流动,能承受崩溃,并控制流量。

规则不变。今天填充这些规则的具体产品(OpenClaw、Paperclip、Inngest 等)会改变,这没有问题。工具会变,规则留下。

为什么这是真实情况,而不是预测

这不是 2030 年预测。截至 2026 年:

  • AI agent 已经能使用 4 个开放支付标准(ACP、AP2、x402、MPP)自主付款。
  • 一些只有个位数人类员工的公司,已经报告接近或达到每年 10 亿美元收入,背后劳动力几乎完全由 AI 运营。
  • 美国历史上第一次,用于建造 AI worker 工作场所(数据中心)的钱,超过用于建造人类工作场所(办公室)的钱。
  • Cursor 自家产品中 35% 的代码变更由 AI agent 自主完成,人类只设定问题并审查结果。

这对你意味着什么

  • 如果你是开发者,你会从 coder 被提升为结果设计师。你不再写每一行代码,而是指挥 AI worker 构建完整产品。
  • 如果你经营业务,你会从购买工具转向雇用劳动力。定价单位从“每个席位”转向“每个结果”。
  • 如果你还在学习,最有价值的技能不再是打字快,而是写清晰 spec、选择正确记录系统,并验证质量。

记住 5 个部分

如果你只记住本文的一点,就记住 AI-Native Company 的这 5 个部分:

  1. 人类决定应该发生什么。
  2. 个人 agent(delegate)代表人类并承载权限。
  3. 管理层把工作分配给 AI worker 并控制预算。
  4. AI worker执行实际工作,每一个都像一个岗位。
  5. 记录系统存放真相,也就是公司真正知道什么。

本书其余内容都是这 5 个部分之上的细节。如果你读着读着迷路,就回到这个列表。

下一步读哪里

如果这个总结说得通,你想读更深入内容,可以按下面走:

  • 第 1 节:大图景,什么是 AI-Native Company,它卖什么
  • 第 5 节:本书反复使用的 4 个词
  • 第 9 节:生产引擎如何工作,这是架构核心
  • 第 13 节:双层模型
  • 第 15 节:7 条规则的细节
  • 第 17 节:一个完整例子,用 5 步构建支持工单 AI worker

这 6 节就是 30 分钟路径。也可以按顺序读完整篇,每个想法都会建立在上一个之上。

这就是完整论纲。后面的内容只是更慢地讲同一件事。


术语速览

下面是本书最重要的词。每个词第一次正式出现时还会再解释。如果后面读着读着迷路,就回到这里。

  • AI Worker(或 Digital FTE):为执行一个具体岗位而构建的 AI 系统,例如客户支持代表或财务分析师。FTEFull-Time Employee
  • AI-Native Company:大多数 worker 是 AI,而不是人的公司。也叫 Agentic Enterprise
  • Agent Factory:构建 AI-Native Company 的方法。不是产品,而是一种工作方式。
  • Delegate:你的个人 AI agent。它了解你并替你行动。也叫 identic AIpersonal agent
  • System of Record:公司的官方记忆,保存真相:客户、订单、资金、合同。AI worker 从中读取并写回。
  • MCP:AI 的通用连接器,全称 Model Context Protocol。像 AI 版 USB,让任何 AI worker 通过同一个标准连接任何工具或数据源。
  • Spec:清楚写下来的指令,告诉 AI worker 要做什么。不是随意聊天,而是认真写好的计划。
  • Skill:一个小型、可移植的软件包,教 AI worker 把一件具体事情做好。
  • Invariant:不改变的规则。设计中的结构性要求。
  • Reference Implementation:今天用来遵守某条规则的具体产品。明天可以替换,不会破坏规则。
  • Engagement:人类与通用 AI agent 共同工作的单次会话。两种模式:问题解决(现在解决一件事,会话结束)和 制造(为公司构建一个永久 AI worker)。

📚 教学辅助

这个论纲也有幻灯片版本。 有些读者更适合从幻灯片学习,而不是长文。相同思想,配有视觉材料:在 Google Slides 查看完整演示


1. 一种新公司正在诞生

先想想今天科技公司如何赚钱。

Microsoft 卖给你 Word。Salesforce 卖给你跟踪客户的工具。Zoom 卖给你视频通话。你每个月付费,登录进去,自己做工作。软件是一个_工具_。它有用,但只有在人类按按钮时才有用。

这种销售软件的方式叫 SaaS,全称 Software-as-a-Service。你不拥有软件,只是租用它。过去 20 年,SaaS 一直是科技行业的主要商业模式。

这个模式不再是唯一模式。一个新模式正在旁边兴起。

在 AI 时代,最有价值的公司不会卖给你工具。它们会构建 AI worker,然后把这些 worker 租给你。

慢慢解释。

AI worker 是为执行一个具体岗位而构建的 AI 系统,做的是人类员工会做的那类工作。例如:

  • 一个处理客户支持的 AI worker:读取问题、检查客户账户、写回复,并把复杂问题交给人类。
  • 一个做记账的 AI worker:分类支出、核对账户、准备月度报告。
  • 一个做销售、法律合同审查或数据分析的 AI worker。

每一个都是岗位形状的 AI。它接受指令,使用工具,完成工作。

本书也把这些 AI worker 叫作 Digital FTEFTEFull-Time Employee,也就是公司统计正式员工的方式。一个 FTE 表示一份全职工作。所以 Digital FTE 就是“由软件而不是人构成的一名全职员工”,可以 24/7 工作,承担完整角色,而不只是帮你做一个任务。

围绕这些 AI worker 构建的公司叫 AI-Native Company。在这种公司里,大多数 worker 不是人,而是 AI。公司销售的是它的 AI worker 生产的东西:软件、决策、服务、建议、交易,或任何完成的工作。

最大的变化是:

你不是从这些公司购买产品。你雇用它们的 AI 劳动力为你完成工作。 这就像今天企业会雇用会计师事务所结账,或雇用律师团队起草合同。你付费买的不是工具,而是完成的工作。

更进一步,AI worker 很快会成为独立经济参与者。这意味着它们会:

  • 自主购买服务。
  • 支付所需算力。
  • 购买所需数据。
  • 付费请其他 AI worker 帮忙。

这些都不需要人类批准每一笔小支出。

这比一种新软件更大。这是一种新公司。

本书讲的就是如何构建它。

Agent Factory 是构建这类公司的方法。它是一套规则、一种设计和一种纪律。你用它设计 AI worker、让它们工作,并围绕它们运营业务。Factory 这个词很重要。真正的工厂用清晰、可重复的方法制造汽车或手机。Agent Factory 用清晰、可重复的方法制造 AI worker。它不是你可以买的产品,而是你学习并使用的一种工作方式。

Agent Factory 一图概览:人类设定方向,Agent Factory 构建 AI worker,这些 worker 在支持、财务、销售等职能中组成 AI-Native Company,并向客户交付结果。

完整图景分 5 个阶段:(1) 人类设定方向,包括目标、预算和规则。(2) Agent Factory 构建 AI worker。(3) worker 进入不同部门,例如支持、财务、销售。(4) 它们共同运行 AI-Native Company。(5) 公司向客户交付完成的结果。


2. AI 已经可以付款

当我们说 AI worker 会成为“独立经济参与者”时,听起来像科幻。其实不是。让 AI agent 付款的基础系统,在 2026 年已经开始工作。

下面是 4 个为 AI agent 买卖而构建的支付系统。你不需要记住名字。重点是:这件事今天已经真实存在。

  • ACP:由 OpenAI(ChatGPT 背后的公司)和 Stripe(大型在线支付公司)构建。当 ChatGPT 在聊天中替你购买某个商品时,ACP 处理支付。
  • AP2:Google 的版本。60 多家公司支持它。它像一张数字授权书。人类签下一张授权书,说明“这个 AI agent 本月最多可以在云服务上花 $500”。agent 付款时携带这张授权书。授权书有强数字签名,无法伪造。
  • x402:围绕加密货币构建的支付标准,最早由 Coinbase 推出。2026 年初,Stripe 把它接入常规支付系统,让 crypto 支付和银行卡支付可以使用同一个 agent 支付系统。
  • MPP:为极小额、重复支付构建。想象一个 AI agent 流式使用服务,每秒支付几分钱。普通信用卡手续费会吞掉这类付款。MPP 让这种微支付成为可能。

管道已经铺好。它改变的是工作本身的形状。


3. 从工具转向结果

SaaS 卖订阅。你每个月为访问权付费。不管你把工具用得好还是坏,卖方都拿到同样的钱。卖方给你访问权,你自己做工作。

Agent Factory 时代卖的是_结果_。人类说出想要什么。AI agent 完成工作。人类检查结果是否正确。

中间那步,也就是打字、点击、连接系统、执行工作,会被 AI 吸收。留给人类的是机器无法替我们做的部分:知道自己想要什么,以及知道自己是否得到了它。

3 件事留在人类手中:

  • 意图:知道你想要什么,并清楚表达。
  • 验证:检查 AI 的工作是否好、是否正确。
  • 结果所有权:成为对结果负责的人。

你不能把这 3 件事交给 AI。判断、价值、“足够好”的标准,都必须来自人。AI 负责中间部分。


4. 你的个人 AI 助手

问题来了。如果一家公司有许多 AI worker 做许多事情,没有一个人能手动指导所有 worker。你不可能整天给每个 worker 写指令。那你如何保持掌控?

答案是:你拥有自己的个人 AI agent,一个了解_你_的 agent,并通过它指挥劳动力。

这个个人 AI agent 有不同名字。我们称它为 delegate。有些人叫它 personal agent。商业思想家 Don Tapscott 称它为 identic AIidentic 意味着“携带身份”。这个 agent 携带的是_你的_身份。它理解你的判断、偏好,以及你作出决定的权限。它不是任何人都能用的通用助手,而是你的代表。它替你说话,做出符合你价值观的选择,并把工作交给正确的 AI worker。

可以把它看作与你并行运行的第二个自己。它知道你会说什么、在乎什么、会批准什么。当小事出现时,例如例行回复、日程选择、普通的是或否,它按你的方式处理。真正需要你时,它会停下来问。它不是你的老板;在你忙别的事时,它轻量地代表你。

所以图景是:

  • Agent Factory 构建公司的 AI 劳动力
  • identic AI(你的个人 agent)是每个人控制这支劳动力的方式

你设定方向。你的个人 agent 把方向转成具体指令。AI 劳动力完成工作。你检查结果。


5. 你需要知道的词

继续之前,先锁定 4 个重要词。它们听起来相似,但意思不同。混淆它们是最常见的困惑来源。

Agent Factory方法。它是一种谨慎设计、构建和使用 AI worker 的方式。Agent Factory 是你学习使用的东西。它不是你购买的产品,而是你采用的一种实践,就像采用一种新的厨房运行方式或团队运行方式。

AI-Native Company产物。它是 Agent Factory 产出的正在运行的公司。它的大多数员工是 AI worker。管理层把它们组织起来。人类在顶部和边缘指挥一切。AI-Native Company 是你最终运营的东西。本书也把它叫作 Agentic Enterprise

AI Worker劳动力。它们是 AI-Native Company 内部基于角色的 AI agent。它们被招聘、分配工作、保留在团队里,并在角色结束时退休。我们也叫它们 Digital FTEDigital Worker。它们是公司的实际劳动。

记录系统基础。它是公司的官方记忆,保存真相:客户记录、资金记录、库存数量、合同、支持工单,以及业务的所有真实事实。AI worker 从这里读取,也写回这里。没有它,AI worker 只是在说话,工作没有地方落地。

合起来说:Factory 构建 Company。Company 雇用 Worker。Worker 依托记录系统工作。

还有一对词要在这里介绍,因为后面会反复使用。

Engagement 是人类与通用 AI agent 共同工作的单次会话。它有两类:

  • 问题解决 engagement:你坐下来和 AI agent 解决一个问题,拿到答案。例如开发者用 AI coding helper 修复 bug。会话开始,工作完成,会话结束。
  • 制造 engagement:你坐下来和 AI agent 构建新的 AI worker。这个新 worker 会在会话结束后继续工作。例如构建一个每天运行、回答工单的客户支持 AI。

同样的工具,不同的目标。后面我们会回到这个区别。


6. 不变的规则和会变化的工具

接下来我们会描述 AI-Native Company 的设计。你会看到两类陈述。它们看起来相似,但含义完全不同。

不变量 是必须始终成立的结构性规则。可以把它想成建筑规则:“每栋建筑都必须有坚固的墙来支撑屋顶。” 这个规则不规定墙用什么材料。砖、混凝土、钢,都可以。但必须有东西支撑屋顶。

参考实现 是我们现在用来遵守那条规则的具体产品。它是今天的最佳选择。明年可能出现更好的选择。到那时,你替换产品,系统其余部分继续工作,因为系统围绕规则构建,而不是围绕产品构建。

本书命名产品时,例如“我们用 OpenClaw 作为 personal agent”,产品只是参考实现。规则是“每个人都需要 personal agent”。OpenClaw 是遵守这条规则的一种方式。明年可能有更好的 personal agent。你可以换掉它,而不破坏其他部分。

这一点非常重要。技术变化很快。今天使用的产品,两年后可能不存在。但规则变化慢得多。家具会换,建筑还在。

阅读本书时记住一个简单原则:不要死记产品名。记住每个产品承担的工作。 工作会留下,产品会变化。


7. 旧世界 vs 新世界

下面是过去如何运作,以及 Agent Factory 时代如何运作的对照。

从工具到结果:SaaS 时代和 Agent Factory 时代的并排比较。旧模式按月租给你软件访问权,你自己做工作;新模式卖给你由 AI worker 交付的完成结果。

一张图看懂变化。旧模式:你租用软件,自己做工作。新模式:你雇用 AI worker,它们把完成的结果交给你。下表给出完整拆解。

问题SaaS 时代(工具)Agent Factory 时代(劳动力)
卖的是什么?软件工具AI worker
如何定价?月费,通常按用户或“席位”按交付结果
谁做工作?人类使用工具做AI 做,人类监督
谁购买工作所需资源?人类购买工具和服务AI agent 自主购买算力、数据和服务
人类的工作是什么?操作者,按按钮的人监督者,设定方向并检查质量的人
工具如何连接?一对一自定义连接一个叫 MCP 的通用连接器
关注点工作_如何_完成工作_是否_完成,并且是否正确

从“按席位”到“按结果”是最大的变化之一。今天,公司为每名员工每月支付 $30 使用某个工具。在新世界里,公司为结果付费:每关闭一个支持工单 $5,每个合格销售线索 $50,每次完成月结 $200。你付费的对象与你收到的东西相匹配。


8. 三层:意图、引擎、结果

Agent Factory 有 3 个高层部分:

  • 意图:计划。你想做什么?目标是什么?限制是什么?预算是多少?允许什么?
  • 生产引擎:把意图转成结果的系统。下一节会解释。
  • 结果:完成的工作,交付给你,检查正确性,并通过反馈持续改进。

你写下意图。引擎产生结果。人类检查并改进。这就是循环。


9. 生产引擎如何工作

生产引擎是本书最重要的思想。它把你想要的东西,转成你得到的东西。你的指令和最终结果之间发生的一切,都在这个引擎里。

它不是你下载的 app,也不是安装的一块软件。它是一种_设计_。它是一个计划,加上一组规则,用来构建 AI worker 被创建、组合并投入工作的系统。

汽车工厂例子。 想象一家汽车工厂。原材料,钢材、橡胶、玻璃,从一端进入。钢材进入焊接工位,在那里被塑造成车身框架。车身进入喷漆工位,上色。再进入装配工位,安装发动机、座椅、轮胎和电子部件。最后,一辆完成的汽车离开产线,经过检查,可以上路。

Agent Factory 的工作方式相同,只是:

  • 原材料是你的意图,也就是你想完成什么。
  • 工位是 AI worker,每个 worker 处理工作的一部分。
  • 成品是经过检查的结果,也就是真实答案,并且已经确认正确。

4 件事驱动这座工厂。

Spec 是写下来的指令。它告诉 AI worker 要做什么:目标、限制、成功标准。spec 不是随意聊天消息,而是认真写好的计划,就像项目经理为人类团队写的计划。写好 spec 的技能叫 spec-driven development

Skill 是每个 AI worker 带到岗位上的能力。skill 是小型、可移植的软件包,教 AI worker 把一件具体事情做好。例如“如何写专业邮件”或“如何阅读销售合同”。Skill 遵循开放的 Agent Skills 格式。Anthropic 创建了这个标准,现在整个行业都在采用。因为 skill 遵循共享格式,你可以把它们从一个 AI 系统移动到另一个 AI 系统,就像 USB 盘可以插进任何电脑。

反馈循环 是系统学习的方式。每次结果交付后,都要审查结果。学到的东西反馈回系统。错误被修复,好模式被保留。工厂会随着时间变得更好。

MCP 是通用连接器。MCP 全称 Model Context Protocol。理解 MCP 最简单的方式:把它看成 AI 版 USB。USB 之前,每个设备都有自己的特殊线缆。打印机一种,鼠标一种,相机又一种,一团乱。USB 解决了这个问题。现在设备使用同一个连接标准。MCP 对 AI 做同样的事。它让任何 AI worker 通过一个共享标准连接任何工具或数据源。没有 MCP,每个 AI worker 都需要为每个工具做自定义连接。有了 MCP,任何获得权限的 AI worker 都能访问重要数据存储。

合起来:Skill 给 AI worker 能力。MCP 给它们连接。这两个开放标准构成工厂地板。

所有东西之下,是前面提到的记录系统,也就是公司的官方记忆。AI worker 的每个动作,都从这份记忆读取或写回。记录系统是业务真相。

生产引擎如何工作:意图进入(目标、限制、预算),经过书面 spec,再经过 skill 和 MCP 连接,然后 AI worker 做工作,最终输出经过检查的结果。整个过程都运行在底部的记录系统之上。

生产引擎一图概览。左侧输入意图(目标、限制、预算)。它流经 spec,再流经 skill 和 MCP,然后进入 AI worker。右侧输出经过检查的结果。整个引擎位于记录系统之上,也就是公司的官方记忆之上。


10. 能买东西的 AI agent

前面提到过这一点。现在深入一点。这会改变经济学。

今天的 AI agent 执行任务。明天的 AI agent 会_参与市场_。变化是从“AI 作为工具”转向“AI 作为买方”。

AI worker 可以在人的护栏内自主购买所需资源:算力、数据、云服务,以及其他 AI worker 的帮助。护栏包括预算限制、规则遵守、审计轨迹和高风险操作审批。

AI worker 作为经济参与者。AI worker 可以购买算力、数据、云服务,甚至请其他 AI worker 帮忙,但只能在人的护栏内行动:预算限制、规则遵守、每个动作的审计轨迹,以及风险决策的审批门。

想象一个 AI worker 的目标是:“把客户流失率降低 15%。”(Churn 指客户离开业务的比率。)为了达成这个目标,AI worker 可能需要:

  • 购买算力,训练预测哪些客户可能流失的模型。
  • 向数据提供商购买更丰富的客户数据。
  • 设置并支付运行解决方案的云服务。

所有这些,都在人的 supervisor 预先设定的预算和规则之内。

注意 AI worker _没有_做什么。它没有要求人类批准每一个小决定。人类设定预算和规则。在规则内,AI worker 自主行动。

这里的难题不是能力。AI 已经可以做工作。真正难的是信任:确保 AI 留在规则内。因此重点转向:

  • 遵守规则:确保 agent 留在人类设定的限制内。
  • 审计轨迹:完整记录 agent 的每个选择和每笔交易,之后可以检查。
  • 责任归属:当事情出错时,弄清谁在法律上负责。

当 AI worker 能买东西时,AI-Native Company 的资金侧会深刻改变。公司不再只是使用人类分配给它的资源。它会_自己寻找资源_。它会寻找所需,比较选项,实时购买。公司变成一个能够照料自身需求的系统。

给构建者的启示:从第一天起,就为买卖设计你的 AI agent 和系统。Agent 需要预算,而不只是权限。它们需要结果合同,而不只是访问 key。把这件事做对的公司,会捕获下一波价值,就像从订阅转向按结果定价的公司正在捕获这一波价值。


11. 人类没有被替代,而是被提升

常见恐惧是:AI agent 会替代人。

证据显示相反。对几乎所有任务来说,人类和 AI 一起工作,都比任何一方单独工作更好。Agent Factory 不会移除人类,而是提升人类。

  • 从操作者 → 到监督者。
  • 从打字员 → 到编辑。
  • 从 coder → 到结果设计师。

人类被提升,而不是被替代。左侧:操作者变成监督者,打字员变成编辑,coder 变成结果设计师。右侧:10-80-10 划分显示人类设定方向,AI 做工作,人类检查和改进。

人类被提升,而不是被替代。人类上升到更高角色。AI 接管中间步骤。人类保留开头(方向)和结尾(判断与责任)。

这会改变“技术专业人士”的含义。Web 开发者或移动开发者,不只是会用某种语言写代码的人。他们是技术专家。他们理解系统,理解数据如何流动,理解应用如何互相连接,理解用户真正需要什么。在 Agent Factory 时代,这种专业能力更有价值。它不再花在逐个手写按钮上,而是花在设计、部署并监督交付完整产品的 AI worker 上。

开发者不会消失。开发者会做更多。

Steve Jobs 很多年前就找到了这种工作节奏,当时他管理的是人类。我们可以直接借用。


12. 10-80-10 工作节奏

Steve Jobs 遵循后来被称为 10-80-10 规则的方式:

  • 用前 10% 的时间设定愿景。
  • 让团队用中间 80% 完成工作。
  • 回来用最后 10% 打磨、改进并批准。

商业教师 Dan Martell 也这样解释:10% 用于想法,80% 用于执行,10% 用于改进和整合。

Jobs 一开始并不是这样。早期他以控制每个细节闻名,甚至曾告诉团队 Macintosh 计算器的每个像素应该如何显示。后来他改变了,学会把中间 80% 交给优秀的人。Apple 成为世界上最有价值的公司之一,部分原因正是这个转变。

现在把“优秀的人”替换成“AI worker”,你就得到 Agent Factory 的工作节奏。

步骤Jobs 在 AppleAgent Factory
前 10%:意图Jobs 设定愿景和限制人类写 spec:目标、限制、预算、规则
中间 80%:工作Apple 团队构建产品AI worker 做工作:使用工具、把工作交给其他 AI worker、交付结果
最后 10%:检查Jobs 打磨并说“发布”人类审查、改进并批准经过检查的结果

10-80-10 工作节奏。前 10% 是人类方向,中间 80% 是 AI worker,最后 10% 是人类检查。

10-80-10 工作节奏。前 10% 是人类方向。中间 80% 是 AI worker。最后 10% 是人类检查。

2026 年初,AI coding 公司 Cursor 报告,自家产品中 35% 的变更由运行在云计算机上的 AI agent 自主完成。人类开发者通过设定问题并审查完成的工作来指导 agent,而不是逐行指导代码。Cursor CEO Michael Truell 预计,一年内大部分软件开发都会是这种形态。

10-80-10 节奏不再是预测。它是领先公司已经如何工作的测量结果。

人类检查的对象也在改变。过去开发者逐行 review 代码。现在 AI agent 会在云计算机上工作数小时,然后返回它做了什么的短视频、可点击的工作预览和易读日志。你不会再逐行读代码,而是看一段短视频或点击预览来检查工作。这很重要:人类不可能同时读 12 组代码 diff,但可以同时扫 12 个预览。这让许多 AI agent 并行工作成为可能。

这种节奏不只用于 coding。它适用于每一种专业工作。前 10%,清晰思考、设定上下文、谨慎 prompting,只属于人类。中间 80%,总结、生成、分析、格式化、起草,是 AI 接管的部分。最后 10%,判断、改进、质量控制,又只属于人类。

你不再把 80% 的时间花在执行工作上。你会把 100% 的注意力放在只有人类能做的 20% 上:开头设定方向,结尾保证质量。


13. 两层:个人与劳动力

现在可以画出未来公司的完整图景。

AI worker 是工作被完成的方式。但人类不直接和每个 AI worker 对话,那太难管理。相反,人类和自己的个人 AI agent 对话,也就是前面说的 delegateidentic AI。个人 agent 把人类意图转成劳动力能执行的指令。

这给出了一个双层模型

包含什么服务谁做什么
边缘层你的个人 AI agent(delegate)个人把你的意图转成指令,把工作交给 AI worker,替你做选择
AI 劳动力层基于角色的 AI worker公司执行任务、运行工作流、交付经过检查的结果

公司两层。上层(边缘层):人类意图经过个人 delegate,转成指令。下层(AI 劳动力层):协调者把工作路由给支持、财务、销售等 AI worker,产出经过检查的结果并返回给人类。

双层模型的运行方式。意图向下流动:你 → 你的个人 delegate → 劳动力协调者 → AI worker。结果向上返回给你,已经经过检查。你不手动管理每个 worker,而是通过 delegate 指挥劳动力。

两层都需要。

  • 没有背后的 AI 劳动力,个人 agent 只是没有下属可指挥的聊天机器人。
  • 没有边缘上的个人 agent,劳动力会闲置,等待人类逐条写指令。这正是 Agent Factory 要解决的问题。

双层模型完成了图景。公司中间有工业化劳动力,边缘有人类控制,二者之间用清晰书面 spec 作为语言。


14. 使用通用 AI agent 的两种模式

前面说过有两类 engagement。现在可以把它们放到正确位置。

通用 AI agent 是人类直接使用的强大 AI 工具。有些为工程师设计,例如 Claude CodeOpenCode。这些是工程师在 terminal 中使用的 AI 工具。有些为非工程师设计,例如 Claude CoworkOpenWork。这些面向金融分析师、律师、营销人员、写作者等知识工作者。

人类以两种模式使用这些通用 agent。

模式谁使用,使用什么最后交付什么由什么治理
问题解决 engagement工程师使用 Claude Code 或 OpenCode。领域专家使用 Claude Cowork 或 OpenWork。给人类的完成结果七项原则
制造 engagement任何人,始终使用 Claude Code 或 OpenCode加入劳动力的新 AI worker七个不变量

使用通用 AI agent 的两种方式。模式 1(问题解决)是人类与 AI 对话,结果交付后结束,例如修复 bug 或分析报告。模式 2(制造)是生产会话,人类用工具构建新的永久 AI worker,例如构建支持 worker。人类相同,目标不同。

两种模式,一个核心区别。模式 1 是对话:你和 AI 交谈,拿到完成结果,会话结束。模式 2 是生产线:你用 AI 构建新的 AI worker,它会在会话结束后继续运行。一种解决今天的问题,另一种制造明天的 worker。

模式 1:问题解决。 开发者打开 Claude Code 改进软件。财务分析师打开 Claude Cowork 重建月度结账模型。会话开始,工作完成,会话结束。没有新的永久 AI worker 被构建。通用 agent 本身就是这次会话的 worker。会话结束,它也就结束。

问题解决 engagement 按受众分流。工程师使用 Claude Code 或 OpenCode,也就是面向 code、基础设施和系统工作的 terminal-native 工具。领域专家使用 Claude Cowork 或 OpenWork,也就是面向文档、电子表格、brief 和审阅的知识工作工具。模式相同,规则相同,只是界面家族不同。

这个模式由通用 agent 问题解决七项原则治理。这些原则来自数千次会话,包括成功的和失败的,覆盖 coding、合同审阅、财务模型、招聘和研究工作。同样的 7 条规则适用于 4 个工具,只是表面不同。

  1. Bash is the Key:让 AI 行动,而不只是说。 通用 AI agent 真正有用,是在它能真实_做事_时:运行命令、读文件、保存工作。确保 AI 能运行真实命令,不要只让它描述自己会怎么做。
  2. Code as Universal Interface:需要精确时使用结构。 如果需要精确结果,让 AI 输出结构化格式:表格、列表、代码块、清单、固定提纲。不要只要一段散文。结构让结果更清晰,也让错误更容易发现。
  3. Verification as Core Step:永远检查工作。 每个结果都需要检查。代码要跑测试。备忘录要按标准打分。可以让第二个 AI 审查第一个 AI 的工作。“看起来对”是不够的。
  4. Small, Reversible Decomposition:用小步,且可撤销。 把工作拆小。每一步保存后再继续。不要让 AI 连续跑一小时而没有保存点。一个大改动出错时可能抹掉数小时工作。
  5. Persisting State in Files:文件才是记忆。 聊天历史是暂时的,会消失。文件是持久的。任何跨会话值得记住的东西,包括决策、计划、约定、客户细节,都写入文件。
  6. Constraints and Safety:只给 AI 必要权限。 先从有限访问开始。先只读。先每步审批。观察 AI 的行为。只有在它能在严格限制内正确工作后,再给更多访问权。不要从第一天就给 AI 宽泛访问。
  7. Observability:看见 AI 做了什么。 看不见 AI 正在做什么,就无法信任它。每个动作都应可见,可以通过日志、步骤视图、短视频或可点击预览。如果看不见工作,就无法检查工作。

这些原则把强大的 AI 工具从聪明玩具变成可以交付真实工作的工具。前 5 条是日常纪律:行动、结构、验证、小步、文件作为记忆。后 2 条是让前 5 条保持安全的方式:约束和可观测性。

良好 AI 会话的七项原则围绕通用 AI agent 排列。每条原则都是一个实际习惯:行动而不只是说,用结构化输出,始终验证,小步工作,把记忆保存到文件,限制访问,看见发生了什么。

与通用 AI agent 进行良好会话的 7 个习惯。前 5 个是日常工作规则。后 2 个,也就是限制访问和看见发生了什么,保证工作安全。

模式 2:制造。 这是目标是_构建_某个会持续存在的东西:一个在这次会话结束后继续运行的新 AI worker。制造始终使用工程工具(Claude Code 或 OpenCode)。人类是财务分析师还是营销人员并不重要。构建 AI worker 本质上主要是 coding task。同一个开发者可以用 Claude Code 设计、构建并部署一个审查代码的 AI worker。财务分析师通常会和工程师合作,用 Claude Code 构建每个月执行月结的 AI worker。输出不是问题答案,而是以后一次又一次产生答案的 worker。这个模式由七个不变量治理,也就是任何 AI-Native Company 的设计规则。下一节会介绍。

原则指导_会话_。不变量指导_设计_。问题解决 engagement 由原则指导,因为它产出一个随着会话结束而结束的结果,没有持续架构需要遵守。制造 engagement 由不变量指导,因为它的输出必须进入一支跨会话、跨 agent、跨产品周期都能保持一致的劳动力。

两种模式都适用 10-80-10 节奏。不管你是用 AI 解决自己的问题,还是构建一个以后替你解决问题的 worker,你的时间仍然分成意图、工作和检查。


15. 七条不会改变的规则(七个不变量)

现在进入本书核心:任何 AI-Native Company 都必须遵守的 7 条设计规则,不管用什么产品来实现。

记住区别。不变量 是必须始终成立的规则。参考实现 是 2026 年用来遵守该规则的产品。规则是主旨,产品只是一个选择。

先命名参与者。在 AI-Native Company 中:

  • 是领导者和所有者。你设定方向。
  • delegate 是你的个人助手,也就是那个了解你的上下文并替你发声的 AI agent。
  • 管理层 是公司的操作系统。它招聘 AI worker、分配工作、控制预算、决定每个 worker 可以做什么、保存记录,并在角色结束时让 worker 退休。
  • AI worker 是交付结果的员工。
  • runtime engine 是每个 worker 实际运行其工作的机器。不同 worker 可以根据岗位运行在不同 engine 上。
  • 神经系统 在 worker 之间传递消息,让公司在崩溃后继续运行,并控制流量,使劳动力在高负载下仍然工作。

下面每条规则都描述这家公司如何运行。每个具名产品都只是可替换的一个选择。


规则 1:人类是 principal

规则。 公司中的每个行动都从人类开始。人类是 principal,即设定目标、给出预算、划定 AI 可做什么的边界,并拥有结果的人。没有例外。这一层永远不交给 AI。

为什么必须存在。 方向不会自己出现。判断、价值、花钱的权利和对结果的责任,都不能交给机器。一个没有人类负责的系统不是_独立_,而是_无主_。无主系统会产生没人能负责的结果。

没有它会出什么问题。 没有人负责。没有一个人的价值被系统遵循。预算没有主人。结果没有裁判。

今天如何实现。 通过书面 spec、审批点、声明预算和检查步骤。任何能捕捉人类意图、权限和责任,并把它们传递给下游系统的方法,都符合这条规则。


规则 2:每个人都需要一个 delegate

规则。 人类不能手动指挥几十个 AI worker。每个人都需要一个个人 AI agent。这个 agent 持有他们的上下文,替他们发声,承载他们的权限,并把工作交给正确位置。

为什么必须存在。 一个人不能同时指挥 20 个 AI worker。时间不够,而且人类打字比 AI 工作慢得多。没有 delegate,人类会被迫回到手工发指令,也就是 Agent Factory 要消除的失败模式。

没有它会出什么问题。 人类成为最慢点。AI 劳动力等待指令。整个系统降到人类打字速度。

今天如何实现。 本书使用 OpenClaw 作为 personal agent。任何能持有你的身份、上下文和权限,并把工作传给管理层的 personal agent,都符合这条规则。


规则 3:劳动力需要管理层

规则。 一群 AI worker 不是一家公司。劳动力需要一个协调层。这个层是公司的操作系统。它招聘 worker、分配工作、控制预算、审批风险选择、决定每个 worker 允许做什么、记录谁以什么成本做了什么,并在角色结束时让 worker 退休。

为什么必须存在。 协调、责任和成本控制不会自动出现。需要一个层知道谁在做什么、成本是多少、什么被允许、产出了什么,以及出错时发生了什么。AI worker 只有在单一层把它们变成可见单元,也就是能力、成本、速度和结果的单元时,才会作为劳动力变得可控。它们也只有在同一个层能按需关闭它们时,才会保持经济性。

没有它会出什么问题。 worker 重复做同一件事。预算泄漏。记录碎裂。财务回答不了劳动力花了多少钱。运营回答不了劳动力产出了什么。退休 worker 继续运行,因为没人负责停掉它们。

今天如何实现。 本书使用 Paperclip 作为管理层。它被构建为 AI-Native Company 的操作系统。任何能在正确权限下招聘、分配、治理、观察和退休 worker 的系统,都符合这条规则。


规则 4:每个 worker 选择自己的 engine

规则。 每个 AI worker 都必须运行在某种 engine 上,也就是实际运行工作的软件。engine 按 worker 选择,而不是按 公司 统一选择。不同 worker 可以使用不同 engine,匹配各自岗位真正需要的东西。

为什么必须存在。 有些工作很重要,不能静默失败或丢数据。这类工作需要强可靠 engine。其他工作是例行工作,可以承受小失败,可以使用更便宜、更轻的 engine。强迫所有 worker 使用一个 engine,意味着你要么为不需要的可靠性多付钱,要么为需要可靠性的工作付得不够。两者都不好。

没有它会出什么问题。 一个 engine 意味着一组取舍。公司要么负担不起可靠 worker,要么无法信任便宜 worker。

今天如何实现。 我们根据岗位使用多个 engine:Dapr AgentsClaude Managed AgentsOpenAI Agents SDKCursor SDKOpenClaw-native。现在不必记住名字。重要的是规则:让 engine 适合岗位。


规则 5:每个 worker 都依托记录系统运行

规则。 engine 是 worker 运行_在其上_的东西;记录系统是 worker 运行_所依托_的东西。每个 AI worker 都从官方记忆存储读取并写回。这里保存公司的持久记录:客户、订单、库存、合同、资金条目、支持工单和业务真实事实。

为什么必须存在。 AI 的短期记忆,也就是 context window,是暂时的,会在会话结束后消失。记录系统是永久的。没有官方真相存储,AI agent 会开始编造事实、重复保存同一笔交易、在会话之间丢失工作,并产生没人能事后检查的结果。记录系统把真实工作和听起来很自信的编造回答分开。它还让劳动力可在事后阅读:worker 的每个动作都会在会话结束后仍然存在的系统里留下记录。

没有它会出什么问题。 结果漂离现实。两个 worker 因为短期记忆不同,向同一客户说出不同答案。责任无法追踪。公司变成一个制造自信输出、但底下没有真实基础的机器。

今天如何实现。 公司的现有数据库和运营系统充当记录系统,例如 CRMERP、支持工单系统、数据仓库、财务总账。前面提到的 MCP 是 AI worker 访问它们的方式。任何持久、可访问、受治理,并能让劳动力读写的存储,都符合这条规则。


规则 6:劳动力能在规则内自行增长

规则。 管理层必须能够_自动招聘新的 AI worker_。当出现缺口时,例如客户使用当前 worker 不会的语言,或者出现当前 worker 做不了的新工作,获得授权的 agent 应该能够为新 worker 写 spec、设置环境、注册到管理层,并投入工作。所有这些都在人的规则内完成。

为什么必须存在。 固定 worker 列表无法跟上变化的问题。如果每个新缺口都需要人类手动构建新 worker,系统会慢下来。劳动力必须能自行增长,但始终在人的限制内,而不是越界。

没有它会出什么问题。 worker 列表被冻结。每种新问题都需要人类。公司只能按人类手动构建新 worker 的速度增长。

今天如何实现。 我们使用 Claude Managed Agents 做这件事。任何能在运行时创建新 AI worker 并设置其环境,同时留在人类规则内的系统,都符合这条规则。


规则 7:劳动力运行在神经系统上

规则。 工作会自己到达。它在 worker 之间流动,不需要人类路由每一步。预定时间到了。客户填写网页表单,一个小消息发出。一个 worker 完成任务,把它交给下一个 worker。这些都由一个单一_事件系统_承载,就像公司的神经系统。它在有事要做时唤醒 worker,在工作中途崩溃时保留进度,并控制流量,避免一个忙碌客户阻塞所有其他客户。

为什么必须存在。 劳动力要在没有人类每步介入的情况下运行,必须满足 4 件事:

  • 外部触发。 系统必须能自行醒来,例如预定时间到了、webhook 触发了,或客户发送请求。
  • 内部交接。 worker 必须能把工作交给其他 worker,而不需要人类路由每次交接。
  • 耐久性。 多步骤工作必须能在中途崩溃后继续。原因是每一步都有小概率失败。当 6 步串在一起时,小概率会相乘。如果每步成功率是 95%,连续 6 步的成功率只有 95% × 95% × 95% × 95% × 95% × 95% ≈ 74%。这意味着每 4 次运行就有 1 次会静默失败。有了正确耐久性,系统记住已完成部分,只重试失败部分,同一个任务完成率约为 99.7%。这就是能交付的劳动力和每 4 次丢 1 次任务的 demo 之间的差别。
  • 流量控制。 如果一个客户突然发送 1000 个请求,系统必须处理这个峰值,而不让其他客户永远等待。

没有它会出什么问题。 没有外部触发,系统只有在人类 prompt 时才动,经济性退回聊天机器人。没有内部交接,worker 无法在无人类中介的情况下协调。没有耐久性,多步运行的可靠性会越跑越差。没有流量控制,一个忙碌客户会阻塞所有其他客户。

今天如何实现。 我们使用 Inngest 作为神经系统,一个同时承载这 4 个特性的系统。Day AI,一家构建 AI-native CRM 的真实公司,正是这样描述自己的 Inngest 层。创始工程师 Erik Munson 称其为产品的“神经系统”。这来自真实市场中的真实构建者,不是教科书措辞。


16. 一张图看完整设计

下面用一张表展示 7 条规则。

规则需要什么2026 年我们使用什么什么可以替代它
Principal设定意图、预算、权限和责任的人类
Delegate持有你上下文和权限的个人 agentOpenClaw任何能说 MCP 的 personal agent
管理层劳动力操作系统:招聘、分配、治理、观察、退休Paperclip任何满足管理合同的系统
Engine匹配岗位的 per-worker runtimeDapr / Claude Managed Agents / OpenAI SDK / Cursor / OpenClaw-native任何满足岗位可靠性需求的 runtime
记录系统劳动力读取和写入的官方存储现有数据库、工作流、MCP 暴露的平台任何持久、可访问、受治理的存储
劳动力增长在规则下按需招聘新 worker 的能力Claude Managed Agents任何能在运行时创建新 agent 的系统
神经系统在权限下承载事件、耐久性和流量控制Inngest(劳动力);Claude Code Routines(coding agent)任何具备耐久和流量控制的事件系统

7 条规则,一条链。明天可以替换中间列的任何产品,设计仍然成立,因为设计从来不是产品,而是规则。

AI-Native Company 的 7 条规则:1. 人类负责。2. 每个人都有 delegate。3. 劳动力有管理层。4. 每个 worker 使用正确 engine。5. 每个 worker 使用记录系统。6. 劳动力在规则内增长。7. 公司运行在神经系统上。下方:工具会变,规则不会。

AI-Native Company 的 7 条规则,一张图看完。这些是不会改变的规则。具体工具(OpenClaw、Paperclip、Dapr、Inngest)可以替换,规则保留。

现实中会是什么样?想象一位客户用 Bahasa Indonesia 写来一条支持消息,而当前没有任何 AI worker 会这种语言。会发生:

  • 客户消息通过神经系统(Inngest)到达。
  • 管理层(Paperclip)发现没有当前 worker 会这种语言,出现能力缺口。
  • Paperclip 在人类设定的规则内调用自己的招聘系统(Claude Managed Agents),创建一个会 Bahasa 的新 worker。
  • 新 worker 从记录系统读取客户历史,写回复,把对话保存回记录系统,并发送回复。
  • 回复通过同一条链路到达客户。
  • 新 worker 留在团队里,准备处理未来的 Bahasa 客户。

没有唤醒任何人类。 公司处理了新情况,在规则内扩展了自己的劳动力,服务了客户,并记录了整个事件,便于之后检查。这就是 7 条规则带来的能力。

当新问题出现:客户用 Bahasa Indonesia 写信,管理层发现当前 worker 无法处理,在人类规则内创建新 Bahasa worker,客户得到回复,新 worker 留在团队中。

客户使用一种新语言写来消息。劳动力发现缺口。新 worker 在人类规则内被创建。客户得到回复。新 worker 留在团队里,供下次使用。


17. 一个完整例子:用 5 步构建支持工单 AI worker

到目前为止,本书一直在讲思想。现在把它变具体。

想象你负责一家小型网店 Mehndi Mart 的客户支持。这是一家虚构的、面向全球客户销售 henna 产品的商店。你被支持工单淹没:退款请求、配送问题、产品咨询。你决定构建一个 AI worker,处理每个工单的第一轮回复。

下面是使用第 15 节七条规则和第 14 节七项原则的做法。

第 1 步:写 spec(规则 1:人类负责)

你打开 Claude Code 或 OpenCode(工程工具,见第 14 节模式 2)。你为 worker 写一个 spec。spec 只是书面计划,可能长这样:

WORKER: First-Response Support Agent for Mehndi Mart

GOAL:
- Read every incoming customer ticket
- Classify it: refund, shipping question, product question, or other
- Write a first draft reply
- Hand off to a human if the case is complex or angry

LIMITS:
- May not promise refunds above $100 without human approval
- May not commit to delivery dates not in the shipping system
- May not respond in any language the worker is not trained for

BUDGET:
- Maximum $200/month in compute costs
- Maximum 30 seconds per ticket

SUCCESS LOOKS LIKE:
- 80% of tickets get a useful first reply within 5 minutes
- Less than 5% of replies need human correction before sending
- All tickets are recorded in the support system of record

这个 spec 捕捉你的意图、预算和限制。你现在就是这个 worker 的 principal。你拥有它的结果。

第 2 步:选择记录系统(规则 5)

worker 必须从公司的官方记忆读取并写入。对于支持 worker,这意味着 3 个地方:

  • 客户记录(你的 CRM,例如 HubSpot 或 Salesforce)
  • 订单记录(你的电商平台,例如 Shopify)
  • 支持历史(你的工单系统,例如 Zendesk 或 Freshdesk)

你通过 MCP 把这些系统连接到 AI worker。每个系统都作为 MCP server 暴露。worker 在获得权限时就能查询它们。

你决定:这个 worker 可以_读取_ 3 个系统,并_写入_工单系统。它不能写客户或订单记录,这些变更仍然需要人类。

第 3 步:附加 worker 需要的 skill

Skill 是一个小型、可移植的软件包,教 worker 把一件具体事情做好(第 9 节)。对这个支持 worker,你会附加:

  • “如何写专业支持回复”:语气、结构、署名
  • “如何分类支持工单”:工单类型列表,以及如何区分
  • “如何阅读订单记录”:哪些字段重要,分别代表什么
  • “何时升级给人类”:愤怒、法律威胁、复杂退款等触发条件

Skill 可以从 skill library 下载,也可以由你和团队编写。它们遵循开放的 Agent Skills 格式,所以能在任何 AI 系统中工作。

第 4 步:选择 engine 并设置护栏(规则 3、4、6)

你决定 worker 在哪里运行。对支持 worker 来说,可靠性重要,成本也重要,所以你选择中间级 engine。(之后可以更改。规则 4 说每个 worker 选择自己的 engine。)

然后你通过管理层设置护栏(Paperclip,或你使用的任何管理层):

  • 预算上限:每月 $200,硬停止
  • 审批门:超过 $100 的退款,在回复发送前需要人类确认
  • 审计轨迹:worker 接触的每个工单都记录 worker 的动作、成本和耗时
  • 速率限制:每分钟最多 50 个工单,避免消息洪水在 5 分钟内耗尽预算

worker 现在存在于清晰的能力边界内,知道自己能做什么、不能做什么。

第 5 步:验证并部署(规则 7 + 七项原则)

在让 worker 处理真实客户前,你先验证它。用一批历史工单运行它,例如 100 个过去工单,然后检查回复。它分类正确吗?回复专业吗?该升级的案例升级了吗?

你观察 worker 的每个动作:它打开的每个文件、运行的每一步、作出的每个决定。这就是可观测性:worker 做的事没有隐藏。你发现错误,调整 spec,重新测试。

满意后再部署。神经系统(Inngest,或你使用的任何事件系统)开始把真实工单在到达时喂给 worker。worker 处理它们。人类每天抽查一小部分。随着时间推移,你改进 spec、添加 skill,worker 会变得更好。

刚刚发生了什么

你写了 spec。你连接了记录系统。你附加了 skill。你设置了护栏。你验证并部署。你刚刚构建了一个 Digital FTE。

这个 worker 现在每周 7 天、每天 24 小时运行在你设定的规则内。当业务增长时,你不再靠雇更多人来分拣工单,而是通过收紧 spec 和添加 skill 来扩展。团队中的人类会沿价值链上移:复杂案例、客户关系、产品反馈、战略。

这就是 Agent Factory 做的事。一次构建一个 worker。

你的第一个 worker 清单

在交付任何 AI worker 前,先过一遍清单。如果每项都打勾,这个 worker 就满足七个不变量,可以部署。

  • Spec 已写好:目标清楚、限制清楚、预算清楚、成功定义清楚
  • Principal 已命名:有一个具体人类拥有这个 worker,并对结果负责
  • 记录系统已选择:worker 知道从哪里读取公司真相,写回哪里
  • MCP 连接已设置:worker 能访问需要的系统,而且只访问这些系统
  • Skill 已附加:worker 需要的能力已作为可移植 skill package 加载
  • Engine 已选择:runtime 匹配岗位可靠性和成本需求
  • 预算上限已设置:管理层执行月度支出的硬限制
  • 审计轨迹已启用:每个动作都有日志、可检查、可重放
  • 审批门已设置:高风险动作发生前需要人类说“yes”
  • 验证计划已准备:你知道如何检查 worker 的前 100 个输出

如果每个框都能打勾,你的 worker 就不再是聪明玩具。它是一个 Digital FTE。


18. 什么保持不变,什么会改变

下表展示了哪些部分是永久规则(左列,也就是主旨),哪些部分是今年的具体工具(右列,也就是 2026 年)。

稳定部分(规则,不变量会改变的部分(具体工具,实现
拥有清晰权限的人类 principalauthoring 工具、审批界面、spec 格式
边缘上的个人 delegatedelegate 产品及其继任者
具备完整劳动力控制的管理层管理层产品及其继任者
per-worker engine 选择SDK、runtime、运行 agent 的平台
劳动力依托的官方存储数据库引擎、CRM/ERP/工单产品、MCP server 列表
能在规则内增长的劳动力managed-agent API、设置系统
权限下的事件、耐久和流量scheduler、webhook 框架、durable-execution 平台
规范驱动的工作定义spec 语言、格式、工具
使用通用 agent 的七项操作原则具体 agent 产品、命令行工具、prompt 模式
基于结果的商业模型定价单位、合同格式
agent 作为经济参与者支付系统、责任框架
可观察、可审计运行tracing 系统、日志格式
层之间清晰接缝,使供应商锁定移动时不破坏设计哪一层承载锁定:2024 年是 AI 模型层,2026 年是 harness 层,下一步可能是 orchestrator
可按成本、速度、结果衡量的劳动力财务系统、账本实现
作为可移植 skill 封装的能力skill 格式、registry、分发平台

左列是主旨。右列是 2026 年。

如果你按左列构建,公司能承受右列变化。如果你只按右列构建,却不理解左列,每两年就得重建一次。


19. 今天我们使用的具体工具

为了完整,下面列出 2026 年我们用来遵守每条规则的产品。这些是参考实现。 它们会改变,规则不会。记住:不要死记产品名。记住每个产品承担的工作。

  • DelegateOpenClaw,开源个人 AI agent
  • 管理层Paperclip,AI-native company 操作系统;它把 hire、assign、govern、observe、retire 暴露为其他系统可调用的函数
  • EngineDapr AgentsClaude Managed AgentsOpenAI Agents SDKCursor SDKOpenClaw-native,分别适合不同岗位画像
  • Skill:来自 agentskills.io 的 Agent Skills 格式,一种封装 AI 能力的可移植文件夹格式
  • 神经系统Inngest,公司的主事件系统;Claude Code Routines,coding agent 的专门触发器

对规则 6(劳动力能自行增长),我们使用 Claude Managed Agents。同一项技术既是 engine 选项之一,也作为招聘系统,因为它能在运行时创建新 agent,正是“把招聘作为可调用函数”的基础。

现实支持。 这不只是理论。2026 年 2 月,Cursor CEO 用非常接近本书的语言描述公司从 AI coding tool 转向“agent factory”:一群 AI agent 像队友一样工作,人类定义问题并审查完成品,agent 在云计算机上并行工作,而不是被逐行指导。2026 年 5 月,The New Stack 报道同一模式已成为 Anthropic、OpenAI、Google、Microsoft 和 Cursor 之间的行业共识。

2026 年领先观点很清楚:AI 模型正在商品化。许多公司都能制造足够好的 AI 模型,一个模型可以被另一个替换。真正变得有价值的是 “harness”,也就是包裹模型、让模型能安全、可靠、规模化行动的软件。Google 一位高级领导者公开表示,公司已经不再在意开发者选择哪个 AI coding 工具。本书命名的接缝,人类、delegate、管理层、engine、记录系统和神经系统之间的接缝,正在真实生产系统中大规模形成。

这些规则不是预测,而是领先前沿已经所在位置的图像。

关于词语的小说明。 本书中,系统里的每个部分从技术上都可以称为 agent:OpenClaw 是 agent,Paperclip 是 agent,AI worker 也是 agent。但只有 AI worker 是_劳动力_,也就是被招聘、分配工作、保留在团队中并退休的部分。OpenClaw 和 Paperclip 是公司的永久部件,不是劳动力。所以当本书说 AI Worker,它指劳动力。当它说 agent,它可以指公司里的任何参与者:永久部件或劳动力。


20. 劳动力机会

AI 会把_工作拆开_成一个个任务。有些任务会完全由机器完成。但拆开工作也会创造新的组合:新角色、新业务、新市场。这些在工作被锁在固定岗位名称里时并不存在。

未来劳动力需要构建灵活技能组合,而不是依赖固定职业路径。学会与 AI 一起思考、每天使用 AI 工具,并把 AI 当成数字队友的专业人士,不只是会熬过转变,还会在转变中做得很好。

SaaS 时代为开发者、设计师和产品经理创造了数百万岗位。Agent Factory 时代会创造更多岗位:agent 设计师、结果架构师、验证专家,以及教机器理解本领域“正确”是什么的领域专家。

这也会成为历史上最大的劳动者培训机会之一。到 2030 年,World Economic Forum 估计全球每 100 名劳动者中有 59 名需要新培训,以适应新技术和新工作方式。

劳动力机会。AI worker 覆盖每个业务职能:GTM、财务、支持、工程、人力资源、法律。

劳动力机会。同一个 Agent Factory 可以在每个业务职能中构建专业 AI worker:销售、财务、支持、工程、人力资源、法律。部门之间规则不变,只变角色和记录系统。

同一家工厂会在每个业务职能中制造专业 worker:

  • GTMGo-To-Market,也就是把潜在买家变成付费客户的销售、营销和收入动作)中,一组 AI worker 可以处理很多任务:

    • 寻找新线索。
    • 发送 outreach 消息。
    • 保持客户数据库干净。
    • 分析销售管道。
    • 编写提案。
    • 定制 demo。

    在 SaaS 时代由人手工完成的工作,现在被构建为 AI worker,并由人类 GTM lead 监督。

  • 财务中:月结、AR/AP(应收与应付),以及 FP&A(财务计划与分析)。

  • 客户支持中:分拣工单、解决问题、升级复杂案例。

  • 工程中:代码审查、重构、部署。

  • 人力资源中:寻找候选人、筛选、入职。

  • 法律中:合同审查、标注修改、事项 intake。

每个 AI worker 都通过 Paperclip 招聘,由对应部门的人类监督,并依托该部门的记录系统运行:销售用 CRM,财务用总账,支持用工单系统,工程用代码仓库。部门之间规则不变。只变角色定义和记录系统。

机会不是更小,而是更宽。它奖励适应的人。


21. 钱已经开始投入

如果你不确定这种变化是否真实,看钱流向哪里。

到 2026 年 1 月,美国数据中心建设达到年化 $420 亿,而办公室建设从峰值下降 35%。

历史上第一次,美国在 AI worker 工作场所(数据中心)上的建设支出,超过人类 worker 工作场所(办公室)。

数据中心以工业规模消耗铜和电。一座超大 AI 数据中心最多需要 5 万吨铜,约为普通数据中心的 10 倍。Meta、Google、Amazon 和 Microsoft 仅在 2026 年就计划在 AI 基础设施上投入超过 $6000 亿

AI 时代的工厂不是想法。它们正在被建造。

美国建设支出:数据中心建设从接近零增长到 $42B,而办公室建设从 $60B 降到 $44B。两条线在 2025 年交叉。

美国建设支出。办公室建设,也就是人类 worker 的工作场所,正在下降。数据中心建设,也就是 AI worker 的工作场所,正在上升。两条线在 2025 年交叉。来源:U.S. Census Bureau, Value of Construction Put in Place Survey。

赢家不会用卖出多少软件订阅来衡量,而会用交付了多少结果来衡量。


22. 这一切指向哪里

收尾前,值得标记这份论纲已经站在哪里。AI-Native Company 不再是未来概念。到 2026 年中,只有个位数人类员工的公司,已经在 AI 运营劳动力之上报告年化 10 亿美元收入。这种公司类别在 3 年前还几乎不存在。具体公司会成功,也会失败。有些会遇到监管问题。但_类别_会留下。论纲预测了公司的形状,而公司已经到来。

这份论纲证明的是 Agent Factory 今天和近期构建的东西:软件 AI worker、组织成 AI-Native Company、在人类商业边缘工作。这是本书有资格主张的范围。

但设计会延伸得更远。有 3 个方向值得命名。

物理 AI worker。 构建软件 AI worker 的同一套工厂设计,也会延伸到_物理_ worker,也就是机器人。做仓库工作的机器人,自动配送车辆,工厂车间里的机器。每一个都可以是在同一规则下的 AI worker,通过同一管理层招聘,运行在驱动物理部件而不是软件调用的 engine 上。规则不变,只是计算机有了身体。随着物理 AI 成熟,AI-Native Company 的劳动力不会只包含数字 worker,也会包含由同一方法构建、由同一设计控制、对同一规则负责的物理 worker。

完全独立的经济 agent。 本论纲开头命名了这个方向。随着 AI worker 获得持久身份、支付系统、声誉和进入合同的法律能力,它们不再只是公司使用的工具。它们会成为自身意义上的经济参与者:从其他公司的 AI worker 购买服务,把能力卖给需要它的公司,积累资本,在没有人类批准每笔交易的情况下签订合同。Agent Factory 保持不变。变化的是被它制造出来的 worker 的独立程度。由此产生的问题,包括法律地位、责任、税收、反垄断,不是设计问题,但会变得紧迫,设计必须为它们做好准备。

AI worker 在公司之间流动。 今天,AI worker 由一家公司构建,只为这家公司工作。随着制造层成熟,AI worker 会变得_可移植_:被一家公司雇用,再转移到另一家公司,甚至同时为几家公司工作。招聘系统从公司内部扩展到公司之间。不同公司的权限规则在同一个 AI worker 上重叠,并由合同控制。AI worker 的劳动力市场会成为真实市场,有费率、声誉、专业方向和流动率。Agent Factory 交付 worker,市场负责路由。

这 3 个方向,物理 worker、完全独立、worker 流动,都是设计的_延伸_,不是偏离。


收尾

规则成立。工具变化。论纲站得住。

一种新公司正在被构建:由 AI worker 组成劳动力,由管理层协调,由人类通过个人 agent 指挥。构建它的方法是 Agent Factory。它产出的公司是 AI-Native Company。它雇用的 worker 是 Digital FTE。它们依托的真相是记录系统。它们遵守的规则是七个不变量。今天遵守这些规则的产品会改变,规则不会。

如果你刚接触这一切,这就是一段话读完整个论纲。本书其余部分,是构建它的设计、实践和工作。


注释与来源

  1. Don Tapscott,HBR IdeaCast 访谈,“With Rise of Agents, We Are Entering the World of Identic AI”,Harvard Business Review,2026 年 2 月 17 日。

  2. World Economic Forum,Future of Jobs Report 2025,2025 年 1 月。

  3. Michael Truell,“The third era of AI software development”,Cursor Blog,2026 年 2 月 26 日。

  4. Matthew Burns,“Cursor's $60 billion bet is on the harness, not the model”,The New Stack,2026 年 5 月 1 日。

  5. Erik Munson,Day AI 创始工程师,引自 “Day AI – Customer Story”,Inngest,访问于 2026 年 5 月。

  6. Jodie Cook,“The 2-Person $1 Billion Company Is The Real Business Goal — And How To Do It”,Forbes,2026 年 5 月 10 日。


这是 Agent Factory 论纲的初学者友好版本,使用简明中文。原始技术版本可在 agentfactory.panaversity.org 阅读。两个版本提出同一设计,并到达同一结论。这个版本使用更简单的词和更短的句子。原始版本使用行业词汇和更长句子。选择适合你当前位置的版本阅读,并在准备好时切换。