Agent Factory 论纲
刚接触 AI?阅读简明中文版本 →
在 AI 时代,最有价值的公司不会销售软件,而会制造 AI employee(Digital FTE):基于角色的系统,能够组合工具、生成专家 agent,并规模化交付结果。这些 AI employee 是 AI-Native Company 的运行基底。在这类公司里,劳动力主要由 AI 组成,产品线则是这支劳动力交付的任何东西:软件、决策、服务和交易。你不是从这些公司购买东西,而是雇用它们。 这条路径还会继续延伸:AI employee 正站在成为自身意义上的经济参与者的门槛上,能为完成任务自主购买服务、采购算力、获取数据。这不再是工具类别,而是公司类别。 Agent Factory 就是构建这些公司的过程。
经济参与者这条轨迹不是 2030 年预测。让它成为可能的支付轨道已经在生产环境中上线。2025–2026 年上线的 4 个开放协议,让 AI agent 可以授权支付、结账和完成交易,而不需要人类在每一步都介入。
- ACP(OpenAI + Stripe):驱动 ChatGPT 的 Instant Checkout。当 agent 在聊天中替你购买东西时,ACP 负责授权和清算交易。
- AP2(Google):由 60 多家公司支持的跨供应商标准,围绕_密码学签名授权_构建。agent 携带一张数字签名的许可单,证明人类已授权它在指定类别上花费不超过指定金额。
- x402(Coinbase):crypto-native 支付协议。第 2 版在 2025 年末发布;Stripe 于 2026 年初在 Coinbase Base blockchain 上集成它,把协议从 crypto-native commerce 连接到主流支付流。
- MPP(Stripe / Tempo):为微支付构建。一个流式使用服务的 AI agent 可以在预设上限下每秒支付几分钱,从而让人类介入时不经济的 consumption-based commerce 成为可能。
管道已经就位。它改变的是工作本身的形态。
SaaS 时代销售订阅。Agent Factory 时代销售结果。人类定义意图。Agent 执行。人类验证结果。 中间那一步,也就是打字、点击、集成和执行,是 AI 吸收的部分。留给人类的是机器无法替我们完成的工作:知道自己真正想要什么,以及知道自己是否真正得到了它。
留下来的东西:意图。验证。结果。
意图不会自己写进 spec。它来自人:人的判断、领域知识和价值观。但随着 AI employee 增多,没有任何专业人士能手工编排所有 worker。他们会通过一个个人 agent 行动,这个 agent 反映其判断,并代表其下游委派工作,就像一个了解你、替你发声,并把工作交到正确位置的 chief of staff。商业思想家 Don Tapscott 称这种 agent 为 identic AI。¹ “Identic” 是因为它承载你的身份:你的判断、偏好和权限。它不是通用助手,而是你的代表。Agent Factory 制造 AI-Native Company 的劳动力;identic AI 是每个人指挥这支劳动力的方式。
术语说明
这份论纲反复使用 3 个词。它们不能互换。
Agent Factory 是_过程_。它是由规范驱动、人在监督、agent 工具赋能的方法(Claude Code / OpenCode),用于设计、制造和部署 AI Worker。Agent Factory 是你学习运营的东西。它不是你购买的产品,而是你采用的实践。
AI-Native Company 是_产物_。它是 Agent Factory 产出的正在运行的企业:由 AI Worker 组成劳动力,由管理层协调,并由边缘上的人类指挥。在本书中,它也叫 Agentic Enterprise。
AI Worker 是_劳动力_。它们是 AI-Native Company 内部基于角色的 agent,会被招聘、分配、排班和退休。本书也把它们叫 Digital FTE 或 Digital Worker。delegate 和 Paperclip 是公司的永久部件;AI Worker 是通过它们招聘和退休的劳动力。runtime engine 是劳动力运行在其上的东西,本身不是员工。
记录系统 是_基底_。它是 AI 劳动力依托运行的权威状态,也就是保存 AI-Native Company 真相的数据库、账本和平台。
Engagement 是人类和通用 agent 之间一次有边界的交互。问题解决 engagement 直接向人类交付结果,由七项原则治理;工程师用 Claude Code 或 OpenCode 做问题解决,领域专家用 Claude Cowork 或 OpenWork。制造 engagement 为 AI-Native Company 生产一个 AI Worker,由本论纲下一节的七个不变量治理;制造始终使用 Claude Code 或 OpenCode,不管受众是谁,因为构建 Worker 本质上是 coding task。
换句话说:Factory 构建 Company;Company 雇用 Worker;Worker 依托记录系统运行。
关于后文的说明。 这份论纲区分架构不变量和参考实现。不变量 是跨系统每个版本都必须成立的结构性要求,不管哪个具体产品实现它。可以把它理解为永远不变的规则。参考实现 是 2026 年用来实现某条规则的具体产品。它是今天的最佳选择,明天可以替换。当后文命名某个产品时,不变量才是论纲,产品只是今年最合适的家具。家具会换,建筑仍在。某些架构边界,例如控制平面和执行平面的分离,本身就是不变量,即使每年实现它们的 provider 都会改变。

📚 教学辅助
查看完整演示 — Agent Factory 论纲
范式转移
| 特征 | SaaS 时代(工具) | Agent Factory 时代(劳动力) |
|---|---|---|
| 产品 | 软件工具 | AI employee |
| 价值指标 | 按席位订阅 | 按结果付费 |
| 执行模型 | 手动且可见 | 自动化且工业化 |
| 资源获取 | 人类采购工具和服务 | agent 自主购买算力、数据和服务 |
| 人类角色 | 操作者 | 监督者和验证者 |
| 集成 | 僵硬的一对一 API | Model Context Protocol(MCP) |
| 关注点 | 工作如何完成 | 工作是否完成,并且可验证地正确 |
工业化栈
- 意图: 高层蓝图,包括目标、约束、预算和权限。
- 生产引擎: 把意图转成结果。下文详细说明。
- 结果: 高保真的动作和产物,按需交付,验证准确性,并通过反馈循环持续改进。
生产引擎:从意图到结果
生产引擎是整份论纲最重要的思想。它把你想要的东西转成你得到的东西。可以把它理解为从你的指令到最终结果之间发生的一切。它不是一个可下载 app,也不是一块单独安装的软件。它是一种架构:一张蓝图和一组设计原则,用于构建 AI Worker 被创建、组合和投入工作的系统,就像真实工厂在流水线上制造产品。
类比这样运作:想象一家汽车工厂。一开始,钢材、橡胶、玻璃等原材料被送入。钢材进入焊接工位,车身框架在那里成形。然后进入喷漆工位,获得颜色。接着进入装配工位,发动机、座椅、轮胎和电子设备被安装。产线末端,一辆完成的汽车下线,经过检查,可以上路。Agent Factory 遵循完全相同的模式,只是原材料是你的意图(你想完成什么),专业工位是 AI Worker(每个处理工作的一部分),成品是经过验证的结果(真实输出,已经检查并确认)。
3 件事驱动这座工厂。Spec 是书面指令,告诉 AI Worker 要做什么。Skill 是每个 AI Worker 带到岗位上的打包能力,采用开放 Agent Skills 格式(agentskills.io),最初由 Anthropic 发布,现在已被 agent 生态广泛采用。反馈循环 是系统从结果中学习并随时间变好的方式。连接这一切的是 MCP,一种让每个 AI Worker 都能和每个工具对话的通用标准,就像真实工厂中每台设备都能插进同一种电源插座。Skill 和 MCP 共同构成工厂地板上的两个开放标准:Skill 负责能力,MCP 负责连接。底层则是记录系统,也就是公司的权威状态,Worker 在工作时从中读取并写回。
agent 作为经济参与者
今天的 agent 执行任务。明天的 agent 会参与市场。论纲以这点开场,因为它代表下一次巨大拐点:从 agent-as-tool 转向 agent-as-buyer。

想象一个 agent 被分配了高层目标:“把客户流失率降低 15%。” 它会自主购买训练模型所需的算力,为 enrich 数据谈判 API 合同,并配置云服务部署解决方案,全都在其人类 supervisor 设定的预算和权限边界内。现在真正发生动作的是信任层:授权执行(确保 agent 留在人类设定的规则内)、审计轨迹(完整记录 agent 的每个决策和交易)、责任归属(出错时谁在法律上负责),而不是能力。agent 已经能做工作;真正挑战是确保它做工作时值得信任。
当 AI Worker 成为买方时,AI-Native Company 的经济学会发生根本变化。公司不再只是消耗人类分配的资源,而是动态获取资源。算力、数据和专家服务变成 AI Worker 实时发现、评估和采购的投入。公司成为自我配置系统,同时优化任务完成、成本、速度和质量。
给构建者的含义是:从第一天起就按经济参与来设计 agent 和基础设施。agent 需要预算,而不只是权限;需要结果合同,而不只是 API key。掌握这种转移的组织会捕获下一波价值,就像从 SaaS 订阅转向结果定价的公司正在捕获这一波价值。
人在回路中
常见恐惧是:agent 替代人。证据显示相反。对多数任务来说,AI 与人类配对优于任何一方单独工作。Agent Factory 不会消除人类,而会提升人类:从操作者到监督者,从打字员到编辑,从 coder 到结果架构师。

这改变了“技术专业人士”的含义。Web 开发者或移动开发者不只是会写 React 或 Swift 的人。他们是技术专家,理解系统、数据流、API 和用户需要。在 Agent Factory 时代,这种专业能力更有价值,因为它不再消耗在手工写界面上,而是用于设计、部署并监督交付完整产品的 AI Worker。
开发者不会消失。开发者会_做更多_。
Steve Jobs 很早就找到了这种运营节奏,尽管他管理的是人类,而不是 agent。
10-80-10 规则:AI 劳动力的运营节奏
Steve Jobs 著名地遵循所谓 10-80-10 规则:用 10% 的时间设定愿景,让团队执行 80%,然后用最后 10% 回来打磨和完善。科技创业者 Dan Martell 把它拆成 10% 构思、80% 执行、10% 精炼和整合。Jobs 从亲自规定 Mac 计算器每个像素的 micromanager,成长为把中间 80% 交给优秀人才的领导者。Apple 之所以成为地球上最有价值的公司,这个转变是原因之一。
现在把“优秀人才”替换成“AI employee”,你就得到 Agent Factory 的运营节奏:
| 阶段 | Jobs 的 Apple | Agent Factory |
|---|---|---|
| 前 10%:意图 | Jobs 设定愿景和约束 | 人类定义 spec:目标、约束、预算、权限 |
| 中间 80%:执行 | Apple 团队构建产品 | AI Worker 执行:组合工具、生成 sub-agent、交付结果 |
| 最后 10%:验证 | Jobs 打磨并说“ship it” | 人类审查、改进并批准经过验证的结果 |

截至 2026 年 2 月,Cursor 报告称,其自家产品合并的 pull request 中有 35% 由运行在云 VM 上的自主 agent 产生。公司的开发者通过定义问题和审查产物来指导它们,而不是逐行指挥。Cursor CEO Michael Truell 预计一年内大多数开发工作都会呈现这种形态。³ 10-80-10 节奏不再是预测,而是前沿已经如何运行的测量。
验证界面本身也在变化。在同步 agent 时代,人类在代码编辑器中审查 diff。正在到来的 cloud-agent 时代,agent 在专用 VM 上工作数小时,然后返回_可快速审查_的产物:日志、视频录制、实时预览,而不是逐行变更。这使并行工作变得实际可行。人类无法同时阅读 12 个 diff,但能快速扫 12 个预览。节奏的最后 10% 正围绕 artifact 而不是 diff 重新设计。
这不是巧合。这个模式有效,是因为它把人类注意力放在不可替代的边界上,同时让执行在没有瓶颈的情况下扩展。前 10% 是批判性思考、上下文设定和清晰 prompting 的位置。中间 80% 是重活:总结、生成、分析、格式化。最后 10% 是人类专业能力把输出打磨成清晰、可用、高质量结果的位置。
Agent Factory 论纲已经说过:“人类定义意图。Agent 执行。人类验证结果。” 10-80-10 规则就是这句话的量化版本。它告诉每个专业人士一天将如何改变:你不再把 80% 的时间花在执行上,而是把 100% 的注意力放在只有人类能做的 20% 上:设定方向和保证质量。
内化这场转移的领导者,不只是管理 AI employee。他们会像 Jobs 管理 Apple 最优秀团队那样管理它们:开始时有清晰 spec,中间给予信任,最后坚持不妥协的标准。
注释
³ Michael Truell, “The third era of AI software development”, Cursor Blog, 2026 年 2 月 26 日。
Personal Agent 与企业接口
AI Worker 是工作被完成的方式。Identic AI 是人类越来越多地代表自己指挥、治理并接入这支劳动力的方式。Agent Factory 制造基于角色的 AI Worker,用于执行任务、协调工作流,并规模化交付经过验证的结果;但人类仍然是 principal,定义目的、价值、约束和问责。Identic AI 添加了新的个人层:一个自我主权 agent,由个人拥有而不是平台拥有,理解个人上下文、判断和偏好,并能把人类意图翻译成跨企业的委派动作。¹ 在这个模型中,AI 劳动力是执行织物,而 identic AI 是人的代表和编排层,让人类监督方向,而不是亲自执行例行工作。未来公司会运行在两个连接层上:AI 劳动力层内部的 AI Worker,以及边缘层上的 personal agent。人类在两层上设定意图并验证结果。
我们称之为双层模型:

| 层 | 它是什么 | 服务谁 | 做什么 |
|---|---|---|---|
| 边缘层 | 个人 identic agent | 个人 | 翻译人类意图,委派给 AI Worker,代表 principal 治理 |
| AI 劳动力层 | 基于角色的 AI Worker | 企业 | 执行任务,协调工作流,交付经过验证的结果 |
任何一层都不能单独工作。没有工业化劳动力支撑的 personal agent,只是没有对象可指挥的数字助手。没有边缘 personal agent 的 AI 劳动力层,又会把人类拖回手动编排。双层模型让 Agent Factory 论纲完整:核心是工业化劳动力,边缘是人类主权,spec 是二者之间的合同语言。
注释
¹ Don Tapscott, HBR IdeaCast 访谈,“With Rise of Agents, We Are Entering the World of Identic AI”,Harvard Business Review,2026 年 2 月 17 日。
通用 agent 使用的两种模式
到目前为止,论纲把通用 agent(Claude Code、OpenCode、Claude Cowork、OpenWork)当作 Agent Factory 的制造工具:人类用来设计和构建 AI Worker 的工具。这是一种模式。还有第二种模式必须命名,因为大多数专业人士会在真正交付 Worker 很久之前就生活在这种模式里。
| 模式 | 受众和工具 | 最后交付什么 | 由什么治理 |
|---|---|---|---|
| 问题解决 engagement | 工程师用 Claude Code 或 OpenCode 领域专家用 Claude Cowork 或 OpenWork | 一个即时结果 | 七项原则 |
| 制造 engagement | 任何人,始终使用 Claude Code 或 OpenCode | 一块劳动力 | 七个不变量 |

人类指挥通用 agent 是每个 engagement 的共同起点。engagement 分成两种模式。问题解决分支按受众分流:工程师使用 Claude Code 或 OpenCode,领域专家使用 Claude Cowork 或 OpenWork;但两种都汇入同一纪律(七项原则),并交付结束会话的结果。制造分支使用单一工具族:不管操作者是谁,它始终使用 Claude Code 或 OpenCode,因为构建 AI Worker 本质上是 coding task。它由七个不变量治理,输出的 AI Worker 会加入持续运行的 AI-Native Company 劳动力。
模式 1:问题解决 engagement。 开发者打开 Claude Code 重构服务。财务分析师打开 Claude Cowork 重建季度结账模型。engagement 开始,工作交付,engagement 结束。没有专门 AI Worker 被制造。通用 agent _就是_这次 engagement 的 worker,结果直接交付给人类。
问题解决 engagement 按受众分流。工程师使用 Claude Code 或 OpenCode,这些是适配 code、基础设施和系统工作的 terminal-native 工具。领域专家使用 Claude Cowork 或 OpenWork,这些是适配文档、电子表格、brief 和 review 的知识工作工具。模式相同,治理相同,两类界面家族不同。这个模式由通用 agent 问题解决七项原则治理:
- Bash is the Key。 agent 能行动,而不只是描述。
- Code as Universal Interface。 精确性来自结构化格式,例如 schema、table、code block,而不是散文。
- Verification as Core Step。 每个有意义输出在交付前都要检查。“看起来对”是失败模式。
- Small, Reversible Decomposition。 工作以原子步骤推进,每步都可撤销。
- Persisting State in Files。 对话是易失的,文件系统是持久的。重要内容要写入文件。
- Constraints and Safety。 明确权限、明确范围。自主性按任务类型逐步获得,而不是默认授予。
- Observability。 你能看到 agent 做了什么。没有黑箱,没有惊喜。

七项原则一览。P1–P5 是会话内部的工作纪律。P6(约束)定义 agent 被允许触碰什么;P7(可观测性)显示它实际做了什么。深度讲解在第 18 章。
原则是会话的运营纪律。
模式 2:制造 engagement。 制造始终锚定工程工具:Claude Code 或 OpenCode,每次都是,不管人类是谁。构建 AI Worker 本质上是 coding task,即使 Worker 工作的领域是财务、营销或法律。同一个开发者用 Claude Code spec、构建并部署代码审查 AI Worker。财务分析师通常与工程师合作,用 Claude Code spec 并部署每月月末运行的结账 Worker。通用 agent 的输出不是结果,而是生产结果的 worker。这个模式由下一节的 Agent Factory 七个不变量治理:被制造的劳动力必须遵守这些结构性规则,才会一致、可治理、耐久。不变量是公司的架构纪律。
原则治理会话。不变量治理架构。原则是行为准则。不变量是宪法。问题解决 engagement 由原则治理,因为输出是交付并结束的结果,没有持续架构要遵守。制造 engagement 由不变量治理,因为输出必须进入一支跨会话、跨 agent、跨产品周期保持一致的劳动力。
这也解释了为什么 10-80-10 规则同样适用于两种模式:不管你是指挥通用 agent 解决问题,还是构建一个以后替你解决问题的 Worker,人类时间仍然分成意图、执行和验证。
Agent Factory 的七个不变量
7 条不会改变的规则。
本节定义 AI-Native Company 的 runtime,也就是 Agent Factory 产出的架构。7 个不变量把双层模型变成可以构建的系统,以及一条能端到端触发的行动链。
没有架构的论纲只是比喻。用产品名写出来的架构又只是推销。下面 7 个不变量才是论纲。当前实现它们的具名产品只是一个实例,不是定义。
可以这样理解。Agent Factory 是构建公司的过程。产出是一家 AI-Native Company:你是 executive 和 owner,一个 delegate 是你的 chief of staff,也就是代表你、了解你的上下文、替你发声的那个 agent;一个管理层是公司运行在其上的操作系统:它招聘劳动力、分配工作、执行预算、治理每个 Worker 可以做什么,并在角色结束时让 Worker 退休。AI Worker 是交付结果的员工。Runtime engine 是每个员工运行在其上的东西。神经系统在 Worker 之间承载事件,能在崩溃后继续,并塑造流量,使劳动力在负载下仍能站住。
下面每个不变量都是关于这家公司如何运行的规则。每个具名产品都是可以替换的选择。
不变量 1:人类是 principal
主张。 每条合法行动链都源于一个人类。这个人类设定意图、定义预算、划定权限边界,并拥有结果。没有例外。这一层不能委派。
为什么必须存在。 意图不会自我生成。判断、价值、预算授权和结果问责不可转让。没有人类 principal 的系统不是自主,而是无主。
缺失时的失败。 无主系统产生无人负责的结果。责任蒸发。alignment 不可能,因为没有一个被保护 alignment 的主体。预算没有主人,结果没有裁判。
当前实现。 今天由 authored specs、approval gates、budget declarations 和 verification checkpoints 定义 principal 层。任何能把意图、权限和问责捕捉成下游系统可执行形式的机制,都满足这个不变量。
不变量 2:每个人都需要 delegate
主张。 人类无法手工把自己的意图扩展到整支劳动力。人类需要个人 agent 持有上下文、代表判断、承载权限边界,并代表自己经纪所有下游工作。
为什么必须存在。 一个人无法直接编排几十个 AI Worker。没有 delegate,principal 会被迫回到手动编排,这正是 Agent Factory 要消除的失败模式。
缺失时的失败。 人类成为瓶颈。AI 劳动力层闲置,等待人类来不及发出的指令。规模坍缩到人类打字速度。
当前实现。 我们交付的 delegate 是 OpenClaw。任何持有身份、上下文和权限边界,并能把工作经纪到管理层的 personal agent,都满足这个不变量。
不变量 3:劳动力需要管理层
主张。 一堆 AI Worker 不是一家公司。劳动力需要管理层,也就是 AI-Native Company 的操作系统。它招聘 Worker、分配工作、执行预算、审批风险、治理每个 Worker 允许做什么、记录谁以什么成本做了什么,并在角色结束时让 Worker 退休。招聘只是许多动词之一;该层的工作是劳动力全生命周期。
为什么必须存在。 协调、问责和经济纪律不是单个 agent 的涌现属性。它们需要一个层知道谁在做什么、成本是多少、什么被允许、产出了什么、出错时发生了什么。AI Worker 只有在单一层把它们变得清晰可读,也就是能力、成本、延迟和结果的单位时,才会作为劳动力变得可治理;也只有在同一层能按需退休它们时,才会变得经济。这个层对 AI-Native Company 的作用,就像操作系统对一组进程的作用:组合、调度、计费,并按策略终止。
缺失时的失败。 Worker 冲突。预算泄漏。审计轨迹碎裂。财务回答不了劳动力花了多少钱。运营回答不了劳动力产出了什么。已退休 Worker 继续运行,因为没有层负责停止它们。没人能回答发生了什么、为什么发生。
当前实现。 我们交付的管理层是 Paperclip,也就是 AI-native company 操作系统。任何能在权限边界下组合劳动力,并把 hire、assign、govern、observe、retire 暴露为可调用能力的控制平面,都满足这个不变量。
不变量 4:每个 Worker 选择自己的 engine
主张。 每个 AI Worker 都运行在某个执行 engine 上。选择按 Worker 做,而不是按公司做,以便把可靠性、成本和运营负担匹配到具体岗位需求。
为什么必须存在。 关键任务需要不能静默失败的 durable execution,例行任务不需要。强迫整支劳动力使用一个 engine,要么为岗位不需要的可靠性多付钱,要么为岗位所需可靠性付得不够。两者都会失败。
缺失时的失败。 统一 engine 选择保证了统一取舍。公司要么负担不起可靠 worker,要么不能信任便宜 worker。
当前实现。 我们交付的当前 engine 集包括 Dapr Agents、Claude Managed Agents、OpenAI Agents SDK、Cursor SDK 和 OpenClaw-native。任何满足岗位可靠性、成本和运营合同的 engine,都满足这个不变量。
不变量 5:每个 Worker 都依托记录系统运行
主张。 engine 是每个 Worker 运行_在其上_的东西;记录系统是每个 Worker 运行_所依托_的东西。每个 AI Worker 都从权威状态存储读取并写入:客户、订单、库存、合同、账本条目、工单和运营真相。Worker 依托它执行,而不是仅靠上下文发明世界。
为什么必须存在。 context window 是暂时的。记录系统是永久的。没有权威存储,agent 会幻觉事实、重复写交易、在会话之间丢失工作,并产出审计员无法还原的 artifact。记录系统把执行和听起来合理的虚构分开。它还让劳动力在事后清晰可读:Worker 的每个动作都会在一个能跨越 agent 会话、可检查、可重放、可信任的存储中留下痕迹。
缺失时的失败。 输出漂离现实。两个 Worker 因 context window 不一致而对同一客户说出不同答案。责任无法追踪,因为真相只存在于后来被丢弃的 token 里。AI-Native Company 退化成生产自信 artifact、但底下没有运营基底的生成器。
当前实现。 AI-Native Company 的现有数据库、工作流和运营平台,例如 CRM、ERP、ticketing system、data warehouse、ledger,充当记录系统。MCP 是劳动力访问这些系统的方式:每个权威存储都通过 MCP server,在策略下对任何 Worker 变得可寻址。任何持久、可寻址、受治理,并能让劳动力读写的存储,都满足这个不变量。
不变量 6:劳动力在策略下可扩展
主张。 元层把招聘暴露为可调用能力。获得授权的 agent 可以生成 prompt、provision runtime、在管理层注册新的 AI Worker,并且在权限边界内完成这一切,不需要唤醒人类。
为什么必须存在。 固定名册无法适应移动的问题。当能力缺口出现时,例如客户使用劳动力不会的语言,或 workflow 需要当前不存在的专家,劳动力必须能在 principal 设定的策略内按需扩员。否则每个缺口都会变成 ticket,系统停止移动。没有策略的扩展会失控;没有扩展的策略会冻结名册。两者都会失败。
缺失时的失败。 名册被冻结。每个新问题都需要人类。规模停止在组织结构图的边界。
当前实现。 我们交付的招聘基底是 Claude Managed Agents。任何能在运行时生成 agent 并 provision 其环境,且受权限边界限制的 managed-agent API,都满足这个不变量。
不变量 7:劳动力运行在神经系统上(权限边界内的事件、耐久性和流动)
主张。 工作自行到达,并在 Worker 之间传播,不需要人类路由。一个 schedule 到期,一个 webhook 触发,一个客户走进来,一个 Worker 完成并交给下一个 Worker,所有这些都承载在单一事件基底上。它在权限边界内唤醒 Worker,能在中途崩溃后保存流程,并塑造流量,避免一个客户的峰值饿死其他客户。劳动力有神经系统:外部触发唤醒它,内部事件协调它,耐久性保护它,流量控制保护它。
为什么必须存在。 只有在人类 prompt 后才移动的公司,不是公司,而是助手。Worker 无法在人类不介入的情况下交接的劳动力,不是劳动力,而是名册。多步运行因一次崩溃就丢工作,不是生产系统,而是 demo。一个 6 步 Worker 每步 95% 可靠性,在没有 durable execution 时只有 74% 的运行能完成;使用 step memoization 和 selective retry 后约为 99.7%。这就是交付劳动力和每 4 次丢 1 次任务的劳动力之间的差别。
缺失时的失败。 没有外部触发,系统以人类打字速度运行,AI-Native Company 的经济学退化成 copilot 的经济学。没有内部事件,Worker 不能在无人类路由的情况下协调。没有耐久性,可靠性会反向复利。没有流量控制,一个客户的流量会淹没其他客户。4 种失败模式,一个缺失基底。
当前实现。 我们交付的神经系统是 Inngest:一个承载外部触发(schedule、webhook、inbound API call)、内部事件(Worker-to-Worker handoff)、durable execution(step memoization、retry、replay)和 flow control(concurrency cap、throttling、batching)的基底。生产 AI-native CRM Day AI 正是用这种语言描述自己的 Inngest 层;创始工程师 Erik Munson 称它为产品的“神经系统”。这是市场中公司的生产语言,不是课程借来的框架。Claude Code Routines 仍然是 coding-agent 自动化的专门触发器,当事件是 code-shaped 时,它位于同一基底之前。任何在权限边界下承载内外部事件,并原生具备耐久性和流量控制的基底,都满足这个不变量。
参考栈一览
| 不变量 | 它要求什么 | 我们交付什么 | 什么可以替代它 |
|---|---|---|---|
| Principal | 人类意图、预算、边界、问责 | — | — |
| Delegate | 持有上下文和权限的 personal agent | OpenClaw | 任何会说 MCP 的 personal agent |
| 管理层 | 招聘、分配、治理、观察、退休,也就是劳动力 OS | Paperclip | 任何满足管理合同的控制平面 |
| Engine | 按岗位匹配的 per-Worker runtime | Dapr / Managed / OpenAI SDK / Cursor / native | 任何满足岗位可靠性合同的 runtime |
| 记录系统 | 劳动力读取并写入的权威存储 | 现有数据库、工作流、MCP-exposed 平台 | 任何持久、可寻址、受策略治理的存储 |
| Meta | 策略下的可调用招聘能力 | Claude Managed Agents | 任何具备 runtime provisioning 的 managed-agent API |
| 神经系统 | 权限边界下的事件、耐久和流动 | Inngest(劳动力基底);Routines(coding-agent trigger) | 任何在边界下承载事件,并具备耐久和流量控制的基底 |
7 个不变量。一条链。明天替换中间列任何具名产品,架构仍然成立,因为架构从来不是产品,而是不变量。

七不变量 runtime stack。人类设定权限边界,并可直接 prompt delegate;神经系统在该边界内唤醒 delegate。OpenClaw 把工作带给 Paperclip,Paperclip 在合适 runtime engine 上招聘、分配并治理 Worker。Worker 通过 MCP 从记录系统读取并写入。边界授权的任何 agent 都可以调用 Paperclip 扩展劳动力。替换任何 delegate、管理层、engine、事件基底或存储,链条仍然成立。
结构图显示的是层。下面的 trace 显示它们如何运动:一个客户、一个缺失能力、一个当场制造的新 AI Worker。

运行 trace。客户用 Bahasa Indonesia 写来消息。名册上没有 AI Worker 会这门语言。Paperclip 发现能力缺口,并在权限边界内调用自己的招聘 API。一个会 Bahasa 的新 AI Worker 被制造并部署。它从记录系统读取客户上下文,撰写回复,把交互日志写回,再通过 OpenClaw 把回复交给客户。没有唤醒人类。新 AI Worker 留在名册上,这次交互成为公司权威状态的一部分。
什么稳定,什么会变
| 稳定部分(不变量) | 会变化部分(实现) |
|---|---|
| 有明确权限的人类 principal | authoring 工具、审批 UI、spec 格式 |
| 边缘上的 personal delegate | delegate 产品及其继任者 |
| 具备完整劳动力生命周期的管理层 | 管理层产品及其继任者 |
| per-Worker engine 选择 | SDK、runtime、执行基底 |
| 劳动力依托运行的权威状态 | 数据库引擎、ERP/CRM/工单产品、MCP server registry |
| 策略下可扩展的劳动力 | managed-agent API、provisioning 系统 |
| 权限边界下的事件、耐久性和流动 | Routines、scheduler、webhook 框架、durable-execution 平台 |
| 规范驱动的工作定义 | spec 语言、notation、tooling |
| 指挥通用 agent engagement 的七项 operator principles | 具体 agent 产品、CLI 工具、prompt 模式、IDE 集成 |
| 基于结果的经济模型 | 定价单位、合同格式 |
| agent 作为经济参与者 | 支付轨道、责任框架 |
| 可观察、可审计的执行 | tracing backend、日志格式 |
| 层之间清晰接缝,使 vendor lock 可以移动而不破坏架构 | 哪一层承载 lock:2024 年在模型层,2026 年在 harness 层,下一步可能在 orchestrator 层 |
| 劳动力按成本、延迟、结果可读 | 财务系统、账本实现 |
| 能力封装为可移植 skill | skill 格式、registry、分发平台 |
左列是论纲,右列是 2026 年。
具名 engine 对比
4 个 engine 不互斥。严肃的 Agent Factory 可能全部使用,根据不变量 4,为不同 Worker 使用不同 engine。它们不是竞争产品,而是关于 agent 在哪里结束、基础设施从哪里开始的不同理论。
| 维度 | OpenAI Agents SDK | Claude Managed Agents | Dapr Agents | Cursor SDK |
|---|---|---|---|---|
| 主轴 | model-native harness | 全托管 runtime | durable distributed agents | harness-first cloud agent platform |
| compute plane | BYO sandbox;7 个 partner integration | Anthropic-hosted | 你的 Kubernetes cluster | Cursor Cloud VM(或本地) |
| vendor lock-in | 高(harness 针对 OpenAI 模型优化) | 完全(harness、runtime、model) | 无(Apache 2.0,CNCF) | harness 层高;底层模型无关 |
| 语言 | Python;TypeScript 进行中 | 任意(HTTP/SDK) | Python;其他待定 | TypeScript(npm install @cursor/sdk) |
| 耐久模型 | sandbox snapshot 和 rehydrate | server-side session persistence | Dapr Workflow checkpointing | 每个 task 的 cloud VM persistence |
| multi-agent | handoff、subagent | research preview | deterministic workflow + pub/sub | parallel cloud agents、subagents、artifact handoff |
选择你的 engine
不变量 4 说每个 Worker 选择自己的 engine。实践中,选择由两条轴驱动:失败有多糟糕,以及谁来运行基础设施。
| 岗位画像 | engine | 原因 |
|---|---|---|
| 不能失败 | Dapr Agents wrapping an SDK | durable execution、auto-recovery、full observability |
| 不应该失败,但不想运营 | Claude Managed Agents | 由 provider 托管和运营 |
| 不应该失败,且想要可移植性 | OpenAI Agents SDK | production-grade、self-hosted、vendor-flexible |
| 能工作就很好 | OpenClaw-native | 轻量、部署快,适合例行任务 |
| 工程 fleet,并行 cloud agent | Cursor SDK | 为并行 coding agent 设计的 harness,模型无关,并已在 Cursor 自家工程中验证 |
| 已经有一个 | 任何 Paperclip-compatible runtime | 接入你已有的东西 |
关于 harness 和 compute。 每个 engine 都有两个平面。harness 是控制平面:agent loop、model call、tool routing、approval、tracing、recovery。compute 是执行平面:sandbox,model-directed code 在其中读文件、运行命令、写产物。有些 engine 把二者融合,例如 Claude Managed Agents 用一个 API 打包二者。有些交付 harness,让你带自己的 compute,例如 OpenAI Agents SDK 可集成 E2B、Cloudflare、Daytona、Modal、Runloop、Vercel 和 Blaxel,也可以集成你自己的 container。有些假设 compute plane 是 Kubernetes,例如 Dapr Agents。这个拆分很重要:credentials 留在 harness 中,不可信的 model-generated code 留在 sandbox 中,compute plane 可以替换而不重写 agent。
Trigger 是正交选择。无论 Worker 运行在哪个 engine 上,Claude Code Routines 和 Inngest 都可以从 schedule、webhook 或 inbound API call 唤醒它,不需要重连。
Sandbox 也是正交的。无论 Worker 运行在哪个 engine 上,compute plane 都可以替换为 E2B、Cloudflare、Daytona、Modal 或你自己的 Kubernetes,而不重写 agent。
Engine 是 Worker 如何运行。它们依托什么运行,也就是公司权威状态,是不变量 5 的主题。
2026 年参考实现
本节命名的产品是我们交付的产品。论纲并不要求它们。更好的实现出现时,本小节会变化。上面的不变量不会变化。
- Delegate — OpenClaw
- 管理层 — Paperclip(把完整劳动力生命周期:hire、assign、govern、observe、retire,暴露为 callable API)
- Engine — Dapr Agents、Claude Managed Agents、OpenAI Agents SDK、Cursor SDK、OpenClaw-native。Engine 正在越来越多地吸收耐久性:Dapr Agents 通过 workflow checkpointing,Claude Managed Agents 通过 server-side sessions,OpenAI Agents SDK 通过 stateful workflows,Cursor SDK 通过每个 task 的 cloud VM persistence。论纲把这看成 engine-internal evolution,而不是单独不变量。
- Skill — Agent Skills format(agentskills.io),skill folder 遵循
SKILL.md+ 可选 scripts/references/assets,并通过 progressive disclosure 加载。 - 神经系统 — Inngest 作为劳动力事件基底:外部触发(schedule、webhook、inbound API call)、内部事件(Worker-to-Worker handoff)、durable execution(step memoization、retry、replay)和 flow control(concurrency、throttling、batching)位于同一运营边界下。Claude Code Routines 作为 coding-agent 自动化的专门触发器,在发生 code-related event 时唤醒 Claude Code。二者共存:Inngest 位于劳动力前方,Routines 位于 coding agent 前方。
招聘运行在 Claude Managed Agents 上:同一技术既作为 engine 选项之一,也作为 meta-layer,因为它能在运行时创建 agent 和环境,正是劳动力扩展成为 callable capability 的原因。
行业佐证。 2026 年 2 月,Cursor CEO 用非常接近本论纲架构的语言描述公司从 IDE 到 factory 的转向:agent fleet 像 teammate 一样工作,人类定义问题并审查 artifact,parallel cloud agents 取代逐行指导。⁴ 2026 年 5 月,The New Stack 记录了 Anthropic、OpenAI、Google、Microsoft 和 Cursor 之间同样的行业共识:model 正在成为 commodity,harness 正在成为 product。Google Cloud 首席布道师公开承认,公司已经不再在意开发者选择哪个 coding tool。⁵ 这两篇文章都说明,本论纲命名的架构接缝,也就是 principal、delegate、管理层、engine、记录系统和神经系统之间的接缝,正在生产中大规模被切分出来。Truell 描述的第三时代,是 autonomous agents 在 cloud VM 上工作数小时,人类定义问题并审查 artifact。Agent Factory 指明那个时代所需要的架构,并继续向前:一支能招聘自己专家、在外部触发下自行醒来、并作为经济参与者交易的劳动力;人类位于权限边界的两端,而不是每个 agent cycle 中。七个不变量不是预测,而是前沿所在位置的快照。
关于语言。 系统中的每个组件都是 agent 或 agent 层。OpenClaw 是 agent。Paperclip 是实现管理层的 agent。AI Worker 是 agent。但只有 AI Worker 是劳动力,也就是被招聘、分配、排班和退休的部分。OpenClaw 和 Paperclip 是公司的永久部件;AI Worker 是它们协调的劳动力。runtime engine 根本不是员工,而是劳动力运行在其上的东西。当本论纲说 AI Worker 时,意思是劳动力。当它说 agent 时,意思是楼里任何参与者,无论永久部件还是劳动力。
在确立 Agent Factory 的耐久不变量后,论纲转向这些不变量解锁的劳动力机会。
注释
⁴ 见上方注释 3。 ⁵ Matthew Burns, “Cursor's $60 billion bet is on the harness, not the model”, The New Stack, 2026 年 5 月 1 日。 ⁶ Erik Munson, Founding Engineer, Day AI,引自 “Day AI – Customer Story”, Inngest,访问于 2026 年 5 月。
劳动力机会
AI 会把工作拆成任务。有些任务会被完全自动化。但拆解也会创造新的组合:新的角色、新的业务、新的市场。这些在工作被锁在僵硬职位名称里时并不存在。
未来劳动力必须构建动态技能组合,而不是依赖固定职业路径。学会用 AI 思考、每天使用 AI 工具,并与 AI 作为数字队友协作的专业人士,不只是会熬过转变,还会在转变中繁荣。
SaaS 时代为开发者、设计师和产品经理创造了数百万岗位。Agent Factory 时代会创造更多岗位:agent designer、outcome architect、verification specialist,以及教机器本领域“正确”是什么的领域专家。这也是历史上最大的劳动力培训机会之一:到 2030 年,全球每 100 名 worker 中预计有 59 名需要再培训或技能提升,以适应新技术和新工作方式。²

同一座工厂会在每个业务职能中制造 specialist Worker。在 GTM(Go-To-Market,也就是把潜在客户变成付费客户的销售、营销和收入动作)中,Worker fleet 处理 lead enrichment、outreach sequencing、CRM hygiene、pipeline analysis、proposal generation 和 demo customization。SaaS 时代由人类 “GTM Engineer” 手工完成的工作,现在被制造成 Worker,并由人类 GTM lead 监督。同样模式会在财务(close、AR/AP、FP&A)、支持(triage、resolution、escalation)、工程(review、refactor、deploy)、HR(sourcing、screening、onboarding)、法律(review、redline、intake)中重复。每个 Worker 都通过 Paperclip 招聘,由相关职能中的人类监督,并依托该职能的记录系统运行:GTM 依托 CRM,财务依托 general ledger,支持依托 ticketing system,工程依托 code repository。不变量跨 vertical 不变。变化的只是角色定义和记录系统。
机会不是更小,而是更宽,并且奖励适应的人。
² World Economic Forum, Future of Jobs Report 2025, 2025 年 1 月。 https://www.weforum.org/press/2025/01/future-of-jobs-report-2025-78-million-new-job-opportunities-by-2030-but-urgent-upskilling-needed-to-prepare-workforces/
到 2026 年 1 月,美国数据中心建设年化达到 $420 亿,而办公室建设从峰值下降 35%。两条线已经交叉:美国现在花更多钱为数字 worker 建造工作场所,而不是为人类 worker 建造工作场所。
数据中心正在以工业规模吞噬铜和电力:单个 hyperscale AI 设施最多需要 5 万吨铜,最高可达传统数据中心的 10 倍。Meta、Google、Amazon 和 Microsoft 预计 2026 年 AI 基础设施支出超过 $6000 亿。
Agent 时代的工厂不是假设。它们正在建设中。

来源:U.S. Census Bureau, Value of Construction Put in Place Survey (SAAR)
赢家不会按卖出多少席位衡量,而会按保证多少结果衡量。
这指向哪里
在命名接下来会发生什么之前,值得标记论纲已经站在哪里。AI-Native Company 不再是前瞻抽象。到 2026 年中,个位数员工公司已经在 AI-operated workforce 之上报告十亿美元年化收入。这类公司在 3 年前并不存在有意义形态。⁸ 具体案例会有成败,有些也可能无法通过监管审查。但类别会留下。论纲预测了公司的形状,而公司已经到来。
这份论纲捍卫的是 Agent Factory 今天和近期构建的东西:软件 AI Worker,组合成 AI-Native Company,在人类介入商业的边缘进行交易。这是本文已经赢得的范围。但架构延伸得更远,收尾前值得命名 3 条轨迹。
物理 AI Worker。 构建软件 AI Worker 的同一工厂架构,会延伸到具身 worker。执行仓库工作的机器人、作为自主快递员运行的车辆、工厂车间的机器,每一个都是同一权限边界下的 AI Worker,经由同一管理层招聘,运行在驱动 actuator 而不是 API call 的 runtime engine 上。不变量不变,compute layer 增加身体。随着 embodied AI 成熟,AI-Native Company 的劳动力不会完全是数字的,它会包含由同一过程制造、同一架构治理、对同一边界负责的物理 worker。
完全自主经济 agent。 论纲开头命名了这条轨迹,本节让它成立。当 AI Worker 获得持久身份、支付轨道、声誉和合同能力后,它们不再只是公司操作的工具,而会成为自身意义上的经济参与者:从其他公司的 AI Worker 购买服务,把能力卖给需要它们的 worker,积累资本,并在没有人类逐笔介入的情况下订立协议。Agent Factory 仍然是制造过程。变化的是被制造物的自主等级。由此产生的问题,包括法律人格、责任、税收、反垄断,不是架构问题,但会变得紧迫;架构必须在这些问题到来时准备回答。
跨公司劳动力流动。 今天,一个 AI Worker 由一家公司构建并部署。随着制造层成熟,AI Worker 会变得可移植,被一家公司雇用、转移到另一家公司,甚至同时为几家公司工作。Paperclip 的 hiring API 从公司内部泛化到跨公司。不同公司的权限边界会通过合同在同一个 AI Worker 上重叠。AI Worker 的劳动力市场变成真实市场:有费率、声誉、专业化和流动率。Agent Factory 交付单位,市场负责路由。
这 3 条轨迹,具身化、自主性和流动性,是架构的延伸,不是偏离。
注释
⁸ Jodie Cook, “The 2-Person $1 Billion Company Is The Real Business Goal — And How To Do It”, Forbes, 2026 年 5 月 10 日。
不变量成立。实现会演化。论纲站得住。