2026 年应该使用哪些 AI Employees?
Agent Factory 论纲认为,未来属于能够交付结果的 AI employees。下面这五种,是你会在本书中持续使用的工具。
找到你的起点
选择你的第一个 AI employee,最简单的方法是从你是谁、你如何工作开始。两个问题就能帮你完成大半判断:你想在哪里工作(terminal、desktop app,还是 messaging app),以及你的数据在哪里(本地文件、企业系统,还是聊天工作流)?在你对工具有了感觉之后,另外两个问题会进一步细化选择:你希望 agent 有多自治,以及你的安全要求有多严格。
第一天不需要装齐五种工具。下面这张表是你的第一轮筛选:找到与你的主要工作匹配的那一行,从那里开始。这些行会有重叠(开发者也可能是 power user;团队负责人也可能是领域专家),所以请按你的主业选择。其他工具是以后再加的,不是现在就要在它们之间二选一(见文末的迁移与 fleet 演进)。
| 你是…… | 从这里开始 | 为什么 |
|---|---|---|
| 构建软件的开发者或工程师 | Claude Code + OpenClaw | Claude Code 是运行在你电脑上的通用 AI employee。OpenClaw 则把个人 AI 助手带到你的手机和消息应用中。 |
| 金融、法律、运营或其他领域的领域专家 | Claude Cowork + OpenClaw | Cowork 可以处理你的业务工作流(报告、分析、文档),不需要任何技术设置。OpenClaw 通过 WhatsApp 或 Slack 管理你的日常任务。 |
| 推动 AI adoption 的高管或团队负责人 | Claude Cowork | Cowork 连接常见办公工具(mail、drive、chat、calendar、e-signature),并自动运行定时任务。从这里开始,能先体会 AI employees 的真实手感(需要付费 Claude plan)。 |
| 设计 AI-powered systems 的产品经理或架构师 | Claude Code + Codex | Claude Code 负责通用工作和原型;当你需要围绕复杂系统设计进行重型推理时,用 Codex。 |
| 非常重视安全和数据控制的人 | Cowork、Claude Code、NanoClaw | NanoClaw 会把每个 AI employee 运行在你机器上的密封容器中。没有东西会泄漏出去。代码库足够小,你可以自己阅读和审计。 |
第一天要安装什么
**如果你是开发者:**安装 OpenClaw 和 Claude Code。从第 1 部分开始,你会同时使用它们。
**如果你是领域专家:**安装 Claude Cowork 和 OpenClaw。Cowork 运行在 Claude Desktop app 内,所以先下载 Claude Desktop;Cowork 是其中的一个标签页。不需要命令行。
**如果你是高管或团队负责人:**先只使用 Claude Cowork(在 Claude Desktop app 内)。在向团队推广之前,一个工具就足以让你获得手感。等你希望在消息应用中拥有 always-on automation 时,再加入 OpenClaw。
你的 Agent Fleet 成本
运行一支 AI employees fleet,需要管理 API 和订阅成本。大致应预期如下:
- OpenClaw 与 NanoClaw(免费 + API 成本):软件完全开源(MIT License)。不过,因为它们本地运行,却在云端处理推理,你需要按 token 支付 Anthropic、OpenAI 或 DeepSeek 的 API 成本。重度日常使用时,API credits 通常约为每月 $15 到 $40。
- **Claude Code(免费 + 订阅):**CLI 工具免费,但需要至少 $20/user/month 的 Pro Plan 订阅。降低成本的方法见第 14 章。
- **Claude Cowork(订阅):**Cowork 包含在 Anthropic 付费计划 中(Pro、Max、Team 和 Enterprise),起价约为 $20/user/month。它提供深入的桌面文件访问,不按 token 计费。**这些计划同时允许你使用 Claude Code 和 Claude Cowork。**降低成本的方法见第 14 章。
- **Codex(订阅/API):**OpenAI 的 cloud-mode engineering environments 需要 付费 ChatGPT plan(Plus 及以上)或 API 使用量;具体成本会随系统架构任务的复杂度而增加。
General Agents
Cowork:你的 Enterprise AI Employee
Cowork 是 Anthropic 面向不在 terminal 中工作的 business professionals 的 AI employee。它运行在 macOS 和 Windows 上的 Claude Desktop app 内。
**可以把它理解为:**一个知识丰富的同事,替你处理那些你总是没时间做的工作:生成报告、分析文档、整理文件、起草演示文稿,以及管理周期性任务。它可以连接常见办公工具(mail、drive、chat、calendar、e-signature、spreadsheets、slides)。Connector 的可用性正在快速提升,但实际使用时仍取决于你的 plan、管理员配置,以及组织启用了哪些 plugins。不要把 Cowork 看成一个固定 app;更准确地说,它是一个 enterprise AI surface。团队连接到它的系统越多,它就越有用。
Anthropic 已经发布了重要的企业升级:private plugin marketplaces(让公司精确控制可用能力)、面向 HR、finance、engineering、legal 和 operations 的 department-specific plugins,以及 /schedule 命令,用来设置自动运行的任务,例如每周一早上的竞品分析。
第 3 部分会讲 business-domain workflows(finance、legal、marketing、operations),也就是 Cowork 原本就为之设计的工作。
Claude Code:你的 All-Purpose General Agent
Claude Code 由 Anthropic 构建,运行在你的电脑上。虽然名字里有 Code,但它做的远不止写代码。Anthropic 已经把底层框架从「Claude Code SDK」更名为 Claude Agent SDK,因为团队们正在用它做研究、视频制作、数据分析、记笔记,以及几十种非编码任务。
**可以把它理解为:**一个通用 agent,能完成你在电脑上可以完成的任何事情,只是更快。用自然语言给它一个任务(分析这张 spreadsheet、整理这些文件、研究这个主题、构建这个 feature),它会规划步骤、执行步骤,并把结果展示给你。它会读取你的文件、运行命令、管理代码,甚至可以把子任务委派给并行工作的专门助手。
Claude Code 是你将在本书中主要使用的工具。它的 skills system(名为 SKILL.md 的可复用指令文件)以及生成专门 sub-employees 的能力,是 Agent Factory 方法的构建块。
第 16 章会介绍以 Claude Code 为引擎的 Spec-Driven Development。你会在本书每一部分中使用它。
Codex:你的 Power Engineering AI Employee
Codex 是 OpenAI 面向困难工程问题的 AI general agent。它有两种模式:一种是 cloud mode,在隔离环境中完全自主工作(通常每个任务几分钟到半小时);另一种是在你本机运行的 command-line tool。
**可以把它理解为:**遇到最难工作时请来的专家。Claude Code 处理日常工作,而 Codex 面向复杂推理:设计需要深度思考的系统架构。它的最新模型结合了前沿编码能力和高级推理能力,并且正在从代码扩展到更广泛的知识工作。
在 cloud mode 中,你描述想要什么,Codex 会在密封 sandbox 中自主规划、构建、测试并迭代,直到工作通过你的测试。你可以并行运行多个任务,每个任务都有自己的隔离环境。
当任务工程含量高、范围清晰并且可测试时,使用 Codex:大型重构、迁移、架构 spike、跨大型 repo 的 debugging,或能从隔离环境中受益的并行实现工作。当你想让 agent 端到端处理一项重要软件任务,而不是只在单个文件里补全代码时,就该考虑它。
Personal AI Employees
OpenClaw:你的 Personal AI Employee
OpenClaw 由 Peter Steinberger 创建,并由一批重要赞助方支持(包括 OpenAI 和 Vercel)。上线几个月内,OpenClaw 就成为 GitHub 上 star 增长最快的软件项目之一,吸引了数十万 stars。
**可以把它理解为:**一个不知疲倦的个人助理,连接到你的消息应用。它整理邮件、管理日历、预订航班、处理保险文书,并通过你已经使用的主要消息应用运行你教给它的任何日常任务:WhatsApp、Telegram、Discord、Slack、Signal、iMessage。
OpenClaw 完全开源(MIT license)。你在自己的机器上运行它,选择自己的 AI model(Claude、GPT、DeepSeek 或其他),并用 ClawHub marketplace 上数千个社区构建的 skills 扩展它。它的 persona 由一个 Markdown prompt file(SOUL.md)塑造,也就是你将在本书中学习的同一种 spec-writing format。
第 56 章会带你用 OpenClaw 设置你的第一个 AI employee。
NanoClaw:你的 Secure AI Employee
NanoClaw 是 OpenClaw 的轻量、安全优先替代方案。OpenClaw 接近 50 万行代码,而 NanoClaw 用一个小到可以阅读和理解的代码库,提供同样的核心体验:运行在消息应用中的 AI assistant。
**可以把它理解为:**带锁门的 OpenClaw。每个 AI employee 都运行在你机器上的独立容器里:一个隔离环境,只能看到你明确允许的文件;除非你授权,否则没有网络访问。隔离是真实的,不只是一个软件设置。NanoClaw 默认在 macOS、Linux 和 WSL2 上使用 Docker containers;macOS 上也可以使用 OS-level Apple Container isolation。
NanoClaw 连接主要消息应用(WhatsApp、Telegram、Slack、Discord 等)。它有 persistent memory 和 scheduled jobs(日报、周报、pipeline monitoring),并直接运行在 Claude Agent SDK 上,也就是你会在第 6 部分学习构建的同一个框架。
第 6 部分会教你使用支撑 NanoClaw 的同一个框架,构建自定义 AI employees。
安全与隐私深入说明(尤其适合 NanoClaw 用户)
安全仍然是 2026 年的首要关切之一。NanoClaw 的 container approach(没有明确授权就没有 outbound traffic)使它最适合 IP 敏感工作;代码库也足够小,可以自行审计。OpenClaw 提供本地运行的灵活性,但默认使用 cloud models(如需零云依赖,可使用 DeepSeek local)。Claude Cowork 和 Code 运行在 Anthropic 的安全环境中,具备企业控制能力(private plugins、audit logs),但不要把 raw source 暴露给 provider。对受监管团队(finance、healthcare)来说,可将 NanoClaw 与 air-gapped models 结合使用。
你在本书中的旅程
| 书中部分 | 你正在学习什么 | 主要 AI Employee | 辅助工具 |
|---|---|---|---|
| 第 1 部分:基础 | AI employees 是什么,以及如何与它们协作 | Claude Code | OpenClaw |
| 第 2 部分:Workflow Primitives | 文件处理、数据抽取、版本控制 | Claude Code | 无 |
| 第 3 部分:Business Domains | 金融、法律、营销、运营工作流 | Claude Cowork | Claude Code |
| 第 4 部分:Natural Language Programming | TypeScript、Python 开发、测试、debugging | Claude Code | Codex |
| 第 5 部分:构建 OpenClaw Apps | 构建并交付你自己的 OpenClaw-based apps | OpenClaw | Claude Code |
| 第 6 部分:构建 Agent Factories | 框架、tool protocols、databases、evaluation | Claude Code | NanoClaw |
并排对比
这五种工具对应的是不同工作,不是彼此排名。下表从六个实践维度比较它们:主要 interface、deployment model、autonomy level、security posture、openness,以及理想用户。正确选择不只取决于 model quality,更取决于 agent 在哪里运行、能触达哪些系统,以及你希望监督到什么程度。
| Claude Cowork | Claude Code | Codex | OpenClaw | NanoClaw | |
|---|---|---|---|---|---|
| 类别 | General Agent | General Agent | General Agent | Personal AI Employee | Personal AI Employee |
| 一句话说明 | 面向业务工作的 enterprise AI | 运行在你电脑上的通用 AI | 面向困难工程的 power AI | 运行在消息应用中的 personal AI | 密封容器中的 secure AI |
| 最适合 | Business professionals | Developers 和 power users | 复杂 coding 与 architecture | 每个人 | Security-conscious teams |
| 你通过什么与它沟通 | Claude Desktop app | 你电脑上的 terminal 或 code editor | Terminal、code editor 或 web app | WhatsApp、Telegram、Discord、Slack 等 | WhatsApp、Telegram、Slack、Discord 等 |
| 开源吗? | 否 | 否 | 仅本地工具 | 是(MIT license) | 是(MIT license) |
| 由谁支持 | Anthropic | Anthropic | OpenAI | 主要赞助方(包括 OpenAI、Vercel) | 社区,基于 Claude Agent SDK |
取舍与真实世界性能说明
没有单个 agent 能赢下所有场景。以下是 2026 年初期用户报告的定性取舍:
- Claude Code 在交互速度和逐步推理上领先,尤其适合多文件重构,但用于一次性任务时可能显得有些「话多」。
- Codex 擅长 long-horizon planning 和 cloud mode 下的并行子任务,但本地 CLI mode 的延迟不如 Claude Code。
- OpenClaw 依靠庞大的 community-skill ecosystem,在 always-on personal automation 上表现突出,但要达到 Claude Code 开箱即用的可靠性,需要更多 prompt engineering。
- NanoClaw 用一部分速度换取更严格的安全性(没有明确授权就不会发起网络调用),因此非常适合受监管行业。
- Cowork 在非技术工作流(spreadsheets、mail、scheduled automation)上占优,但没有 Claude Code 或 Codex 那样深入理解代码的能力。
成本会随用量变化:一套重度 multi-agent setup 每月可能达到几十美元;把 personal-agent layer 放到 DeepSeek 等经济模型上,可以降低成本。请自己测试这些取舍;很多读者会把两套方案并排运行几周,再做最终选择。
大图景:你的 Agent Fleet
没有人只使用一个 AI employee。2026 年最有效的配置是一支 fleet:General Agents 处理你的日常工作,Personal AI Employees 在消息应用和业务工作流中自主运行。
fleet 并不意味着每天使用每一个工具。实践中,大多数人会有一个 daily driver 和一个 specialist:例如 Claude Code 加 OpenClaw,或 Cowork 加 NanoClaw,或 Claude Code 加 Codex。目标不是收集工具。目标是覆盖:一个 agent 负责你的默认工作流,另一个 agent 负责默认工具不适合做的工作。
General Agents 是你使用的东西。Personal AI Employees 是你构建并部署的东西,最终也会成为你出售的东西。本书会教你两面:今天如何最大化利用 Claude Code、Cowork 和 Codex;以及如何用 OpenClaw 和 NanoClaw 构建别人愿意付费使用的自有 Digital FTEs。
迁移与 Fleet 演进
下面是一支 fleet 常见的成长时间线。第 1 天:OpenClaw 加 Claude Code 或 Cowork。第 3 个月:为困难工程任务加入 Codex。第 6 个月:为敏感任务引入 NanoClaw,或开始通过 SKILL.md 和 SOUL.md 构建自定义 agents。
迁移建议:在 agents 之间导出和导入 SKILL.md patterns;用 ClawHub community skills 作为桥梁;每周监控 token spend(第 14 章会讲 optimization scripts)。读者报告称,将多个 agents 组合后会获得明显生产力提升,但要避免 tool sprawl:除非你在为客户构建,否则核心工具控制在四到五个以内。
核心 Fleet 之外:探索替代方案
虽然 Claude Code、Cowork 和 NanoClaw 构成了坚实基础,但 2026 年的 agent landscape 远比这更丰富。Gemini CLI、Qwen Code、OpenAI Agents SDK、Claude Agent SDK 等开源框架,可以为复杂 orchestration 提供 multi-agent fleets;如果配合 DeepSeek 或 Qwen 等模型,成本往往更低。No-code 和 low-code builders(Vellum、Microsoft Copilot Studio、Zapier Central、Salesforce Agentforce)让非技术团队不用 SDK 或 terminal 也能更快部署 agents。
对纯 open-model 用户来说,基于 Llama、DeepSeek、Mistral 或 Gemma 的工具可以提供完全本地或 self-hosted 的选项,零云依赖;当隐私比速度更重要时,这非常理想。本书聚焦 Claude Code 及其配套工具,因为它们今天能为大多数读者带来最高杠杆;但你可以每个季度尝试一种替代方案,让自己的 fleet 更能适应未来。
最后更新:2026 年 3 月