Skip to main content

2026 年应该使用哪些 AI Employees?

Agent Factory 论纲认为,未来属于能够交付结果的 AI employees。下面这五种,是你会在本书中持续使用的工具。


找到你的起点

选择你的第一个 AI employee,最简单的方法是从你是谁、你如何工作开始。两个问题就能帮你完成大半判断:你想在哪里工作(terminal、desktop app,还是 messaging app),以及你的数据在哪里(本地文件、企业系统,还是聊天工作流)?在你对工具有了感觉之后,另外两个问题会进一步细化选择:你希望 agent 有多自治,以及你的安全要求有多严格。

第一天不需要装齐五种工具。下面这张表是你的第一轮筛选:找到与你的主要工作匹配的那一行,从那里开始。这些行会有重叠(开发者也可能是 power user;团队负责人也可能是领域专家),所以请按你的主业选择。其他工具是以后再加的,不是现在就要在它们之间二选一(见文末的迁移与 fleet 演进)。

你是……从这里开始为什么
构建软件的开发者或工程师Claude Code + OpenClawClaude Code 是运行在你电脑上的通用 AI employee。OpenClaw 则把个人 AI 助手带到你的手机和消息应用中。
金融、法律、运营或其他领域的领域专家Claude Cowork + OpenClawCowork 可以处理你的业务工作流(报告、分析、文档),不需要任何技术设置。OpenClaw 通过 WhatsApp 或 Slack 管理你的日常任务。
推动 AI adoption 的高管或团队负责人Claude CoworkCowork 连接常见办公工具(mail、drive、chat、calendar、e-signature),并自动运行定时任务。从这里开始,能先体会 AI employees 的真实手感(需要付费 Claude plan)。
设计 AI-powered systems 的产品经理或架构师Claude Code + CodexClaude Code 负责通用工作和原型;当你需要围绕复杂系统设计进行重型推理时,用 Codex。
非常重视安全和数据控制的人Cowork、Claude Code、NanoClawNanoClaw 会把每个 AI employee 运行在你机器上的密封容器中。没有东西会泄漏出去。代码库足够小,你可以自己阅读和审计。

第一天要安装什么

**如果你是开发者:**安装 OpenClawClaude Code。从第 1 部分开始,你会同时使用它们。

**如果你是领域专家:**安装 Claude CoworkOpenClaw。Cowork 运行在 Claude Desktop app 内,所以先下载 Claude Desktop;Cowork 是其中的一个标签页。不需要命令行。

**如果你是高管或团队负责人:**先只使用 Claude Cowork(在 Claude Desktop app 内)。在向团队推广之前,一个工具就足以让你获得手感。等你希望在消息应用中拥有 always-on automation 时,再加入 OpenClaw。


你的 Agent Fleet 成本

运行一支 AI employees fleet,需要管理 API 和订阅成本。大致应预期如下:

  • OpenClaw 与 NanoClaw(免费 + API 成本):软件完全开源(MIT License)。不过,因为它们本地运行,却在云端处理推理,你需要按 token 支付 AnthropicOpenAIDeepSeek 的 API 成本。重度日常使用时,API credits 通常约为每月 $15 到 $40
  • **Claude Code(免费 + 订阅):**CLI 工具免费,但需要至少 $20/user/monthPro Plan 订阅。降低成本的方法见第 14 章。
  • **Claude Cowork(订阅):**Cowork 包含在 Anthropic 付费计划 中(Pro、Max、Team 和 Enterprise),起价约为 $20/user/month。它提供深入的桌面文件访问,不按 token 计费。**这些计划同时允许你使用 Claude Code 和 Claude Cowork。**降低成本的方法见第 14 章。
  • **Codex(订阅/API):**OpenAI 的 cloud-mode engineering environments 需要 付费 ChatGPT plan(Plus 及以上)或 API 使用量;具体成本会随系统架构任务的复杂度而增加。

General Agents

Cowork:你的 Enterprise AI Employee

Cowork 是 Anthropic 面向不在 terminal 中工作的 business professionals 的 AI employee。它运行在 macOS 和 Windows 上的 Claude Desktop app 内。

**可以把它理解为:**一个知识丰富的同事,替你处理那些你总是没时间做的工作:生成报告、分析文档、整理文件、起草演示文稿,以及管理周期性任务。它可以连接常见办公工具(mail、drive、chat、calendar、e-signature、spreadsheets、slides)。Connector 的可用性正在快速提升,但实际使用时仍取决于你的 plan、管理员配置,以及组织启用了哪些 plugins。不要把 Cowork 看成一个固定 app;更准确地说,它是一个 enterprise AI surface。团队连接到它的系统越多,它就越有用。

Anthropic 已经发布了重要的企业升级:private plugin marketplaces(让公司精确控制可用能力)、面向 HR、finance、engineering、legal 和 operations 的 department-specific plugins,以及 /schedule 命令,用来设置自动运行的任务,例如每周一早上的竞品分析。

第 3 部分会讲 business-domain workflows(finance、legal、marketing、operations),也就是 Cowork 原本就为之设计的工作。


Claude Code:你的 All-Purpose General Agent

Claude Code 由 Anthropic 构建,运行在你的电脑上。虽然名字里有 Code,但它做的远不止写代码。Anthropic 已经把底层框架从「Claude Code SDK」更名为 Claude Agent SDK,因为团队们正在用它做研究、视频制作、数据分析、记笔记,以及几十种非编码任务。

**可以把它理解为:**一个通用 agent,能完成你在电脑上可以完成的任何事情,只是更快。用自然语言给它一个任务(分析这张 spreadsheet、整理这些文件、研究这个主题、构建这个 feature),它会规划步骤、执行步骤,并把结果展示给你。它会读取你的文件、运行命令、管理代码,甚至可以把子任务委派给并行工作的专门助手。

Claude Code 是你将在本书中主要使用的工具。它的 skills system(名为 SKILL.md 的可复用指令文件)以及生成专门 sub-employees 的能力,是 Agent Factory 方法的构建块。

第 16 章会介绍以 Claude Code 为引擎的 Spec-Driven Development。你会在本书每一部分中使用它。


Codex:你的 Power Engineering AI Employee

Codex 是 OpenAI 面向困难工程问题的 AI general agent。它有两种模式:一种是 cloud mode,在隔离环境中完全自主工作(通常每个任务几分钟到半小时);另一种是在你本机运行的 command-line tool。

**可以把它理解为:**遇到最难工作时请来的专家。Claude Code 处理日常工作,而 Codex 面向复杂推理:设计需要深度思考的系统架构。它的最新模型结合了前沿编码能力和高级推理能力,并且正在从代码扩展到更广泛的知识工作。

在 cloud mode 中,你描述想要什么,Codex 会在密封 sandbox 中自主规划、构建、测试并迭代,直到工作通过你的测试。你可以并行运行多个任务,每个任务都有自己的隔离环境。

当任务工程含量高、范围清晰并且可测试时,使用 Codex:大型重构、迁移、架构 spike、跨大型 repo 的 debugging,或能从隔离环境中受益的并行实现工作。当你想让 agent 端到端处理一项重要软件任务,而不是只在单个文件里补全代码时,就该考虑它。


Personal AI Employees

OpenClaw:你的 Personal AI Employee

OpenClaw 由 Peter Steinberger 创建,并由一批重要赞助方支持(包括 OpenAI 和 Vercel)。上线几个月内,OpenClaw 就成为 GitHub 上 star 增长最快的软件项目之一,吸引了数十万 stars。

**可以把它理解为:**一个不知疲倦的个人助理,连接到你的消息应用。它整理邮件、管理日历、预订航班、处理保险文书,并通过你已经使用的主要消息应用运行你教给它的任何日常任务:WhatsApp、Telegram、Discord、Slack、Signal、iMessage。

OpenClaw 完全开源(MIT license)。你在自己的机器上运行它,选择自己的 AI model(Claude、GPT、DeepSeek 或其他),并用 ClawHub marketplace 上数千个社区构建的 skills 扩展它。它的 persona 由一个 Markdown prompt file(SOUL.md)塑造,也就是你将在本书中学习的同一种 spec-writing format。

第 56 章会带你用 OpenClaw 设置你的第一个 AI employee。


NanoClaw:你的 Secure AI Employee

NanoClaw 是 OpenClaw 的轻量、安全优先替代方案。OpenClaw 接近 50 万行代码,而 NanoClaw 用一个小到可以阅读和理解的代码库,提供同样的核心体验:运行在消息应用中的 AI assistant。

**可以把它理解为:**带锁门的 OpenClaw。每个 AI employee 都运行在你机器上的独立容器里:一个隔离环境,只能看到你明确允许的文件;除非你授权,否则没有网络访问。隔离是真实的,不只是一个软件设置。NanoClaw 默认在 macOS、Linux 和 WSL2 上使用 Docker containers;macOS 上也可以使用 OS-level Apple Container isolation。

NanoClaw 连接主要消息应用(WhatsApp、Telegram、Slack、Discord 等)。它有 persistent memory 和 scheduled jobs(日报、周报、pipeline monitoring),并直接运行在 Claude Agent SDK 上,也就是你会在第 6 部分学习构建的同一个框架。

第 6 部分会教你使用支撑 NanoClaw 的同一个框架,构建自定义 AI employees。


安全与隐私深入说明(尤其适合 NanoClaw 用户)

安全仍然是 2026 年的首要关切之一。NanoClaw 的 container approach(没有明确授权就没有 outbound traffic)使它最适合 IP 敏感工作;代码库也足够小,可以自行审计。OpenClaw 提供本地运行的灵活性,但默认使用 cloud models(如需零云依赖,可使用 DeepSeek local)。Claude Cowork 和 Code 运行在 Anthropic 的安全环境中,具备企业控制能力(private plugins、audit logs),但不要把 raw source 暴露给 provider。对受监管团队(finance、healthcare)来说,可将 NanoClaw 与 air-gapped models 结合使用。


你在本书中的旅程

书中部分你正在学习什么主要 AI Employee辅助工具
第 1 部分:基础AI employees 是什么,以及如何与它们协作Claude CodeOpenClaw
第 2 部分:Workflow Primitives文件处理、数据抽取、版本控制Claude Code
第 3 部分:Business Domains金融、法律、营销、运营工作流Claude CoworkClaude Code
第 4 部分:Natural Language ProgrammingTypeScript、Python 开发、测试、debuggingClaude CodeCodex
第 5 部分:构建 OpenClaw Apps构建并交付你自己的 OpenClaw-based appsOpenClawClaude Code
第 6 部分:构建 Agent Factories框架、tool protocols、databases、evaluationClaude CodeNanoClaw

并排对比

这五种工具对应的是不同工作,不是彼此排名。下表从六个实践维度比较它们:主要 interface、deployment model、autonomy level、security posture、openness,以及理想用户。正确选择不只取决于 model quality,更取决于 agent 在哪里运行、能触达哪些系统,以及你希望监督到什么程度。

Claude CoworkClaude CodeCodexOpenClawNanoClaw
类别General AgentGeneral AgentGeneral AgentPersonal AI EmployeePersonal AI Employee
一句话说明面向业务工作的 enterprise AI运行在你电脑上的通用 AI面向困难工程的 power AI运行在消息应用中的 personal AI密封容器中的 secure AI
最适合Business professionalsDevelopers 和 power users复杂 coding 与 architecture每个人Security-conscious teams
你通过什么与它沟通Claude Desktop app你电脑上的 terminal 或 code editorTerminal、code editor 或 web appWhatsApp、Telegram、Discord、Slack 等WhatsApp、Telegram、Slack、Discord 等
开源吗?仅本地工具是(MIT license)是(MIT license)
由谁支持AnthropicAnthropicOpenAI主要赞助方(包括 OpenAI、Vercel)社区,基于 Claude Agent SDK

取舍与真实世界性能说明

没有单个 agent 能赢下所有场景。以下是 2026 年初期用户报告的定性取舍:

  • Claude Code 在交互速度和逐步推理上领先,尤其适合多文件重构,但用于一次性任务时可能显得有些「话多」。
  • Codex 擅长 long-horizon planning 和 cloud mode 下的并行子任务,但本地 CLI mode 的延迟不如 Claude Code。
  • OpenClaw 依靠庞大的 community-skill ecosystem,在 always-on personal automation 上表现突出,但要达到 Claude Code 开箱即用的可靠性,需要更多 prompt engineering。
  • NanoClaw 用一部分速度换取更严格的安全性(没有明确授权就不会发起网络调用),因此非常适合受监管行业。
  • Cowork 在非技术工作流(spreadsheets、mail、scheduled automation)上占优,但没有 Claude Code 或 Codex 那样深入理解代码的能力。

成本会随用量变化:一套重度 multi-agent setup 每月可能达到几十美元;把 personal-agent layer 放到 DeepSeek 等经济模型上,可以降低成本。请自己测试这些取舍;很多读者会把两套方案并排运行几周,再做最终选择。


大图景:你的 Agent Fleet

没有人只使用一个 AI employee。2026 年最有效的配置是一支 fleet:General Agents 处理你的日常工作,Personal AI Employees 在消息应用和业务工作流中自主运行。

fleet 并不意味着每天使用每一个工具。实践中,大多数人会有一个 daily driver 和一个 specialist:例如 Claude Code 加 OpenClaw,或 Cowork 加 NanoClaw,或 Claude Code 加 Codex。目标不是收集工具。目标是覆盖:一个 agent 负责你的默认工作流,另一个 agent 负责默认工具不适合做的工作。

General Agents 是你使用的东西。Personal AI Employees 是你构建并部署的东西,最终也会成为你出售的东西。本书会教你两面:今天如何最大化利用 Claude Code、Cowork 和 Codex;以及如何用 OpenClaw 和 NanoClaw 构建别人愿意付费使用的自有 Digital FTEs。


迁移与 Fleet 演进

下面是一支 fleet 常见的成长时间线。第 1 天:OpenClaw 加 Claude Code 或 Cowork。第 3 个月:为困难工程任务加入 Codex。第 6 个月:为敏感任务引入 NanoClaw,或开始通过 SKILL.md 和 SOUL.md 构建自定义 agents。

迁移建议:在 agents 之间导出和导入 SKILL.md patterns;用 ClawHub community skills 作为桥梁;每周监控 token spend(第 14 章会讲 optimization scripts)。读者报告称,将多个 agents 组合后会获得明显生产力提升,但要避免 tool sprawl:除非你在为客户构建,否则核心工具控制在四到五个以内。


核心 Fleet 之外:探索替代方案

虽然 Claude Code、Cowork 和 NanoClaw 构成了坚实基础,但 2026 年的 agent landscape 远比这更丰富。Gemini CLI、Qwen Code、OpenAI Agents SDK、Claude Agent SDK 等开源框架,可以为复杂 orchestration 提供 multi-agent fleets;如果配合 DeepSeek 或 Qwen 等模型,成本往往更低。No-code 和 low-code builders(Vellum、Microsoft Copilot Studio、Zapier Central、Salesforce Agentforce)让非技术团队不用 SDK 或 terminal 也能更快部署 agents。

对纯 open-model 用户来说,基于 Llama、DeepSeek、Mistral 或 Gemma 的工具可以提供完全本地或 self-hosted 的选项,零云依赖;当隐私比速度更重要时,这非常理想。本书聚焦 Claude Code 及其配套工具,因为它们今天能为大多数读者带来最高杠杆;但你可以每个季度尝试一种替代方案,让自己的 fleet 更能适应未来。

最后更新:2026 年 3 月