Skip to main content

从哪里开始:用几天成为 Agentic AI Engineer,而不是用几个月

你没有几个月时间来学习 AI。好消息是:你也不需要几个月。

这一节是从初学者走到能够交付的 Agentic AI Engineer 的最短路径。衡量单位是天,不是学期。

  • 大约 6 小时即可开始产出。 基础课程(课程 1–2)加上你的第一门模式课程(课程 3、4 或 7)。
  • 一个周末交付你的第一个 Digital FTE。 从课程 7 到课程 9,端到端完成。
  • 用一个月专注的夜晚熟悉完整 Agent Factory 技术栈。 学完全部 16 门课程,用 evals 管控,并部署到云端。

为什么这套方法有效

任何曾经在背景不足的情况下加入一份新工作并撑下来的人,都知道这个模式。第一,先获得工作的整体图景。第二,找出真正做事时最关键的少数主题。第三,学习每个主题中日常最常用的 80%,然后开始工作,在实践中补齐剩下的部分,同时把参考资料放在手边。在这本书里,那份参考资料就是书中的每一章;每一章都写成了你在遇到缺口时可以回来查阅的材料。

三步教学法:先总览,再找出真正重要的内容,然后覆盖关键的 80%,一边交付一边通过真实使用补齐剩下部分

如果一开始就试图学完每个主题的每个细节,你会花掉几个月。还没交付任何东西,就已经耗尽精力。我们的教学法建立在相反的理念上:先覆盖关键的 80%,让你开始工作,再让剩下的内容通过真实使用逐步补齐。本节中的每一门速成课都是按这个思路设计的。

关于本书的说明。 本节的速成课会让你很快开始工作。书中的章节则是你课后的参考资料;它们是为真实工作中出现缺口时回头查阅而写的。

从论纲开始

先阅读 论纲。它有两个版本:一个面向技术和商业专业人士,一个面向完全初学者。这样,无论背景如何,每个人都能跟上。读完论纲后,接下来是 基础课程:关于 prompting 的 课程 1,以及关于思考方式的 课程 2。每位读者都先完成这两门课,再选择自己的模式。

你需要的心智模型是:AI 时代的工作发生在三层中。你使用 general agents 解决问题。你构建 AI Workers 来完成专门工作。你把这些 Workers 组合成 AI-Native Companies。每一次专业协作都以同一种方式开始:由人来指挥一个 general agent。唯一的问题是选择哪一个 agent,而这取决于你想完成什么。

一个命名说明。 在本书中,AI WorkerDigital FTEAI Employee 指的是同一个想法:一个在人工定义的政策之下完成真实工作的专门化 agentic system。强调商业价值时,我们使用 Digital FTE;强调实现时,我们使用 AI Worker;强调它在公司里的角色时,我们使用 AI Employee。如果遇到其他不熟悉的术语,请随时查阅 术语表

你的旅程

从你现在的位置,到本节将带你到达的位置,路线如下:

你的旅程:从初学者到 AI-Native Company Architect,共六个阶段

你不必走完整条路。大多数读者会停在第 3 或第 4 阶段,而这已经足以支撑严肃的职业发展或第一个创业项目。如果你想继续,完整路径也在那里。

选择你的模式

论纲中的 general agent 使用的两种模式 一节,描述了人们实际使用通用 agent 的两种方式。模式 1 适合想用 AI 帮自己完成工作的人。模式 2 适合想构建能够替自己完成工作的 AI 的人。「制造」这个标签听起来很工业化,事实也确实如此:构建 Workers 和使用 Workers 是不同的学科。

模式 1 与模式 2:模式 1 中 agent 做工作;模式 2 中 agent 构建一个 Worker,由 Worker 做工作

模式 1:问题解决模式 2:制造
如果你想……就选它让 AI 帮助你更快完成工作构建替你完成工作的 AI Workers
适合谁任何人:工程师或知识工作者工程师,或与工程师配对的知识工作者
你的工具Claude Code/OpenCode Claude Cowork/OpenWorkClaude Code/OpenCode 用于构建;课程页面先教你自己阅读的概念,然后你再让 agent 去构建
从哪里开始课程 3(工程师)或课程 4(知识工作者)课程 7:构建 AI Agents
你产出什么已完成的工作一个能够自行产出工作的 Worker
由什么治理问题解决七原则Agent Factory 的七个不变量

关于模式 1 的说明。 如果你想把模式 1 推得更远,部署一个能够独立运行日常工作流的个人 AI 助手,请在原则课程之后继续学习 OpenClaw 与 General Agents(课程 6)。

关于模式 2 的说明。 general agent 的输出不是最终结果;它产出的 Worker 才会持续产生结果。开发者使用 Claude Code 来编写规格、构建并部署一个代码审查 Worker。财务分析师与工程师配对,使用 Claude Code 来编写规格,构建一个每月月末运行的结账流程 Worker。工具相同,纪律相同,领域不同。

你的起步路径

如果模式选择器仍然显得抽象,下面是同一个决定的完全具体版本:选择与你匹配的那一行,从最左边的课程开始。每条路径都从通用基础课程(课程 1–2)开始。

你是……你的起步路径第一个里程碑
完全初学者论纲 → 课程 1(Prompting)→ 课程 2(Thinking)基础打好;接下来选择下面的一种模式
知识工作者基础课程(课程 1–2)→ 课程 4(Cowork)→ 课程 5(原则)用 AI 交付真实的知识工作
工程师基础课程(课程 1–2)→ 课程 3(Claude Code)→ 课程 7 → 课程 8(FTE)交付你的第一个 Digital FTE
劳动力构建者工程师路径,然后课程 10(Paperclip)→ 课程 13(Evals)→ 课程 14(Deploy)一个受治理并部署到云端的 AI workforce

课程

交付一个 Digital FTE 的最快路径:基础课程(课程 1–2)→ 课程 3 → 课程 7 → 课程 8 → 课程 13(读者路径)。 大约需要 12 小时的专注工作。剩余课程会把这个 Digital FTE 变成受治理的 workforce,但你不需要它们也能交付第一个。

**按深度估算总时间:**模式 1(用 AI 产生生产力)约 5 小时 · 模式 2 最小路径(第一个 Digital FTE)约 12 小时 · 模式 2 完整路径(受治理 workforce)约 25 小时 · 完整掌握 Agent Factory 约 45 小时(包含云部署课程)。

在深入之前,所有人都有两个共同前提:现代 AI prompting,以及在 AI 时代 学习如何思考。之后,路径会按模式分开。

基础课程(所有人)

  1. 2026 年 AI Prompting — 一门 45 分钟、13 个概念的入门课,讲解如何在 2026 年有效使用 ChatGPT、Claude 和 Gemini:上下文、推理模式、deep research、多模态,以及 AI desktop apps。它覆盖本书每一章默认你已经掌握的机制。

  2. AI 时代如何思考正在开发中。 这是一套认知纪律,用来区分真正从 AI 中获得价值的人和没有获得价值的人:什么时候该找 agent,什么时候不该找,以及如何框定问题,让 agent 真正帮得上忙。

General Agents(选择你的协作者)

这些是你在后续每一种模式中都会指挥的通用 agents。工程师选择 coding agent;知识工作者选择 desktop co-working agent。两者在模式 2 中也会复用;它们不是模式 1 专属工具,而是每种模式之下的工具层。

  1. Agentic Coding 速成课:Claude Code 和 OpenCode — 一门 90 分钟、15 个概念的课程,带你了解 Claude Code 和 OpenCode。两者词汇相同,快捷键略有差异;技能可以在两个工具之间顺畅迁移。这是工程师进入 general-agent 工作方式的起点。

  2. Cowork 速成课 — 一门 90 分钟、15 个概念的 Claude Cowork 入门课:委派真实的桌面知识工作、自治阶梯、prompt-injection 防御,以及避免多数后悔的计划审查习惯。这是知识工作者进入 general-agent 工作方式的起点。

模式 1:问题解决路径

  1. 使用 General Agents 解决问题 — 一门 90 分钟、7 条原则的速成课,讲的是一种操作纪律:它能把任何 general agent,无论是 Claude Code、OpenCode、Cowork 还是 OpenWork,从聪明玩具变成能交付真实工作的工具。这七条原则适用于全部四种工具:Bash 是关键、代码是通用接口、验证是核心步骤、小而可逆的分解、把状态持久化到文件中、约束与安全、以及可观测性。课程还包含四阶段工作流:探索、计划、实现、提交,并配有综合练习。

  2. OpenClaw 与 General Agents — 一门 90 分钟、6 个场景的动手课。你的 general agent 会安装并配置一个运行在 OpenClaw 上的 Personal AI Employee:从零开始,到手机上运行一个 AI Employee,包含一个自定义 skill、一个 MCP tool、一个 heartbeat task,以及最后的 ACP-spawn 演示,让这个 AI Employee 召唤自己的 coding agent。Karpathy 的「little skill」在这里被扩展。前置要求:课程 3。

模式 2:制造路径

制造路径通过七个动作端到端展开:构建 Agent,把它提升为 Employee,用 nervous system 连接 Employees,加入管理层,让招聘动态化,解放 founder,并用 evals 证明整个 workforce 可以被度量和信任。没有最后这一步,制造就无法被证明;你无法度量的 Workers,也无法真正交付。

  1. 构建 AI Agents 速成课 — 一门 90 分钟、16 个概念的 OpenAI Agents SDK 入门课:agent loop、tools、sessions、streaming、handoffs、guardrails、tracing、day-1 evals、human approval、Cloudflare 上的 sandboxed deployment,以及用 DeepSeek V4 Flash 控制成本。前置要求:课程 3。

  2. 从 Agent 到 Digital FTE — 一场 4 小时工作坊,讲如何把基础 agent 变成持久 Worker:可移植 Skills、作为 system of record 的 Neon Postgres 与 pgvector、作为连接线的 Model Context Protocol、audit-trail 纪律、approval 作为授权模型,以及一个端到端构建的客户支持 Worker。15 个概念,8 个构建决策。15 分钟 Quick Win;90 分钟浏览 cheat sheet;完整构建大约再需要 3 小时。前置要求:课程 7。

  3. 从 Digital FTE 到带 Nervous System 的 Production Worker — 一门 90 分钟、15 个概念的课程,讲如何用 Inngest operational envelope 包裹你的 Digital FTE:durable execution、event-driven triggers、step memoization、concurrency and throttling、replay,以及 HITL gates。它会扩展客户支持 Worker,让它在网络抖动、重启和长期等待 approval 的情况下仍能存活。前置要求:课程 8。

  4. 使用 Paperclip 构建 Workforce — 一门 90 分钟、6 个场景的动手课。你的 coding agent 会启动 Paperclip(开源、MIT 许可的 AI-native company control plane),雇用一个无密钥本地 Worker,把一次 board approval 记录成永久审计决策,换入一个真正由 Gemini 支持的 Worker,让预算终于有可计费工作可以计量,并用一个 SQL 查询从 activity log 中重建整个公司历史。场景 1–4 和 6 不需要 API key;只有预算场景需要一个免费的 Gemini key。前置要求:课程 8 或课程 6。

  5. 从固定 Workforce 到动态 Workforce — 一场半天工作坊,包含 15 个概念和 7 个决策。课程从课程 10 的 workforce 出发,让它发现能力缺口、起草招聘提案,并让提案走过同一个 approval primitive;这个 primitive 也会管控一次 $500 退款。最后,它会在 Claude Managed Agents 上 provision 一个 Legal Specialist。招聘成为一个可调用函数。课程闭合不变量 6(workforce 可以在政策之下扩展)。前置要求:课程 10。

  6. 从 Founder Bottleneck 到 Owner Delegate — 一场半天工作坊,包含 15 个概念和 7 个决策。workforce 的 owner 会在 OpenClaw 上配置一个 Owner Identic AI:它读取例行 Paperclip approval requests,清理落在已签署 delegated envelope 之内的请求,只把真正需要人的决策浮出水面。owner 是最后一个瓶颈;这门课把它移除。课程闭合不变量 2(每个人都需要一个 delegate)。它还交付一个可下载的 lab starter zip,包含 mock endpoints、rules templates 和 sample judgment context。前置要求:课程 11。

  7. AI Employees 的 Eval-Driven Development — 这是闭合制造弧线的纪律,也包裹住课程 3 到 12 构建的一切。四条学习路径:Reader(约 3–4 小时,概念)、Beginner(约 1 天)、Intermediate(约 2 天)、Advanced(约 3 天,完整实现)。15 个概念加上一个 7 决策 lab。课程讲授九层 evaluation pyramid(unit、integration、output、tool-use、trace、RAG、safety、regression、production),以及填满它的四工具栈:OpenAI Agent Evals with trace grading、DeepEval、Ragas、Phoenix。终点是一个每位成员都可度量、可信任的 workforce,并配有每周一次的 trace-to-regression-test promotion ritual,让 eval suite 能持续活过数月。Reader track 面向领导者;Advanced track 面向交付团队。假设你使用 OpenAI Agents SDK 或 Claude Managed Agents runtime。

  8. 把你的 Agent Harness 部署到云端 — 这门课会把制造路径构建的一切真正交付出去。它讲授 harness/sandbox 分离:control plane(保存 secrets、运行 agent loop、保持 state 的 harness)与 execution plane(agent 生成代码实际运行的 sandbox)处在不同的安全边界中。你会部署一条完整生产路径:Azure Container Apps 上的 FastAPI 作为 harness,Neon Postgres 作为 durable state,Cloudflare R2 作为 files,一个 code-execution sandbox,四个 surface 的 observability,以及接入 CI gate 的课程 13 eval suite。四条学习路径(Reader 面向领导者和架构师;Beginner 到 Advanced 面向交付团队),17 个概念,9 个决策的 agent-driven lab;你的 coding agent 会阅读配套的 AGENTS.md,并在你的指挥下构建 harness。前置要求:课程 13(决策 8 会接入它的 eval suite)。Reader track 不需要云账号。

  9. 选择 Agentic Architectures — 一门关于模式选择的概念速成课:用关于任务的 5 个问题,把任务映射到 4 种核心模式之一(sequential workflow;single agent + ReAct + tools;planning + ReAct execution;multi-agent specialist),再把 reflection 作为可叠加层放在上面。纪律是按架构适配度选择,而不是按外观是否厉害选择:每种模式都是关于任务的一次押注;正确模式就是假设最符合现实的押注。课程讲授五问决策树、两种同样常见的失败模式(过度设计与设计不足)、暴露不匹配的 runtime signals,以及每种模式如何与你的 deployment topology 和 eval suite 组合。四条学习路径(Reader 约 2–3 小时,概念;Beginner 约 1 天;Intermediate 约 2–3 天;Advanced 约 4–5 天),一个五案例 decision lab,以及一份可打印的 classify-this-task worksheet,供设计评审使用。前置要求:你已经能够构建并评估 agents;本课会交叉引用 agent-building、operational-envelope 和 eval 课程。

  10. Payment-Enabled Agents:ACP、AP2、x402 和 MPP — 一门多路径速成课,讲让 agents 能够移动资金的四个协议:ACP 用于消费者购物,AP2 用于授权 mandates,x402 用于 HTTP-native machine payments,MPP 用于 session-based settlement。关键想法是:这四个协议是层,不是竞争者。你会读取 use case,按层选择协议(discovery、authorization、commerce、settlement),并把它们组合成 OpenAI Agents SDK code,同时使用 tool-input guardrail 在付款发生前拦住它。四条学习路径(Reader 约 2–3 小时,概念;Beginner 到 Advanced 面向交付团队),19 个概念,一个五决策 lab,以及三级 spend-limit 纪律,防止失控 agent 掏空钱包。前置要求:课程 7(OpenAI Agents SDK);与课程 9(Inngest)和课程 14(云部署)配套。

参考与配套

  1. 2026 年你应该使用哪些 AI Employees? — 五种工具,按你的身份和需求匹配。不到一分钟找到你的起点。

  2. 速查表 — 本书关键工具的交互式快速参考卡片:Claude Code、Claude collaborative workspace 和 OpenClaw。

  3. Agentic Engineering 基础 — 一门 45 分钟入门课,讲支撑本节所有内容的工程纪律:如何以对待任何生产软件的严谨程度,设计、交付和运行基于 agent 的系统。对于任何准备走过课程 8 的读者,这都是可选配套阅读。

术语表 是你的另一位常驻伙伴。把它们都保持在浏览器标签页中。

完成后你会拥有什么

到达本节末尾时,你不仅会理解 Agent Factory 论纲,还会真正围绕它构建过东西。你会使用 general agents 交付真实工作。你会部署至少一个不依赖你也能运行的 Digital FTE。你会把它连接到 nervous system,把它放进 Paperclip 治理的 workforce,看着这个 workforce 雇用自己的同事,并通过 Identic AI 把自己从瓶颈中解放出来。你会用自己写的 evals 包裹整个系统,所以你可以证明,而不是祈祷,每一个 Worker 都值得信任。

这就是本书与其他 AI 课程的不同:你结束时带走的不是笔记,而是一支能工作的 AI workforce。

而且这本书会继续有用:当你卡住时,章节就是你会回来的参考资料。

本节之后的一切,都会细化你已经构建出来的东西。现在,选择你的模式,然后开始。