Skip to main content

术语表:面向初学者的 AI 词汇

读本书不需要计算机科学学位。 但你需要听懂这门语言。本术语表用清楚的中文、现实例子和日常类比解释本书会遇到的重要词。

如何使用本页: 先读 前 30 个必须先懂的术语。它们几乎会出现在本书每一页。然后把完整术语表当作参考。术语按主题分组,先放本书专有词汇。使用 Ctrl+F(Mac 上用 Cmd+F)搜索任何词。


AI 全景速览

这些概念可以这样理解:AI 是大类别;机器学习是让系统从数据中学习的方法;**大语言模型(LLM)**是处理语言和推理的基础模型;AI agent 是能围绕目标使用工具、记住状态、执行动作的系统;AI Worker / Digital FTE 是把 agent 变成岗位,让它在组织中执行真实工作;Agent Factory 是制造这些 worker 和公司形态的方法。

AI、ML、DL 和 LLM:每一项都是前一项的子集

LLM 如何生成回答:从你的提示词到补全结果

Agent Factory 流水线:从人类意图到可工作的 Digital FTE


前 30 个必须先懂的术语

这些词几乎会出现在每一页。打开第 1 章之前,请先读完这一组。

说明:agent 作为买方相关的术语(ACP、AP2、x402、MPP、authority envelope、signed mandate)放在第 11 节,不列入前 30 个术语。


1. AI(人工智能):让计算机执行通常需要人类智能的事情。

🔹 当手机键盘预测你接下来要输入的词时,那就是 AI。

2. LLM(大语言模型):在数十亿页文本上训练的巨大 AI 系统,能够理解和生成人类语言与代码。Claude、GPT 和 Gemini 都是 LLM。

💡 可以把 LLM 想成读完世界最大图书馆的研究助理。你提出问题,它会从读过的一切中组织回答。

3. Agent(AI agent):不只是回答问题的 AI。它会行动、制定计划,并自己把事情推进完成。

🔹 chatbot 会回答「去迪拜最便宜的航班是什么?」agent 会实际搜索航司、比较价格,并替你订票。

4. Agentic AI:专注于构建能够自主规划、推理和行动的 agent 的 AI 类别。这是 2026 年 AI 的前沿,也是本书的核心。

🔹 普通 AI:你问一个问题,得到一个答案。Agentic AI:你给它一个目标,例如「把客户流失率降低 15%」,它会研究、计划、执行并回报,中途还会做决策。

5. Digital FTE(Digital Full-Time Equivalent):一种「AI employee」,以远低于人类的成本,7x24 小时完成全职 worker 的连续工作。论纲中也叫 AI Worker,是同一角色的不同语域。

🔹 客户支持 Digital FTE 每天处理 500 次对话,相当于 5 到 10 名人类客服 agent 的工作量。

6. Agent Factory:本书的中心概念。它是一个由规范驱动、人在监督、Claude Code 提供动力的过程,用于设计、制造和部署 AI Worker。它不是你购买的产品,而是你采用的实践。Agent Factory 构建 AI-Native Company,而 AI-Native Company 雇用 Digital FTE。

💡 就像装配线:每个工位执行一项专门任务,零件按顺序流动,最后产出按规范完成的产品。Agent Factory 把 AI employee 的制造工业化。

7. Prompt(提示词):你输入给 AI 模型的指令或问题。

🔹 「用 3 个要点总结这份报告」就是 prompt。更好的 prompt 会得到更好的答案。

8. Context Window(上下文窗口):AI 的「工作记忆」,也就是一次能读取和思考多少文本。

💡 小 context window 像一张很小的桌子,只能摊开几页纸。Claude 的大 context window 像一张巨大的会议桌,可以一次摊开整本小说。

9. Token:LLM 读取文本的基本单位,大致相当于一个词的四分之三。I love biryani 约等于 4 个 token。

🔹 使用 AI API 时通常按 token 付费。一整页文本大约是 500 到 700 个 token。

10. Hallucination(幻觉):AI 自信地生成并不真实的内容。

🔹 你询问某个最高法院案例,AI 编造出不存在的判决和引用编号,并把它当成事实。它听起来像真的,但其实是捏造的。

11. Spec(Specification / 规范):一份详细蓝图,准确描述你想构建什么:目标、输入、输出和约束。

💡 就像建筑师给房子的蓝图。没有施工方会先靠猜。它们按图施工。在 AI 开发中,spec 就是那张图。

12. Spec-Driven Development(SDD):先写蓝图,再让 AI 根据蓝图生成代码、测试和文档。

🔹 你写下:「为书店构建一个 API,包含列出、添加、搜索和删除图书的 endpoint。」Claude Code 会生成整个应用。

13. Claude Code:Anthropic 的 AI coding agent。你在终端中与它对话,它会读取整个 codebase、理解项目并编写代码。

🔹 你输入「给我的 app 添加用户认证」,Claude Code 会读取现有代码,生成认证模块,编写测试,并把一切集成进去。

14. Cowork:Anthropic 面向非编码知识工作的桌面 agent,用于文档、研究和文件管理。

🔹 「按项目整理我的 Downloads 文件夹,并总结本月所有 PDF。」Cowork 会在你专注其他事情时完成它。

15. MCP(Model Context Protocol):让任何 AI agent 连接任何外部工具的通用标准:数据库、email、calendar、文件系统。MCP 是 agent 调用工具的协议。处理 agent 为这些工具付款的另一组协议见第 11 节:ACP、AP2、x402 和 MPP。

💡 USB 出现前,每部手机都有不同充电器。MCP 是 AI 的「USB 标准」:一个协议,让任何 agent 都能接入任何工具。

16. API(Application Programming Interface):让不同软件程序彼此通信的规则。API 是 agent 与外部世界交互的方式。

💡 餐厅菜单就是 API。你(client)看菜单(docs),下单(request),厨房(server)把食物(response)送来。

17. SDK(Software Development Kit):在特定平台上构建应用的预制工具包。

💡 SDK 像 LEGO 套装:有预制零件和说明书,让你快速搭东西,而不是从零雕出每个零件。

18. Python:AI 中最流行的编程语言。易读、通用,也是本书主要使用的语言。

🔹 Python 几乎像英语一样读得懂:if age > 18: print("Adult")。这种可读性正是 AI 世界选择 Python 的原因。

19. Git:记录代码每次变更的系统:谁改了什么、什么时候改、为什么改。你永远可以回到任何旧版本。

💡 就像 Microsoft Word 的「Track Changes」,但用于整个软件项目。每次编辑都可以恢复。

20. Docker:把应用打包进可移植盒子(container)的工具,让它在任何地方都以同样方式运行:你的笔记本、同事机器或云服务器。

💡 像集装箱。无论它在 Karachi 的卡车上,还是在海上的船上,里面的内容都是相同且自包含的。

21. Context Engineering(上下文工程):设计 agent 接收的完整信息环境。这是区分每月 $2000 agent 和没人想要的 agent 的第一技能。

💡 Toyota 工厂有质量控制,确保每辆车符合规范。Context engineering 是 AI agent 的质量控制:确保输出一致、可靠。

22. Tool Use(工具使用):agent 使用外部工具(搜索 Web、查询数据库、发送 email)的能力,而不是只靠记忆回答。

🔹 你问「Karachi 今天天气如何?」有 tool use 的 agent 会真的查询天气服务并给出实时数据。没有 tool use,它只能猜。

23. Guardrails(护栏):防止 agent 做不该做之事的安全约束。

🔹 财务 agent 有一条 guardrail:超过 Rs. 5,000,000 的交易必须有人批准。它就像高速路护栏,防止车冲出道路。

24. RAG(Retrieval-Augmented Generation):让 AI 访问外部文档,使它基于事实回答,而不是基于可能错误的记忆回答。

💡 像开卷考试,而不是闭卷考试。AI 在回答前先从你的文档中查事实,因此准确得多。

25. 10-80-10 RuleAI 劳动力的运营节奏:人类设定方向(10%)→ AI 执行(80%)→ 人类验证(10%)。

🔹 你写项目 brief(10%),Claude Code 构建整个应用(80%),你 review、test 并 approve(10%)。

26. AGENTS.md / CLAUDE.md:告诉 AI agent 你的项目规则的配置文件:编码标准、偏好和架构决策。

💡 这就是给新员工的 onboarding document:「我们这样工作。这是我们的风格。这些事绝不做。」它会被加载进每次交互。

27. Orchestration(编排):协调多个 agent 共同完成一项任务。

💡 像 cricket 队长安排 fielders、设置 bowling rotation 并调整策略。队长不会自己做全部事情,而是协调专家朝同一目标行动。

28. Stateless(无状态):AI 在对话之间忘记一切。每次新聊天都从绝对零开始。

💡 像失忆的店主:你每次进门,它都把你当陌生人,即使你 5 分钟前刚来过。聊天应用通过每次重发完整对话制造出记忆的幻觉。

29. Deployment(部署):让你的应用上线,并让真实用户能在互联网上访问。

🔹 你的 app 在笔记本上能跑。deployment 把它放到云服务器上,让 10000 个人可以同时使用。

30. CI/CD(Continuous Integration / Continuous Delivery):每当开发者做出变更时,自动测试并部署代码。

🔹 开发者下午 2 点 push 代码。测试自动运行 3 分钟,全部通过。2:10 新版本上线:没有任何手工步骤。


架构:运行时栈

这些术语命名了 Agent Factory 产出的 AI-Native Company 里的组件。完整不变量论证见论纲


AI Worker

AI Worker 是为一个具体岗位而构建的 AI agent。它不是泛泛聊天,而是在明确角色、权限、工具、记录系统和验证规则内完成真实工作。


AI-Native Company

AI-Native Company 是围绕 AI Worker 组织起来的公司。人类负责意图、治理和验证;AI 劳动力负责大部分执行。


Two-Layer Model

双层模型把未来公司分成边缘层和 AI 劳动力层。边缘层由个人 delegate 代表人类,劳动力层由专业 AI Worker 执行公司工作。


Principal

principal 是合法行动链的起点。它通常是一个人类,负责设定目标、预算、权限边界,并对结果负责。


Edge Layer

边缘层是离人最近的一层,包含个人 agent / delegate。它把人的意图翻译成对 AI 劳动力的可执行委派。


AI Workforce Layer

AI 劳动力层包含公司里的 AI Worker、管理层、runtime engine、记录系统和事件基底。它是实际执行工作的层。


Delegate

delegate 是代表人类行动的个人 AI agent。它持有人类上下文、偏好和权限,并把工作交给下游系统。


OpenClaw(作为 Delegate)

OpenClaw 是本书当前使用的 delegate 参考实现。它代表个人,连接工作流,并把人类意图传递到 AI 劳动力层。


Manager(Management Plane)

manager 或 management plane 是管理 AI 劳动力的控制平面。它招聘、分配、治理、观察和退休 worker,并维护成本和审计记录。


Paperclip

Paperclip 是本书当前使用的 AI-native company 管理层参考实现。它把 hire、assign、govern、observe、retire 等动作暴露为可调用 API。


Meta-Layer(Hiring as a Callable Capability)

元层让“招聘新 AI Worker”成为可调用能力。获得授权的 agent 可以在策略边界内创建和注册新 worker。


Runtime Engine

runtime engine 是 AI Worker 实际运行在其上的执行环境。不同岗位可选择不同 engine,以匹配成本、可靠性和运营需求。


Harness(Agent Harness)

harness 是围绕模型的控制层,负责 agent loop、工具路由、审批、追踪、恢复和状态管理。


Compute Plane / Sandbox Runtime

compute plane 是执行平面,也就是 agent 运行代码、读取文件、写产物的隔离环境。sandbox runtime 用来限制不可信代码和操作的影响范围。


Trigger

trigger 是唤醒系统的事件,例如 schedule、webhook、API call、客户请求或代码变更。没有 trigger,系统只能等人类 prompt。


Summary

运行时栈从人类 principal 开始,经 delegate、管理层、engine、记录系统、meta-layer 和神经系统组成一条行动链。产品可换,不变量不换。

🔹 AI Worker 示例: 一个简历筛选 AI Worker 每天读取 200 份简历,按岗位 spec 打分,并把前 10 名交给人类招聘者。 💡 AI-Native Company 类比: Agent Factory 像建造摩天楼的方法;AI-Native Company 是这套方法建出的楼,也就是你实际运营的公司。 🔹 Two-Layer Model 示例: CEO 让 OpenClaw delegate 运行每周客户流失报告,delegate 把任务交给 AI Workforce Layer 中的 Digital FTE。 🔹 Principal 示例: CFO 写下「在 $30K 预算内把应收账款账龄降低 20%」,这句话同时携带目标、预算和约束。 💡 Edge Layer 类比: 边缘层像 chief-of-staff 楼层,每位高管都有一个代表自己的 agent。 💡 AI Workforce Layer 类比: 劳动力层像生产车间,许多 Digital FTE 做专门工作,由管理平面协调。 💡 Delegate 类比: delegate 像 CEO 的 chief of staff,知道优先级,代表本人发声,并把工作交给合适专家。 🔹 OpenClaw 示例: 你让 OpenClaw 总结一周并草拟下周 3 个优先事项,它会读取获批的日历、email 和 Slack,再等待你批准。 💡 Manager 类比: 如果 delegate 是 chief of staff,manager 就是 COO;它面向人是一对一,面向劳动力是一对多。 🔹 Paperclip 示例: 客户用 Bahasa Indonesia 写来消息,名册没有相应 worker,Paperclip 发现能力缺口并在权限边界内招聘新 worker。 🔹 Meta-Layer 示例: Paperclip 调用 hiring API,制造新的 Bahasa-speaking Worker,并把它注册进劳动力名册。 📌 Meta-Layer 双重角色: Claude Managed Agents 既可以是 engine 选项,也可以是招聘新 worker 的 runtime-provisioning 能力。 💡 Runtime Engine 类比: runtime engine 像员工带到岗位上的技能组合;心脏手术护士和门诊护士需要不同技能。 💡 Harness 类比: 如果模型是 CPU、context window 是 RAM,harness 就是操作系统,负责启动、调度工具和管理生命周期。 🔹 Harness 示例: Claude Agent SDK、OpenClaw、Claude Code、Cursor 和 Codex 都可以看作围绕模型构建工作的 harness。 📌 Harness 来源: 这个词从 test harness、eval harness 演化到 agent harness,始终表示围绕真实工作对象的支架。 🔹 Compute Plane 示例: OpenAI Agents SDK 是 harness,你可以另外选择 compute plane;Claude Managed Agents 则把二者包在一个 API 后面。 📌 三种 runtime: language runtime 是 Node.js 或 Python;execution runtime 是 sandbox;agent runtime 常被供应商用来指 harness。 🔹 Trigger 示例: 每周一 9 点,schedule trigger 唤醒 OpenClaw,请 Paperclip 运行客户健康报告。 📌 Workforce vs staff: 只有 AI Worker 是 workforce;delegate 和 manager 是永久 staff;runtime engine 根本不是 staff。 🔹 记录系统示例: 客服 worker 从 CRM 读取客户历史,回复后把结果写回 ticketing system。 💡 神经系统类比: 事件基底像公司神经系统,把外部触发、内部交接、durable execution 和流量控制连起来。 🔹 权限边界示例: agent 可以在 $500 预算内购买 enrichment data,但超过预算必须升级给人类。 📌 可替换边界: 你可以替换 OpenClaw、Paperclip 或 engine,但不能删除 principal、delegate、manager、system of record 等结构要求。 🔹 一句话记忆: Agent Factory 是过程,AI-Native Company 是产物,AI Worker 是产物内部的劳动力。


1. Agent Factory:本书专有术语

Agent Factory

Agent Factory 是制造 AI Worker 和 AI-Native Company 的实践。它由 spec-driven design、skill-based architecture、agent 工具和人的监督组成。

Industrialized Stack

工业化栈指把意图、生产引擎和结果组织成可重复流程。它把 AI 工作从一次性手工尝试变成可规模化生产。

Production Engine

生产引擎把人类意图转成经过验证的结果。它通常包括 spec、skill、MCP、AI Worker、反馈循环和记录系统。

Six Invariants

早期版本中使用的 6 个结构规则。当前论纲扩展为 7 个不变量,加入了事件、耐久性和流量控制的神经系统。

Invariant vs. Reference Implementation

不变量是永远要满足的结构规则。参考实现是今天用来满足规则的具体产品。规则稳定,产品会变。

Digital FTE(Digital Full-Time Equivalent)

Digital FTE 是数字全职员工,即能承担完整岗位的 AI Worker。它强调商业语境:像员工一样完成工作,而不是像工具一样等待人操作。

Digital Worker / AI Employee

Digital Worker 和 AI Employee 与 AI Worker 基本同义,强调这些系统在组织中承担可分配、可监督、可度量的工作。

Spec / Specification

spec 是明确的书面工作定义,包含目标、输入、输出、限制、权限、预算、验收标准和升级规则。

Spec-Driven Development(SDD)

SDD 是先写清楚 spec,再用 agent 和工程工具实现的开发方法。它把意图变成可执行、可验证的工作合同。

Test-Driven Generation(TDG)

TDG 是先定义测试或评估,再让 AI 生成满足测试的代码或内容。它把“生成”绑定到可验证目标上。

10-80-10 Rule

10-80-10 规则描述人机协作节奏:人类负责前 10% 的意图设定,AI 负责中间 80% 的执行,人类负责最后 10% 的验证与批准。

10-80-10 规则:意图、执行、验证

AGENTS.md / CLAUDE.md

这类文件保存 agent 的工作规则、项目约定和操作边界。它们让 agent 在会话之间继承项目纪律。

SPEC.md

SPEC.md 是保存某项工作规范的文件,通常描述要构建什么、为什么构建、如何验收、哪些行为被禁止。

SKILL.md

SKILL.md 是 skill 包的核心文件,描述某项可复用能力如何被 agent 使用,以及何时加载。

Skill Library

skill library 是可复用 skill 的集合。它让团队把专业能力打包、版本化,并跨项目复用。

Agent Skills

Agent Skills 是一种开放格式,用文件夹、SKILL.md 和可选资源封装 agent 能力。它支持渐进式加载,避免一次塞满上下文。

Agent Triangle

Agent Triangle 指模型、工具和上下文三者的组合。可靠 agent 通常不是只靠模型,而是三者协同。

Body + Brain

“身体 + 大脑”是 agent 架构比喻:模型像大脑,工具、runtime、sandbox、connector 像身体。没有身体,agent 只能说;有身体,agent 能做。

Body + Brain 架构:AI agent 如何构成

NanoClaw

NanoClaw 是 OpenClaw 生态中的轻量概念或实现,用来展示最小 personal agent / worker 模式。

OpenClaw

OpenClaw 是开源 personal AI employee / delegate。它位于人类与 AI 劳动力之间,代表人类传递意图和权限。

TutorClaw

TutorClaw 是本书生态中的 AI 导师。它从规范书籍读取,而不是从开放互联网随意生成,帮助学习者按节奏掌握内容。

Claude Code

Claude Code 是 Anthropic 的 agentic coding 工具。它在开发环境中读写文件、运行命令、实施计划并帮助构建软件。

Cowork

Cowork 是面向知识工作的协作型 AI agent 环境,适合文档、分析、研究、表格和业务流程。

Dispatch

dispatch 是把任务分派给正确 agent、worker、tool 或队列的过程。可靠系统需要可观察、可审计的 dispatch。

Computer Use

computer use 指 AI 通过屏幕、鼠标、键盘或浏览器直接操作计算机界面。它让 AI 能使用尚未提供 API 的软件。

Claude Desktop

Claude Desktop 是桌面版 Claude 客户端,常用于本地文件、MCP server 和个人工作流集成。

Hooks

hooks 是在特定事件发生时自动运行的脚本或回调,例如提交前检查、文件变更后验证、agent 完成后记录。

Subagents

subagents 是主 agent 创建或调用的专门 agent,用来处理边界清晰的子任务,例如审查、研究、测试或重构。

Tasks System

tasks system 是保存、分配、跟踪任务状态的结构。它让 agent 和人类知道当前目标、进度和下一步。

Context Engineering

context engineering 是设计 agent 能看到什么、何时看到、以什么格式看到的纪律。它比简单 prompt engineering 更系统。

Context Injection

context injection 是把外部信息放入 agent 当前上下文的过程。它可以有用,也可能成为安全风险。

Context Isolation

context isolation 是把不同任务、用户、权限或敏感数据隔离,避免 agent 混淆、泄露或越权。

Harness Engineering

harness engineering 是构建 agent 控制层的工程实践,包括工具调用、状态、审批、日志、恢复、评估和部署。

Progress Files

progress files 是记录当前计划、已完成事项、未解决问题和验证结果的文件。它们让长任务跨会话持续。

Session Architecture

session architecture 是一次 agent 会话的结构设计,包括探索、计划、执行、验证、记录和交接。

Five Powers

Five Powers 通常指 agentic tool 的 5 类能力:读、写、运行、搜索、调用外部系统。具体表述随章节而变。

Agent Maturity Model

Agent maturity model 描述 agent 从聊天助手到可治理 AI Worker 的成熟等级:从回答问题,到使用工具,到持久运行,再到可审计执行。

LevelNameDescription
1Experimental个人开发者尝试 AI coding tool
2Standardized组织范围内采用,并加入治理
3AI-Drivenspec 成为活文档,工作流被重新设计
4AI-NativeAI / LLM 是产品的核心组件
5Autonomous整个组织 AI-native,系统具备自我改进能力

AI-Assisted Development

AI-assisted development 指人类主导开发,AI 辅助补全、解释、生成片段或建议。

AI-Driven Development

AI-driven development 指 AI 负责更大比例的实现工作,人类提供目标、约束和审查。

AI-Native Development

AI-native development 指从一开始就把 agent、skill、spec、评估、记录系统和自动化治理作为开发基础。

Nine Pillars of AIDD

Nine Pillars of AIDD 是 AI-driven development 的 9 个支柱,通常包括 spec、context、tools、tests、review、security、state、observability 和 deployment 等纪律。

OODA Loop(Observe, Orient, Decide, Act)

OODA 是观察、定位、决策、行动循环。agentic 系统用它描述如何持续感知、判断并行动。

PRIMM-AI+

PRIMM-AI+ 是一种学习和问题解决框架,强调预测、运行、检查、修改和迁移,并加入 AI 协作步骤。

Identic AI

Identic AI 是 Don Tapscott 提出的自我主权 personal agent 概念,代表个人身份、判断和权限。

System of Record / Source of Truth

记录系统或事实来源是保存权威状态的地方。AI 输出必须能读写并验证于它,否则容易变成无法审计的生成物。

Bounded Workflow

bounded workflow 是边界清晰的工作流:输入、输出、权限、错误处理和升级路径明确。

Escalation Protocol

escalation protocol 定义 agent 何时必须停止并请求人类或更高级系统处理,例如高金额退款、法律风险、低置信度判断。

Tool Interface

tool interface 是 agent 调用外部能力的接口。好的接口有明确 schema、权限、错误返回和审计记录。

Vertical Intelligence

vertical intelligence 是面向某个行业或职能的深层专业智能,例如法律、医疗、财务、供应链。

Agentic Enterprise

Agentic Enterprise 是围绕 agent 和 AI Worker 构建运营能力的企业。本书中它与 AI-Native Company 高度重合。

Custom-Built AI Employee

定制 AI employee 是为某个组织、流程或领域专门构建的 worker,通常带有专属 spec、skill 和记录系统连接。

Pre-Built AI Employee

预制 AI employee 是已打包好的 worker,可快速部署到常见岗位,但仍需配置权限、记录系统和治理。

Build vs. Buy

build vs. buy 是选择自建还是购买现成方案。Agent 时代常见答案是:核心专业能力自建,通用基础设施可买。

FTE Development Plugin

FTE development plugin 是帮助设计、构建、验证 Digital FTE 的插件或工具包。

Skill Shim

skill shim 是把已有能力、文档或工具包装成 agent 可使用 skill 的薄层适配。

Gateway Proxy Pattern

gateway proxy pattern 是用一个受控网关代理 agent 对外部系统的访问,集中处理权限、审计、速率限制和安全检查。

Piggyback Protocol

piggyback protocol 指让 agent 借助已有会话、连接或授权通道执行工作,但必须小心权限边界和审计。

💡 Agent Factory 类比: 它像装配线,把人类意图、规范、skill 和工具组织起来,制造可靠 AI Worker。 🔹 Industrialized Stack 示例: 同一套客户报告流程每周自动运行,不再依赖某个人手工拼接。 🔹 Production Engine 示例: 人类给出目标和约束,engine 调用 spec、skill、MCP 和 worker 产出结果。 📌 Six Invariants 记忆: principal、delegate、manager、engine、system of record、meta-layer、nervous system 是结构要求。 📌 Invariant vs Reference Implementation: 不变量是必须成立的条件;Paperclip、OpenClaw 等只是当前实现方式。 🔹 Digital FTE 示例: 财务 Digital FTE 每月完成 close checklist,并把异常项升级给人类 controller。 🔹 Digital Worker 示例: 销售 Digital Worker 负责 lead enrichment、outreach draft 和 CRM hygiene。 🔹 Spec 示例: 「给工单分类、优先处理 VIP、无法确定时升级」就是支持 worker 的行为合同。 🔹 SDD 示例: 先写 API 行为、输入输出和验收测试,再让 Claude Code 生成实现。 🔹 TDG 示例: 先写 failing test,再让 agent 生成代码,直到 test 通过。 🔹 10-80-10 示例: 人类写 brief,AI 构建,最后人类 review、test、approve。 💡 AGENTS.md 类比: 它像给新员工的团队手册,说明风格、规则和禁区。 🔹 SPEC.md 示例: 一个 SPEC.md 可以定义 checkout agent 的目标、权限、失败处理和验收标准。 🔹 SKILL.md 示例: SKILL.md 告诉 agent 何时加载某项能力,以及应读取哪些参考文件。 🔹 Skill Library 示例: 法务团队把合同审查、redline 和风险升级打包为可复用 skill。 📌 Agent Skills 示例: 一个 skill folder 可包含 SKILL.md、脚本、参考资料和模板资产。 💡 Agent Triangle 类比: 模型、工具和上下文像三脚架,少一条腿就站不稳。 💡 Body + Brain 类比: 模型是大脑,harness、tool、sandbox 和 connector 是身体。 🔹 OpenClaw 示例: OpenClaw 位于人类和 AI 劳动力之间,代表人类传达意图。 🔹 TutorClaw 示例: 学生在 WhatsApp 上问概念,TutorClaw 从本书已验证内容中教学。 🔹 Claude Code 示例: 你要求重构认证模块,Claude Code 读取 repo、修改文件并运行测试。 🔹 Cowork 示例: 你让 Cowork 整理文件、总结文档并准备研究草稿。 🔹 Computer Use 示例: agent 打开浏览器、点击按钮、填写表单或读取屏幕状态。 🔹 Hooks 示例: commit 前自动运行格式化或测试,就是 coding agent workflow 中的 hook。 🔹 Subagents 示例: 一个主 agent 可以派 research subagent 收集资料,派 review subagent 检查质量。 🔹 Tasks System 示例: 多步骤任务被拆成待办、进行中和完成状态,便于恢复和审计。 🔹 Context Engineering 示例: 把正确 spec、相关代码和约束放进上下文,避免 agent 靠猜。 🔹 Context Injection 示例: 在任务开始时自动注入项目规则、设计标准和当前目标。 🔹 Context Isolation 示例: 让财务 agent 看不到 HR 数据,即使二者都在同一公司运行。 🔹 Harness Engineering 示例: 设计 approval gate、tool routing、retry 和 tracing,让模型成为可运营系统。 📌 Agent Maturity Model 示例: 从个人实验到组织标准化,再到 AI-native 和自主系统,成熟度逐级提升。 🔹 AI-Assisted Development 示例: 人类写主要代码,AI 做补全、解释和小片段生成。 🔹 AI-Driven Development 示例: spec 驱动 agent 生成主要实现,人类负责边界判断和验证。 🔹 AI-Native Development 示例: 产品从一开始就假设 AI 是核心执行层,而不是附加功能。 💡 OODA Loop 类比: observe、orient、decide、act 解释 agent 如何循环感知并行动。 🔹 PRIMM-AI+ 示例: 学生先预测代码,再运行、调查、修改,最后用 AI 扩展。 🔹 Identic AI 示例: 个人拥有的 agent 了解你的偏好,代表你与企业 AI 劳动力交互。 📌 System of Record 示例: CRM、ledger、ticketing system 和 repo 保存组织真相,而不是聊天上下文。 🔹 Bounded Workflow 示例: refund agent 只能处理低于上限的退款,超过上限必须升级。 🔹 Escalation Protocol 示例: 高风险法律条款、异常付款和低置信度输出都交给人类。 🔹 Tool Interface 示例: agent 通过结构化参数调用 create_invoice,而不是随意描述动作。 🔹 Vertical Intelligence 示例: 医疗、法律、金融 worker 需要行业知识,不只是通用推理。 🔹 Agentic Enterprise 示例: 公司主要由 AI Worker 执行工作,人类负责方向、治理和验证。 🔹 Custom-Built AI Employee 示例: 为某家公司特定月结流程定制的 finance worker。 🔹 Pre-Built AI Employee 示例: 可直接采购的通用客服 worker,再按公司规则配置。 🔹 Build vs. Buy 示例: 核心差异化岗位自己 build,标准化后台岗位可以 buy。 🔹 Gateway Proxy Pattern 示例: 单一 gateway 负责认证、限流和路由,把请求转给正确后端 agent。 🔹 Piggyback Protocol 示例: TutorClaw 先运行在 WhatsApp 之上,利用已有分发触达学生。


2. 核心 AI 与机器学习

AI ⊃ ML ⊃ DL ⊃ LLMs
(Each is a subset of the one before it)

AI(Artificial Intelligence)

AI 是让机器表现出类似人类智能能力的总称,包括感知、语言、推理、规划和决策。

ML(Machine Learning)

机器学习是通过数据训练模型,让系统学会预测或分类,而不是由程序员手写每条规则。

DL(Deep Learning)

深度学习使用多层神经网络从大量数据中学习复杂模式,是现代 AI 的核心方法之一。

Model

模型是训练后的函数或系统,输入数据后产生预测、文本、图像、决策或动作建议。

Foundation Model

基础模型是在大规模数据上训练、可适配多种任务的大模型,例如 LLM、视觉语言模型等。

Neural Network

神经网络是一类受大脑启发的机器学习结构,由许多连接的层和权重组成。

Transformer

Transformer 是现代 LLM 的核心架构,擅长处理序列、注意力和长距离依赖。

Multimodal Model

多模态模型能处理多种输入类型,例如文本、图片、音频、视频和表格。

Reasoning Model

reasoning model 是为多步推理、数学、规划或复杂问题解决优化的模型。

Training

training 是用数据调整模型参数的过程,使模型学会完成目标任务。

Pretraining

pretraining 是在大规模通用数据上先训练模型,获得广泛语言和世界模式。

Post-Training

post-training 是基础训练后的对齐、指令调优、偏好优化和安全调整。

Fine-Tuning

fine-tuning 是用较小、更专门的数据继续训练模型,使其适合特定领域或风格。

Parameters

parameters 是模型内部可学习的数字。训练会调整它们,推理时模型用它们生成输出。

Weights

weights 是参数的一类,表示神经网络连接的强度。开放权重模型允许他人下载和运行这些权重。

Dataset

dataset 是用于训练、评估或分析的一组数据。

Benchmark

benchmark 是用于比较模型或系统能力的标准测试集或任务。

Inference

inference 是训练完成后使用模型处理输入并生成输出的过程。

🔹 AI 示例: 语音助手理解你的问题并返回答案,就是 AI 的日常应用。 🔹 ML 示例: 系统通过历史订单学习哪些客户可能流失,而不是手写每条规则。 🔹 DL 示例: 多层神经网络识别图像中的病灶或道路标志。 🔹 Model 示例: fraud model 输入交易特征,输出风险分数。 🔹 Foundation Model 示例: 同一个基础模型可以用于摘要、写代码、翻译和问答。 💡 Neural Network 类比: 很多简单节点连接在一起,像简化版神经系统一样学习模式。 🔹 Transformer 示例: 现代 LLM 依赖 transformer 结构来处理长文本中的关系。 🔹 Multimodal Model 示例: 你上传截图并问哪里出错,模型同时理解图像和文字。 🔹 Reasoning Model 示例: 复杂数学题或多步规划需要模型显式推理,而不只是补全文本。 🔹 Training 示例: 用大量样本调整模型,使它在新输入上给出更好输出。 🔹 Pretraining 示例: 模型先从海量通用文本中学习语言和世界模式。 🔹 Post-Training 示例: 模型再通过反馈、偏好和安全规则变得更适合真实使用。 🔹 Fine-Tuning 示例: 医疗团队可用领域数据微调模型,使回答更贴近临床语境。 📌 Parameters 示例: 参数越多不自动等于越好,但它们决定模型能表示的复杂度。 📌 Weights 示例: 训练改变的是 weight;推理时模型用这些 weight 计算输出。 🔹 Dataset 示例: 客户工单、产品说明和解决记录可以组成客服模型的数据集。 🔹 Benchmark 示例: 用同一组任务比较多个模型,判断哪一个更可靠。 🔹 Inference 示例: 用户输入 prompt 后,模型生成答案的那次运行就是 inference。 💡 AI/ML/DL 关系: AI 是大类,ML 是其中一种方法,DL 是 ML 的子集。 📌 基础提醒: 训练是学习阶段,inference 是使用阶段,不要混为一谈。


3. LLM 基础

LLM(Large Language Model)

LLM 是在大量文本和代码上训练的大语言模型,能生成、解释、总结和推理语言内容。

Prompt

prompt 是给模型的任务说明。它可以很短,也可以包含上下文、示例、格式和限制。

System Prompt

system prompt 是最高优先级指令之一,定义模型角色、行为边界和安全要求。

User Prompt

user prompt 是用户当前发出的任务请求或问题。

Instruction

instruction 是明确要求模型或 agent 做什么的指令,可以来自系统、用户、开发者或工具。

Context

context 是模型当前可见的信息集合。模型只能基于进入上下文的内容行动。

Context Window

context window 是模型一次能接收和处理的 token 上限。超过窗口的信息需要检索、压缩或写入外部存储。

Context Window:小桌面与大桌面的对比

Token

token 是模型处理文本的单位。成本、速度和上下文长度通常都按 token 计算。

Completion / Generation

completion 或 generation 是模型根据输入生成输出的过程。

Structured Output

structured output 是按固定 schema、JSON、表格或列表生成的输出,便于程序解析和验证。

Hallucination

hallucination 是模型编造不存在或不准确内容的现象。记录系统、检索和验证能降低风险。

Grounding

grounding 是把输出绑定到可靠事实来源,例如文档、数据库、工具结果或引用。

Temperature

temperature 控制输出随机性。低 temperature 更稳定,高 temperature 更发散。

Latency

latency 是从请求发出到响应返回的延迟。

Throughput

throughput 是系统单位时间内能处理多少请求、token 或任务。

Deterministic vs. Non-Deterministic

确定性系统相同输入总给相同输出。非确定性系统可能因采样、并发或外部状态产生不同输出。

Stateless

stateless 系统不在请求之间保留状态。很多 LLM API 默认是 stateless,需要应用层保存记忆。

Stateless 的工作方式:应用每次都重新发送完整历史

Prompt Engineering

prompt engineering 是设计提示词以获得更好输出的实践。它是 context engineering 的一部分,但不是全部。

NLP(Natural Language Processing)

NLP 是处理人类语言的计算机科学领域,包括分词、翻译、摘要、问答、分类等。

Copilot

copilot 是辅助人类完成工作的 AI 工具。它通常建议、补全或生成内容,但人类仍直接操作。

🔹 LLM 示例: Claude、GPT 和 Gemini 都是能处理自然语言与代码的大语言模型。 🔹 Prompt 示例: 「把这份报告改写成给 CFO 的 1 页 memo」就是 prompt。 🔹 System Prompt 示例: 系统提示词可以规定 agent 必须引用来源、不得编造数据。 🔹 User Prompt 示例: 用户提示词是当前任务,例如「分析这个 CSV 并找出异常」。 🔹 Instruction 示例: 指令可以来自系统、开发者、用户或工具结果,优先级不同。 🔹 Context 示例: 当前文件、聊天记录和工具输出都会影响模型接下来怎么回答。 💡 Context Window 类比: 桌面越大,一次能摊开的材料越多。 🔹 Token 示例: API 计费、速度和最大输入长度通常都按 token 计算。 🔹 Completion 示例: 模型根据输入生成下一段文字,就是 completion。 🔹 Structured Output 示例: 要求模型返回 JSON,可以让程序直接解析结果。 🔹 Hallucination 示例: 模型编造不存在的论文标题和 DOI,就是 hallucination。 🔹 Grounding 示例: 让模型先查公司知识库再回答,能把输出绑定到事实。 🔹 Temperature 示例: 低 temperature 更稳定,高 temperature 更有创意但更不可预测。 🔹 Latency 示例: 客服 agent 等 10 秒才回答,会直接影响用户体验。 🔹 Throughput 示例: 同时处理 1000 个请求需要考虑吞吐,而不只是单次速度。 🔹 Deterministic 示例: 同样输入每次输出一致,便于测试;非确定性输出更难复现。 🔹 Stateless 示例: API 本身不记得上次对话,应用必须重新发送必要历史。 🔹 Prompt Engineering 示例: 把目标、约束、受众和格式写清楚,输出通常会更好。 🔹 NLP 示例: 分词、机器翻译、摘要和情感分析都属于 NLP。 🔹 Copilot 示例: 编码 copilot 建议下一段代码,但人类仍决定是否接受。


4. 知识、检索与上下文

RAG(Retrieval-Augmented Generation)

RAG 先检索相关知识,再让模型基于检索结果生成回答。它常用于企业知识库和文档问答。

RAG 工作流:检索、增强、生成

Embedding

embedding 是内容的向量表示,使系统能根据语义相似度查找相关内容。

Vector

vector 是一串数字,用于表示文本、图片或其他数据的特征。

Vector Database

向量数据库存储 vector,并支持相似度搜索、过滤和检索。

Vector Database:按语义搜索,而不是按关键词搜索

语义搜索按含义查找,而不是只按关键词匹配。

Retrieval

retrieval 是从外部知识源中找出与当前问题相关内容的过程。

Reranking

reranking 是对检索出的候选结果重新排序,把最相关内容放在前面。

Chunking / Chunk

chunking 是把长文档切成较小片段。chunk 是被切出的片段。

Knowledge Base

knowledge base 是组织保存知识的库,例如文档、FAQ、手册、政策和案例。

Grounding Data

grounding data 是用于支撑模型回答的事实数据或来源。

MCP(Model Context Protocol)

MCP 是让 AI agent 连接外部工具和数据源的开放协议。它像 AI 时代的 USB。

MCP:用一个协议把 agent 连接到每个工具

Connector

connector 是连接某个外部系统的适配器,例如数据库、CRM、文件系统或 API。

System Integration

system integration 是把多个软件系统连接起来,使数据和动作能跨系统流动。

🔹 RAG 示例: agent 先从员工手册检索请假政策,再回答员工问题。 🔹 Embedding 示例: 两段意思相近的文字会被映射到距离较近的向量。 🔹 Vector 示例: 一个句子可以变成数百个数字组成的 vector。 🔹 Vector Database 示例: 产品文档可存进向量数据库,支持按语义搜索。 🔹 Semantic Search 示例: 搜「退款太慢」也能找到标题为「payment reversal delay」的文档。 🔹 Retrieval 示例: 回答前从知识库取回相关段落,就是 retrieval。 🔹 Reranking 示例: 先找出 50 个候选片段,再把最相关 5 个排到前面。 🔹 Chunking 示例: 把 100 页手册切成小段,方便检索和引用。 🔹 Knowledge Base 示例: 公司政策、FAQ 和 SOP 构成 agent 回答的知识库。 🔹 Grounding Data 示例: 发票金额、客户 ID 和工单状态都是可 grounding 的事实数据。 💡 MCP 类比: MCP 像 AI 的 USB,让不同工具能通过同一协议接入 agent。 🔹 System Integration 示例: CRM、email 和 billing system 连接后,agent 才能完成端到端流程。


5. Agentic AI 概念

Agent(or AI Agent)

AI agent 是能围绕目标推理、选择动作、调用工具并返回结果的系统。

Chatbot 与 Agent:一个回答,另一个行动

Agentic AI

agentic AI 指具备行动能力的 AI:它不只回答,还会计划、调用工具、执行、检查和继续。

General Agent

general agent 是通用能力强的 agent,例如 Claude Code、OpenCode 或 Cowork,可用于许多任务。

Autonomy

autonomy 是 agent 在多大程度上能不经逐步人类批准而行动。生产系统中,自主性必须被权限和审计约束。

Reasoning

reasoning 是分析问题、比较选项、推导结论或制定计划的能力。

Acting

acting 是 agent 采取真实动作,例如调用 API、运行命令、写文件、发送消息或创建任务。

Planning

planning 是把目标拆成步骤,并决定顺序、依赖和验证方法。

Task Decomposition

task decomposition 是把大任务拆成小任务,使每一步更清晰、更可验证、更可撤销。

Orchestration

orchestration 是协调多个 agent、工具、工作流和事件,使它们共同完成目标。

Multi-Agent System

multi-agent system 由多个 agent 组成,通常按角色分工,例如 planner、researcher、coder、reviewer。

Multi-Agent System:专业 agent 协同工作

Supervisor Agent

supervisor agent 负责分配任务、检查输出、决定是否重试或升级。

Handoff

handoff 是一个 agent 把工作交给另一个 agent 或人类的过程。

Tool Use / Function Calling

工具使用或函数调用让模型通过结构化参数调用外部能力,而不是只生成文本。

State

state 是系统当前保存的事实、进度和变量。可靠 agent 需要明确管理 state。

Memory(Agent Memory)

agent memory 是 agent 跨会话保留的信息。生产系统应把重要记忆放入可审计存储,而不是只放在上下文中。

Session

session 是一次交互或工作运行。session 可以短到一次问答,也可以长到数小时 agent 工作。

Reflection

reflection 是 agent 对自己输出或过程进行检查和改进的步骤。

Retry / Fallback

retry 是失败后重试。fallback 是主要路径失败时使用备用路径。

Guardrails

guardrails 是防止 agent 越界、出错或造成伤害的规则和机制。

HITL(Human in the Loop)

HITL 是人在回路中,指关键决定、审批或验证由人类完成。

Reliability

reliability 是系统持续正确工作的能力。

Verifiability

verifiability 是输出能被检查、证明或复现的能力。

Auditability

auditability 是事后能检查行为、依据、成本和结果的能力。

Workflow

workflow 是完成工作的一组步骤、规则和交接。

🔹 Agent 示例: 旅行 agent 不只回答航班信息,还能搜索、比较、预订并发送确认。 🔹 Agentic AI 示例: 给出目标后,系统会规划、调用工具、执行并继续检查。 🔹 General Agent 示例: Claude Code 可以修 bug、写文档、读文件、运行测试,适用范围很广。 📌 Autonomy 示例: 自主性越高,越需要权限边界、日志和升级规则。 🔹 Reasoning 示例: 比较 3 个供应商报价并解释取舍,就是 reasoning。 🔹 Acting 示例: 写文件、发 email、调用 API 都是 agent 的行动。 🔹 Planning 示例: 把「发布新版本」拆成测试、构建、部署、验证等步骤。 🔹 Task Decomposition 示例: 大任务拆成可验证小任务,失败时更容易重试。 🔹 Orchestration 示例: supervisor 协调 researcher、coder 和 reviewer 完成一个项目。 🔹 Multi-Agent System 示例: 专家 agent 各做一块工作,再由 manager 汇总。 🔹 Supervisor Agent 示例: supervisor 发现输出缺少引用,就让 worker 重试。 🔹 Handoff 示例: 支持 agent 发现法律风险后,把工单交给法律 worker。 🔹 Tool Use 示例: 模型通过函数调用查询库存,而不是凭记忆猜库存。 🔹 State 示例: agent 记住当前步骤、已完成任务和剩余预算,就是 state。 🔹 Memory 示例: 长期偏好应写入可审计存储,而不是只放进 context window。 🔹 Session 示例: 一次从触发到完成的 agent run 就是 session。 🔹 Reflection 示例: agent 检查自己的输出是否满足 spec,再决定是否修改。 🔹 Retry / Fallback 示例: 主 API 失败后重试,仍失败就切换备用 provider。 🔹 Guardrails 示例: agent 不得发送合同,除非人类法律负责人批准。 🔹 HITL 示例: 高风险付款、法律承诺和低置信度输出由人类最终批准。 🔹 Reliability 示例: 可靠系统在失败时可恢复,而不是静默丢任务。 🔹 Workflow 示例: 从接收工单、分类、回复到升级,就是客户支持 workflow。


6. 编程与软件术语

Python

Python 是常用编程语言,因语法清晰、生态丰富,广泛用于 AI、数据和后端。

TypeScript

TypeScript 是带类型系统的 JavaScript,常用于大型前端、后端和 agent 工具开发。

Frontend

frontend 是用户直接看到和操作的应用部分,例如网页界面、按钮、表单和可视化。

Frontend 与 Backend:用户看到的内容与背后运行的系统

Backend

backend 是服务器端系统,负责业务逻辑、数据库、API、认证、队列和后台任务。

Full-Stack

full-stack 指同时涉及 frontend 和 backend 的开发。

API(Application Programming Interface)

API 是软件之间通信的接口。agent 常通过 API 调用工具和服务。

SDK(Software Development Kit)

SDK 是一组库、工具和示例,帮助开发者使用某个平台或 API。

CLI(Command-Line Interface)

CLI 是命令行界面。许多 agentic coding 工具通过 CLI 运行命令和管理项目。

HTTP / HTTPS

HTTP 是 Web 通信协议。HTTPS 是加密版 HTTP,是现代 Web 的默认方式。

REST(Representational State Transfer)

REST 是设计 Web API 的常见风格,通常使用 HTTP 方法操作资源。

Endpoint

endpoint 是 API 的具体访问地址,例如 /api/users

Request / Response

request 是客户端发给服务器的请求;response 是服务器返回的响应。

JSON(JavaScript Object Notation)

JSON 是轻量数据格式,常用于 API、配置和结构化输出。

🔹 示例:

{
"name": "Ahmed Khan",
"city": "Lahore",
"role": "Software Engineer"
}

每一项数据都有清楚的标签和值。软件可以非常轻松地读取 JSON。

Schema

schema 定义数据结构、字段类型和约束。它让输出可验证、可解析。

Validation

validation 是检查数据或输出是否符合规则。

Library / Package

library 或 package 是可复用代码集合,可被项目安装和调用。

Framework

framework 是更完整的开发框架,规定项目结构和开发方式。

Dependency

dependency 是项目依赖的外部库、包或服务。

Repo(Repository)

repo 是代码仓库,保存项目文件、历史和协作记录。

Git

Git 是版本控制系统,用来跟踪代码变更、分支和合并。

GitHub

GitHub 是托管 Git 仓库和协作开发的平台。

Environment Variable / .env

environment variable 是运行时配置。.env 文件常保存本地环境变量,例如 API key。

Synchronous

synchronous 指同步执行:一步完成后才继续下一步。

Asynchronous

asynchronous 指异步执行:任务可以等待外部结果时释放当前流程,之后再继续。

Event-Driven Architecture

event-driven architecture 是由事件触发系统行为的架构,例如 webhook、消息队列、schedule。

Variable

variable 是程序中保存值的名字。

Function

function 是可调用的代码块,接收输入并返回输出或执行动作。

Type Annotation

type annotation 是给变量、函数参数或返回值标注类型,帮助检查错误。

Dataclass

dataclass 是用来快速定义数据对象的结构,Python 中常见。

Decorator

decorator 是包裹函数或类、添加额外行为的语法机制,Python 和 TypeScript 生态中都有类似模式。

Syntax

syntax 是编程语言的语法规则。

Boilerplate

boilerplate 是重复、模板化的代码或配置。

Linter

linter 是检查代码风格、潜在错误和规范问题的工具。

Debugging

debugging 是定位并修复错误的过程。

Refactoring

refactoring 是在不改变外部行为的情况下改进代码结构。

pytest

pytest 是 Python 测试框架。

pyright

pyright 是 Python 类型检查器。

ruff

ruff 是快速 Python linter 和 formatter。

uv

uv 是快速 Python 包管理和环境工具。

pip

pip 是 Python 包安装工具。

🔹 Python 示例: python main.py 运行脚本,适合 AI、数据和后端任务。 🔹 TypeScript 示例: TypeScript 给 JavaScript 加类型,减少大型项目中的错误。 🔹 Frontend 示例: 按钮、表单和图表是用户直接看到的 frontend。 🔹 Backend 示例: 登录、支付、数据库查询和队列处理通常在 backend 完成。 🔹 Full-Stack 示例: 同一名工程师同时改 React 页面和 API route,就是 full-stack 工作。 💡 API 类比: API 像餐厅菜单,告诉 client 可以点什么、怎么点、会得到什么。 🔹 SDK 示例: 支付 SDK 封装签名、请求和错误处理,让开发者更快集成。 🔹 CLI 示例: git status 是通过命令行查看仓库状态。 🔹 HTTP 示例: 浏览器向服务器发送 HTTP request,服务器返回 HTML 或 JSON。 🔹 REST 示例: GET /users 读取用户,POST /users 创建用户。 🔹 Endpoint 示例: /api/invoices/123 是访问单张发票的 endpoint。 🔹 Request / Response 示例: client 发送 request,server 返回 response。 🔹 Schema 示例: schema 规定 email 必须是字符串,age 必须是数字。 🔹 Validation 示例: 保存前检查 JSON 是否符合 schema,就是 validation。 🔹 Library 示例: 日期处理 library 提供可复用函数,项目不用从零写。 🔹 Framework 示例: Next.js 规定路由、渲染和构建方式,是 framework。 🔹 Dependency 示例: 应用依赖数据库驱动、UI library 和认证 package。 🔹 Repo 示例: GitHub repo 保存代码、issue、pull request 和历史。 🔹 Git 示例: commit 记录一次代码变更,可回退、比较和合并。 🔹 GitHub 示例: 团队通过 GitHub review pull request 并协作开发。 🔹 Environment Variable 示例: DATABASE_URL 通常放在 .env,而不是写进代码。 🔹 Synchronous 示例: 同步流程一步完成后才进入下一步。 🔹 Asynchronous 示例: 发送 email 后不必等待完成,系统可以继续处理其他任务。 🔹 Event-Driven 示例: 新订单事件触发发票 agent 和库存 agent。 🔹 Variable 示例: total 保存当前总价,后续计算会读取它。 🔹 Function 示例: calculate_tax() 把输入金额转成税额输出。 🔹 Type Annotation 示例: name: string 告诉工具这个值应是字符串。 🔹 Dataclass 示例: Python dataclass 用简洁语法定义数据结构。 🔹 Decorator 示例: decorator 可以给函数添加日志、权限或缓存行为。 🔹 Syntax 示例: 少一个冒号或括号不匹配,通常就是 syntax error。 🔹 Boilerplate 示例: 每个新 route 都重复的 setup code 就是 boilerplate。 🔹 Linter 示例: linter 发现未使用变量或不符合团队风格的代码。 🔹 Debugging 示例: 通过日志和断点找出为什么 API 返回 500。 🔹 Refactoring 示例: 不改变行为,只把重复代码抽成函数。 🔹 pytest 示例:pytest 运行 Python 单元测试和集成测试。 🔹 pyright 示例: pyright 在运行前发现 Python 类型错误。 🔹 ruff 示例: ruff 可以快速检查和格式化 Python 代码。


7. 数据与数据库术语

Database

数据库是保存、查询和管理结构化或半结构化数据的系统。

SQL(Structured Query Language)

SQL 是关系数据库查询语言,用来读取、筛选、更新和聚合数据。

Table / Row / Column

table 是表,row 是行,column 是列。关系数据库用这些结构保存数据。

Query

query 是向数据库或搜索系统提出的问题或查询语句。

PostgreSQL

PostgreSQL 是强大的开源关系数据库,常用于生产系统。

NoSQL

NoSQL 指非关系型数据库类别,例如文档数据库、键值存储、图数据库。

Cache

cache 是缓存,用来临时保存常用数据以提升速度。

Queue / Message Broker

queue 或 message broker 用来在系统之间传递消息,解耦生产者和消费者。

Kafka

Kafka 是分布式事件流平台,用于高吞吐日志、事件和消息处理。

Transaction

transaction 是一组要么全部成功、要么全部失败的数据库操作。

Data Pipeline

data pipeline 是把数据从来源移动、转换并加载到目标系统的流程。

ETL(Extract, Transform, Load)

ETL 是抽取、转换、加载数据的流程。

Persistent Storage

persistent storage 是持久存储,保存重启后仍然存在的数据。

🔹 Database 示例: 客户、订单和发票长期保存在 database 中。 🔹 SQL 示例: SELECT * FROM users 从用户表读取数据。 🔹 Table 示例: customers 表包含多行客户记录和多个字段。 🔹 Row 示例: 一行可以表示一个客户、一个订单或一次交易。 🔹 Column 示例: email column 保存每个客户的邮箱。 🔹 Query 示例: 查询过去 30 天未付款的发票,就是 query。 🔹 PostgreSQL 示例: 生产级 SaaS 常用 PostgreSQL 保存关系数据。 🔹 NoSQL 示例: 文档数据库适合保存灵活结构的 JSON-like 文档。 🔹 Cache 示例: 把热门产品信息放进 cache,减少数据库压力。 🔹 Queue 示例: 订单创建后进入 queue,worker 异步处理发票和通知。 🔹 Message Broker 示例: Kafka 或 RabbitMQ 在服务之间传递事件。 🔹 Kafka 示例: 大量事件流可以写入 Kafka,再被多个 consumer 读取。 🔹 Transaction 示例: 扣库存和创建订单必须一起成功或一起失败。 🔹 Data Pipeline 示例: 每晚把应用数据清洗后送入分析仓库。 🔹 ETL 示例: 从 CRM extract,清洗 transform,再 load 到 warehouse。 🔹 Persistent Storage 示例: agent 进度写入数据库,崩溃后仍可恢复。 📌 数据边界示例: context window 不是 database,不能当公司真相使用。 💡 队列类比: queue 像银行排队号码,任务按顺序等待 worker 处理。


8. 云与部署术语

Cloud

cloud 是通过互联网提供算力、存储、数据库和服务的基础设施。

Cloud-Native

cloud-native 指为云环境设计的应用,强调弹性、自动化、容器化和可观测性。

Container

container 是打包应用及其依赖的隔离运行环境。

Docker

Docker 是构建和运行 container 的常用工具。

Docker:把应用放进可移植 container,到处都能运行

Docker Image

Docker image 是 container 的模板,包含运行应用所需的文件和配置。

Dockerfile

Dockerfile 是定义如何构建 Docker image 的文件。

Kubernetes(K8s)

Kubernetes 是容器编排平台,用于部署、扩缩容和管理 container workload。

KEDA

KEDA 是 Kubernetes 事件驱动自动扩缩容工具。

StatefulSets

StatefulSet 是 Kubernetes 中管理有状态应用的资源类型。

Pod

Pod 是 Kubernetes 中最小部署单元,包含一个或多个 container。

Service(Kubernetes)

Kubernetes Service 为 Pod 提供稳定访问入口。

Ingress

Ingress 管理外部流量如何进入 Kubernetes 集群。

Deployment

Deployment 是 Kubernetes 中管理无状态应用副本和滚动更新的资源。

Autoscaling

autoscaling 是根据负载自动扩容或缩容。

Microservice

microservice 是把应用拆成多个小服务,每个服务负责一部分业务能力。

Serverless

serverless 是一种运行模型,开发者不直接管理服务器,按调用或资源使用付费。

Dapr

Dapr 是分布式应用 runtime,提供 service invocation、pub/sub、state、workflow 等能力。

Ray

Ray 是用于分布式计算和机器学习工作负载的框架。

IaC(Infrastructure as Code)

IaC 是用代码定义和管理基础设施。

Terraform

Terraform 是常用 IaC 工具,用声明式配置创建云资源。

Cloudflare R2

Cloudflare R2 是对象存储服务,类似 S3。

Cloudflare Workers

Cloudflare Workers 是边缘 serverless 运行环境。

CI/CD(Continuous Integration / Continuous Delivery)

CI/CD 是持续集成和持续交付流程,用自动化测试和部署减少发布风险。

CI/CD 流水线:从代码变更到几分钟内上线

Production

production 是真实用户使用的生产环境。

Staging

staging 是接近生产的预发布环境,用于最后验证。

Local Development

local development 是在开发者本机运行和调试项目。

Infrastructure

infrastructure 是应用运行所依赖的服务器、网络、存储、数据库和平台服务。

Scalability

scalability 是系统随负载增长而扩展的能力。

🔹 Cloud 示例: 应用部署到云上后,可以按需增加服务器。 🔹 Cloud-Native 示例: 云原生系统假设故障会发生,并通过自动化恢复。 🔹 Container 示例: container 把应用和依赖一起打包,减少环境差异。 🔹 Docker 示例: Docker 让同一个 app 在本地和云上以相同方式运行。 🔹 Docker Image 示例: image 是 container 的模板,可以推送到 registry。 🔹 Dockerfile 示例: Dockerfile 写明如何安装依赖、复制代码并启动应用。 🔹 Kubernetes 示例: Kubernetes 管理多个 container 的部署、扩缩容和恢复。 🔹 KEDA 示例: KEDA 可根据队列长度或事件量自动扩展 worker。 🔹 StatefulSets 示例: StatefulSet 用于需要稳定身份和存储的 workload。 🔹 Pod 示例: Kubernetes 中最小调度单位通常是 pod。 🔹 Service 示例: Service 给一组 pod 提供稳定访问地址。 🔹 Ingress 示例: Ingress 把外部 HTTP 流量路由到集群内部服务。 🔹 Deployment 示例: Deployment 描述应用应运行多少副本以及如何更新。 🔹 Autoscaling 示例: 请求增加时自动加副本,流量下降时自动缩容。 🔹 Microservice 示例: billing、auth 和 notification 可以是独立 microservice。 🔹 Serverless 示例: 函数按请求运行,空闲时无需管理服务器。 🔹 Dapr 示例: Dapr 提供服务调用、状态、pub/sub 和 workflow building blocks。 🔹 Ray 示例: Ray 用于分布式计算和并行任务。 🔹 IaC 示例: 用代码定义云资源,而不是手动点击控制台。 🔹 Terraform 示例: Terraform 可以创建 VPC、database 和 Kubernetes cluster。 🔹 Cloudflare R2 示例: R2 可存储图片、PDF 和备份对象。 🔹 Cloudflare Workers 示例: Workers 在边缘运行轻量 serverless 逻辑。 🔹 CI/CD 示例: 每次 push 后自动测试、构建并部署到 production。


9. 实时与语音 agent 术语

Realtime

realtime 指系统低延迟响应,使交互接近即时。

Streaming

streaming 是边生成边发送内容,而不是等全部完成后一次返回。

WebSocket

WebSocket 是支持浏览器和服务器双向实时通信的协议。

SSE(Server-Sent Events)

SSE 是服务器向浏览器持续推送事件的 Web 标准。

Event Stream

event stream 是连续的事件序列,系统可订阅并响应。

Voice Agent

voice agent 是通过语音听、说、理解和行动的 AI agent。

ASR(Automatic Speech Recognition)

ASR 是自动语音识别,把语音转成文本。

STT(Speech to Text)

STT 与 ASR 类似,指语音转文本。

TTS(Text to Speech)

TTS 是文本转语音。

VAD(Voice Activity Detection)

VAD 检测什么时候有人在说话,用于语音交互的 turn-taking。

Transcription

transcription 是把语音或视频内容转写成文本。

Synthesis(Speech)

speech synthesis 是生成语音的过程。

Turn-Taking

turn-taking 是语音对话中轮流说话和听的机制。

Interruption / Barge-In

barge-in 是用户在 agent 说话时打断它,系统需要停止或调整响应。

🔹 Realtime 示例: 语音客服必须边听边答,而不是等整段录音结束。 🔹 Streaming 示例: 模型逐 token 返回内容,用户不用等完整答案生成。 🔹 WebSocket 示例: 浏览器和服务器通过 WebSocket 保持双向连接。 🔹 SSE 示例: server-sent events 适合从服务器持续推送文本流。 🔹 Event Stream 示例: 订单、付款和发货事件可以形成 event stream。 🔹 Voice Agent 示例: 电话支持 agent 听用户说话、查询系统并口头回答。 🔹 ASR/STT 示例: 把用户语音转成文本,后续 agent 才能理解。 🔹 TTS 示例: 把 agent 的文字回答合成为自然语音。 🔹 Barge-In 示例: 用户说「等等,我说错了」,语音 agent 应立即停下并重新听。


10. 安全、保护与企业术语

Authentication(AuthN)

authentication 是确认“你是谁”的过程,例如登录。

Authorization(AuthZ)

authorization 是确认“你被允许做什么”的过程。

OAuth

OAuth 是常见授权协议,让应用在不直接拿到密码的情况下访问用户资源。

API Key

API key 是调用 API 的凭据。它应被当作 secret 管理。

Secret

secret 是敏感凭据,例如 API key、密码、token、证书。

RBAC(Role-Based Access Control)

RBAC 是按角色分配权限的访问控制方式。

Least Privilege

最小权限原则要求系统只获得完成任务所需的最小访问权。

PII(Personally Identifiable Information)

PII 是可识别个人身份的信息,例如姓名、邮箱、身份证号、地址。

Compliance

compliance 是遵守法律、监管、行业标准和内部政策。

Policy

policy 是组织定义的规则,说明什么允许、什么禁止、何时审批。

Prompt Injection

prompt injection 是攻击者通过输入诱导模型忽略原始指令或泄露信息的攻击。

Jailbreak

jailbreak 是绕过模型安全限制或行为规则的尝试。

Data Leakage

data leakage 是敏感数据被错误暴露、传输或写入不该去的地方。

Sandboxing

sandboxing 是把代码或 agent 行为隔离在受控环境中,限制损害范围。

Audit Trail

audit trail 是可追踪历史,记录动作、输入、输出、决策和责任主体。

🔹 Authentication 示例: 用户先登录,系统确认「你是谁」。 🔹 Authorization 示例: 登录后系统再判断「你能做什么」。 🔹 OAuth 示例: 用户授权 app 读取日历,但不交出密码。 🔹 API Key 示例: 服务用 API key 识别调用方并计费。 🔹 Secret 示例: 数据库密码和 token 必须放入 secret manager,而不是代码库。 🔹 RBAC 示例: finance role 可以查看发票,support role 不能。 🔹 Least Privilege 示例: agent 只拿完成任务所需的最小权限。 🔹 PII 示例: 姓名、邮箱、身份证号和医疗记录都可能是 PII。 🔹 Compliance 示例: 银行和医疗 agent 必须遵守行业监管要求。 🔹 Prompt Injection 示例: 用户试图让 agent 忽略系统规则,就是 prompt injection。 🔹 Audit Trail 示例: 审计日志记录 agent 调用了哪个工具、花了多少钱、谁批准了动作。


11. Agentic Commerce 与支付

这些术语描述 AI Worker 如何成为买方,也就是让它们在 human supervisor 定义的 authority envelope 内,自主为 compute、data 和 services 付费的 trust infrastructure。每个术语都可以回到论纲中的 agent 作为经济参与者 一节理解。

Agentic Commerce

agentic commerce 是 agent 代表人类或组织发现、选择、购买和结算商品或服务的商业模式。

Agents as Economic Actors

agent 作为经济参与者,意味着 agent 不只执行任务,还能在授权边界内采购资源、签署承诺和参与市场。

Authority Envelope

authority envelope 是权限边界,定义 agent 能做什么、能花多少钱、何时必须升级。

Trust Layer

trust layer 是让 agent 交易可信的层,包括授权、审计、责任、支付和身份。

Signed Mandate

signed mandate 是带密码学签名的授权,证明人类已允许 agent 在某个范围内行动。

ACP(Agentic Commerce Protocol)

ACP 是 OpenAI 和 Stripe 推动的 agentic commerce 协议,用于聊天内结账和授权。

AP2(Agent Payments Protocol)

AP2 是 Google 推动的 agent 支付协议,围绕签名授权和跨供应商互操作设计。

x402

x402 是 Coinbase 推出的 HTTP-native / crypto-native 机器支付协议。

MPP(Machine Payments Protocol)

MPP 是面向机器和 agent 的支付协议,尤其适合微支付和持续消费。

🔹 Agentic Commerce 示例: agent 替用户比较供应商、购买服务并完成结算。 🔹 Economic Actor 示例: AI Worker 在预算内购买数据集以完成分析任务。 📌 Authority Envelope 示例: 人类允许 agent 每月最多花 $500 购买云服务。 💡 Trust Layer 类比: trust layer 像商业世界的护照、签名和收据系统。 🔹 Signed Mandate 示例: 用户签署数字授权,允许 agent 在指定类别内付款。 🔹 ACP 示例: ChatGPT 内完成即时购物结账时,ACP 处理授权和清算。 🔹 AP2 示例: agent 携带加密签名 mandate,证明人类授权了这笔交易。 🔹 x402 示例: agent 使用 HTTP-native payment 为 API 调用即时付费。 🔹 MPP 示例: agent 每秒支付几分钱使用流式服务,普通信用卡手续费无法支持这种粒度。


12. 监控、质量与 LLMOps

LLMOps

LLMOps 是运行、监控、评估和改进 LLM 应用的工程实践。

Logging

logging 是记录系统事件、错误、输入、输出和动作。

Tracing

tracing 跟踪一次请求或 agent run 经过的步骤、工具调用和时间。

Telemetry

telemetry 是系统自动收集的运行数据,例如指标、日志、trace。

Observability

observability 是从外部信号理解系统内部状态的能力。

Evaluation / Evals

evals 是系统化评估 AI 行为的方法,包括准确性、安全性、工具使用、格式和业务结果。

Offline Eval / Online Eval

offline eval 在离线数据集上运行;online eval 在真实或近真实流量中评估。

A/B Testing

A/B testing 比较两个版本在真实用户或任务上的效果。

Regression Test

regression test 确保新变更没有破坏过去已经正确的行为。

Prompt Versioning

prompt versioning 是管理 prompt 版本、变更和回滚的实践。

Model Versioning

model versioning 是跟踪模型版本和行为差异。

Drift

drift 是系统行为、数据分布或质量随时间偏离预期。

Monitoring

monitoring 是持续观察系统健康、性能和错误。

SLA(Service Level Agreement)

SLA 是服务提供方承诺的服务水平协议。

SLO(Service Level Objective)

SLO 是内部设定的服务目标,例如延迟、可用性、错误率。

Incident

incident 是影响系统正常运行的事件,需要响应、修复和复盘。

Rollback

rollback 是把系统恢复到之前稳定版本。

🔹 LLMOps 示例: 团队跟踪 prompt、model、eval 和 deployment,让 LLM 应用可运营。 🔹 Logging 示例: 每次工具调用、输入摘要和错误都写入 log。 🔹 Tracing 示例: trace 展示一次请求经过哪些 agent、工具和服务。 🔹 Telemetry 示例: 系统持续收集 latency、error rate 和 token usage。 🔹 Observability 示例: 出问题时能快速回答发生了什么、在哪里发生、为什么发生。 🔹 Evaluation 示例: 用固定测试集检查客服 agent 回答是否准确。 🔹 Offline / Online Eval 示例: 离线 eval 用历史样本,在线 eval 观察真实流量表现。 🔹 A/B Testing 示例: 同时测试两个 prompt,看哪个产生更高解决率。 🔹 Regression Test 示例: 新版本不能破坏之前已经通过的关键行为。 🔹 SLA / SLO 示例: SLA 是对客户承诺,SLO 是内部可靠性目标。 🔹 Rollback 示例: 新部署错误率升高时,立即回到上一个稳定版本。


13. 协议与标准

AAIF / Agentic AI Foundation

AAIF 指 agentic AI 相关的基金会或标准化组织语境,用于推动开放生态和互操作。

A2A(Agent-to-Agent Protocol)

A2A 是 agent 之间通信、委派和协作的协议类别。

OpenAPI

OpenAPI 是描述 HTTP API 的标准格式,便于文档生成、客户端生成和工具调用。

🔹 AAIF 示例: 标准组织可以定义 agentic AI 的术语、协议和互操作要求。 🔹 A2A 示例: 一个 research agent 把任务交给 analysis agent,需要 agent-to-agent 协议。 🔹 OpenAPI 示例: agent 可读取 OpenAPI spec,知道如何调用发票 API。


14. 商业、产品与战略术语

SaaS(Software as a Service)

SaaS 是软件即服务,用户按订阅访问软件,而不是购买永久许可。

Per-Seat Software

per-seat software 按用户席位收费。Agent 时代会把价值从席位转向结果。

Workflow Automation

workflow automation 是把重复流程自动执行。

ROI(Return on Investment)

ROI 是投资回报,用收益与成本比较衡量投入是否值得。

Operating Model

operating model 是组织如何运作、分工、决策和交付价值的模型。

Monetization

monetization 是把产品、能力或结果转化为收入。

Managed Subscription

managed subscription 是订阅加托管服务,客户购买的不只是软件,还有运营支持。

Success Fee

success fee 是按成功结果收费,例如按关闭工单、节省成本或成交收入计费。

Enterprise License

enterprise license 是面向企业客户的大规模许可合同。

Skill Marketplace

skill marketplace 是分发、购买或共享 agent skill 的市场。

Domain Expertise

domain expertise 是某个领域的专业知识和判断,例如法律、财务、医疗。

Reusable Intellectual Property

reusable intellectual property 是可复用的知识资产,例如模板、spec、skill、评估集。

Hybrid Workforce

hybrid workforce 是人类员工和 AI Worker 共同组成的劳动力。

Outcome-Based Pricing

outcome-based pricing 是按结果收费,而不是按访问权、时间或席位收费。

Gain-Share Model

gain-share model 是按创造的收益或节省的成本分成。

Hyperscaler

hyperscaler 是超大规模云厂商,例如 AWS、Microsoft Azure、Google Cloud。

Go-to-Market(GTM)

GTM 是产品进入市场、获取客户、销售和增长的整体动作。

Consultative Selling

consultative selling 是以理解客户问题和提供方案为核心的顾问式销售。

Agile Development

agile development 是迭代式开发方法,强调快速反馈、小步交付和持续改进。

Stakeholder

stakeholder 是受项目影响或对项目有权责的人或群体。

Vertical Market

vertical market 是特定行业或细分领域市场,例如医疗、法律、金融。

🔹 SaaS 示例: 用户按月订阅项目管理软件,而不是安装本地软件。 🔹 Per-Seat Software 示例: 每增加一个用户就多付一个 seat license。 🔹 Workflow Automation 示例: 自动把审批请求从表单送到经理,再写回记录系统。 🔹 ROI 示例: 如果 agent 每月节省 $10000 人力成本,而成本 $2000,ROI 很清楚。 🔹 Operating Model 示例: 公司决定哪些工作由人做、哪些由 AI Worker 做,就是 operating model。 🔹 Monetization 示例: AI-native 产品可以按结果、订阅或 success fee 收费。 🔹 Managed Subscription 示例: 客户付费让供应商持续运营和改进 agent。 🔹 Success Fee 示例: agent 成功追回欠款后,供应商按追回金额收取比例。 🔹 Enterprise License 示例: 大客户购买覆盖整个组织的许可和支持。 🔹 Skill Marketplace 示例: 团队购买已验证的合同审查 skill,再装入自己的 worker。 🔹 Domain Expertise 示例: 税务专家把判断规则写入 skill,使 agent 不只是通用聊天。 🔹 Reusable IP 示例: 一次封装的审计流程,可以在多个客户项目中复用。 🔹 Hybrid Workforce 示例: 人类员工和 Digital FTE 一起完成运营工作。 🔹 Outcome-Based Pricing 示例: 客户按解决工单或生成合格 lead 付费,而不是按 seat。 🔹 GTM 示例: go-to-market 包括营销、销售、客户转化和收入运营。 🔹 Vertical Market 示例: 面向牙科诊所的 agent 产品,就是垂直市场产品。


15. 本书引用的工具与产品

Claude

Claude 是 Anthropic 的 AI 模型和产品家族。

GPT

GPT 是 OpenAI 的生成式预训练模型系列名称。

Gemini

Gemini 是 Google 的 AI 模型和产品家族。

Anthropic

Anthropic 是构建 Claude 和相关 AI 产品的 AI 公司。

OpenAI

OpenAI 是构建 ChatGPT、GPT、OpenAI Agents SDK 等产品和平台的 AI 公司。

OpenAI Agents SDK

OpenAI Agents SDK 是构建 agent loop、tool use、handoff、guardrails 和 tracing 的 SDK。

Google ADK(Agent Development Kit)

Google ADK 是 Google 面向 agent 开发的工具包。

FastAPI

FastAPI 是 Python Web API 框架,常用于构建后端服务和 agent API。

Docusaurus

Docusaurus 是静态文档网站框架,本书网站使用它组织文档。

Markdown

Markdown 是轻量标记语言,用纯文本写标题、列表、链接、代码块等。

VS Code(Visual Studio Code)

VS Code 是常用代码编辑器。

AWS(Amazon Web Services)

AWS 是 Amazon 的云计算平台。

GCP(Google Cloud Platform)

GCP 是 Google 的云计算平台。

Azure

Azure 是 Microsoft 的云计算平台。

Cloudflare

Cloudflare 提供边缘网络、安全、Workers、R2 和其他云服务。

🔹 Claude 示例: Claude 可用于写作、推理、coding 和 agent workflow。 🔹 OpenAI Agents SDK 示例: 开发者可以用 SDK 构建自托管 agent workflow。 🔹 FastAPI 示例: Python 服务可用 FastAPI 快速暴露 API endpoint。 🔹 Docusaurus 示例: 本书网站就是用 Docusaurus 组织和发布文档。 🔹 Cloudflare 示例: 静态资源、edge function 和对象存储可由 Cloudflare 提供。