Skip to main content

2026 年 AI Prompting:45 分钟速成课

13 个概念,覆盖真实使用的 80%

大多数人像用 Google search 一样使用 AI:输入一个短问题,扫一眼答案,然后离开。这适合 trivia;但一旦问题真正影响你的生活和工作,它就会失败。

高手会做另一件事。他们像 brief 一位聪明但刚入职的同事那样 brief AI:给文件、给上下文、给约束、给明确请求。他们要求 3 个选项,而不是接受第一个答案。他们会争辩、迭代、检查工作。novice prompt 与 power-user prompt 的差距不是聪明,而是一组任何人下午就能学会的习惯。

这一页就是那个下午。13 个概念,分成 4 个短部分。没有代码、没有 setup、没有脱离上下文就无法猜懂的 jargon。让其他内容都变得清晰的唯一洞见是:本页几乎所有「高级技巧」都可以归结为两个动作之一:把正确上下文放进去,或把错误上下文挡在外面。 请用这个 lens 阅读每一节。

工具说明:示例会提到 ChatGPT、Claude 和 Gemini,因为大多数读者至少有其中一个。技能可以迁移到任何现代 chat AI。某项功能只属于某个产品时,会明确点名。

如何阅读本页

现在就打开另一个浏览器标签页,注册 Claude、ChatGPT 或 Gemini 中任意一个免费账号。每个都有 free tier,注册大约一分钟。现在还不用操作,只要打开即可。先通读一遍,把形状读出来;最后再回到 closing block 试 prompts。不尝试只能得到词;尝试才会得到技能。(最后练习中有一个会要求并排比较两个工具,所以到时候你可能还想打开第二个免费账号。)

你上次看过之后,发生了什么变化

如果你在 2022 或 2023 年用过 ChatGPT,并认定它只是聪明玩具,那么你记忆中的工具已经不是今天的工具。几个变化悄悄发生了:

  • Context windows 大约增长了 1000 倍。 2022 年的模型只能容纳几千个词;2026 年的模型可以容纳几十万,甚至一百万。这改变了你能塞进 prompt 的东西:整本书、几天语音、一整文件夹合同。
  • Reasoning 变成了真实能力。 以前 "think step by step" 像一句咒语;现在 models 有明确 thinking modes,会花几秒甚至几分钟探索多种 approach 再回答。它们能处理的问题类别正在快速上升。
  • Web search 和 code execution 成为内置 tools。 模型会决定何时搜索 web 或运行 code,然后把结果作为 answer 的一部分。这对多数用户是 invisible;一旦知道它发生了,prompts 会立刻变 sharp。
  • Multimodal 不再是旁支。 你可以把 photo、PDF、spreadsheet、voice memo 或 files folder 丢进 prompt,并围绕它们提问。model 会在一条 stream 中处理这些东西。
  • Desktop apps 出现了。 Cowork、Microsoft Copilot 这类新产品能在授权下找到你的 files 并采取行动。这已经不是 chat,更接近把小任务委派给 coworker。

如果你的 mental model 落后 18 个月,你今天可能只用了这些工具 20% 的能力。本页会补上这个差距。


Part 1: AI 如何知道事情

一旦理解你向 AI 提问时实际发生了什么,你就不会再被它的失败方式吓到。

1. Novice vs power user

观察两种 prompt 的差异。问题相同;briefing 不同。

并排对比:novice 问「我应该买哪辆车?」得到通用的三车型列表。power user 附上保险报价、dealer quotes 和 cost-of-ownership spreadsheet,并给出关于 30 分钟通勤和两个儿童座椅的具体 brief,得到结构化五年成本比较、安全分析,以及在不同条件下反转的 Honda CR-V 推荐。同一个 AI,不同 briefing,不同答案。

几个真实对比:

  • 买车。 Novice:"which car is best?" Power user:上传 spec sheets、dealer quotes 和 insurance plans,再要求 "what are the trade-offs? Read everything and think hard."
  • 工作 self-review。 Novice:"write a self-review for my boss." Power user:上传项目 tracker 截图、近期项目 docs、语音 notes,再要求 draft。
  • 批评商业想法。 Novice:"I have a great business idea, mobile tie-dyeing, critique it." 这是 sycophancy bait,AI 多半会赞美。Power user:"Analyze objectively. Use this rubric: is there a problem worth solving, is there a market, is there a competitive advantage?" AI 给了 8/100,并解释原因。
  • 写博客。 Novice:"write a blog post about the BlackBerry." 结果是 AI slop。Power user:先 outline,critique outline,把每个 heading 展开成 bullets,critique bullets,最后才要求 prose。

把这些连起来的 mental model 是:AI 像一个非常聪明的新毕业生。很积极,但还不了解你。 像 brief 这样的人一样 brief 它。一个新同事是否拥有足够信息来把工作做好?没有的话,就给更多信息。

2. Pretrained knowledge

AI 不是通过「阅读世界」学习的;它通过阅读关于世界的文本来学习。具体说,是海量 internet text:Reddit、Quora、Wikipedia、books、news、research papers、blogs、forums。

training data 中出现得越频繁,answer 往往越可靠:

  • **强:**烹饪、celebrity gossip、常见医疗建议、top-1000 movies、流行 programming languages、Voyager 1 record 上有什么、猫为什么盯着墙。
  • **稀疏:**quasars、Cantonese、regional history、niche professional knowledge。
  • **不存在:**你公司的 secret data、private calendar、knowledge cutoff 之后发布的内容、从未出现在 public internet 上的东西。

两个实践后果:

不要浪费时间修 typos。 AI 在充满 typos 的 internet text 上训练,拼错 "definately" 通常不会改变答案。

警惕吸收来的错误。 AI 也吸收了同一批 sources 中的 misconceptions 和 outdated information。论坛里一条自信错误的帖子,可能变成模型里自信错误的答案。重要内容请对 primary source 检查。

为什么这对 thinking 重要

Part 0 会教你检测 broken reasoning。第一个要检查的位置,是那些听起来很自信、但 training data 很薄或有争议的 pretrained answers。Confidence 不是 correctness 的 signal。

信任 pretrained answer 前,可以做一个快速 mental test:

问题类型training data 中代表性如何?信任等级
"How do I make a roux?"cooking 是互联网上讨论最多的主题之一。高。
"Plot of a top-1000 movie."被评论、复述过成千上万次。高。
"History of an obscure village."可能只有一段 Wikipedia,甚至没有。低;对 primary source 验证。
"Recent regulatory change in my industry."几乎肯定在 knowledge cutoff 之后。没有 web search 前不要信。
"What did our company decide last quarter?"training data 中完全不存在。不要信;model 在猜。

这不是要死记的规则。它和你判断任何 source 的 instinct 一样:"这个人怎么会知道?" 对 AI 也这样问。

3. 三种 retrieval modes:pretrained、web search、deep research

现代 AI 工具回答问题时,会悄悄选择方式:只用 pretrained knowledge 回答;触发 web search 并读取少数页面;或运行 deep research,花几分钟扫描几十个 sources,并写结构化 report。

你应该知道正在触发哪种 mode,因为每种 mode 的 strengths 和 failure modes 不同。

三种 retrieval modes:从左到右是 cost 与 depth 的 ladder。Mode 1(Pretrained)最快,几秒完成,只用 training data,适合 definitions 和 common facts,但对 stale 或 local info 很弱。Mode 2(Web search)中等速度,几十秒读取少量 live pages,适合 current events 与 quick research,但会优先引用 popular sources。Mode 3(Deep research)最深,几分钟扫描 dozens of live pages,适合 multi-dimensional structured reports;慢,并且对简单问题 overkill。左侧 fast and shallow,右侧 slow and deep。AI 通常替你选择;prompt wording 是方向盘。

几个具体例子:

  • Pretrained answers 足够:"why do cats stare at walls"、"what's on the Voyager 1 record"、"summarize the plot of Hamlet"。这些不会每周变化。
  • **Web search 拯救 stale model:**每个 model 都有 knowledge cutoff;之后 viral 的 meme、regulation、product launch 对它不可见。没有 web search,它不知道你在说什么;有了 web search,它读取 recent article 并正确回答。
  • **Web search 出错:**有人问 "where to run in Henderson, Nevada",AI 引用 20 年前网页,推荐了不再对公众开放的学校。web search 不会自动确认 source 是否 current。
  • Deep research 值得等待:"plan a Halloween haunted house in our neighborhood, including permits, fire safety, and noise ordinances." AI 提出 research plan,并行搜索,summarize,再决定继续挖哪里,最后给出带 checklists 的 multi-section report。
Web search 实际如何工作(以及为什么它有时会误读页面)

底层机制因工具而异,但形状类似:一个 search-and-retrieval layer 发起 searches、扫描 results、拉取 relevant pages,并把每页压缩为短 passage 或 summary。这个 layer 往往是另一个较小 model。只有压缩版本会流入与你对话的 user-facing model

所以,与你对话的 model 经常没有直接阅读原始页面;它读的是 condensed version。这就是为什么它有时会误述页面内容:信息在到达 model 前穿过了 translation layer,而 translation layer 会丢 nuance。

实践修复:告诉 AI 使用哪类 sources。例如不要问 "are vaccines safe",而是说 "use the World Health Organization, the FDA, the European Medicines Agency, and peer-reviewed studies. Do not use forums or personal blogs." source quality 是你能调的 knob。

第二个修复:要求 AI quote source。"For each claim, quote the exact sentence from the source page that supports it." 这会迫使 retrieval layer 浮出原文,抓住很多 summary-layer drift。

在脑中选择 mode。 通常你不点击按钮选择 mode;AI 会根据 prompt 选择。但你可以 steer:

phrasing pattern通常触发什么
"What is X" / "Summarize Y"只用 pretrained。
"What's the latest on X" / "Today" / "This week" / 具体城市Web search。
"Research X thoroughly," "produce a report with citations," "use these source types"Deep research(有该功能的工具中;否则是 extended web search)。
Attaching files对 files 本身用 pretrained;如果 prompt 要求 current info,可能再 search web。

AI vs Google。 它们不是同一个工具。用 Google 做 quick scans、导航到已知 specific site、买东西。用 AI 做 synthesis:pros and cons、multi-source comparison、写出的 analysis。问题是你要 link,还是要 answer。

TaskGoogle 更好AI 更好
"Find the official IRS page for form 1040."是。你要到 specific known site。否。
"Compare three diabetes medications and what the recent evidence says."慢。你会读 8 个 tabs。快。AI 把 evidence 合成到一处。
"Buy a replacement charger for a 2018 ThinkPad."是。你要 product link。否。
"Plan a 4-day Lisbon trip with a 6-year-old, no museums."慢。你会在 blogs 与 reviews 间切换。快。AI 整合 constraints。
"What's the weather tomorrow?"都可以。都可以。
"Why are my tomato plant leaves yellowing?"可以。多个 gardening sites。附上 photo 后更好。

如果问题是「X 在哪里」,用 Google。如果问题是「在这些信息下我该怎么想」,用 AI。

如何获得更可靠的 web-search results
  1. 说出你信任的 sources。 "Use the WHO, the FDA, and peer-reviewed studies, not forums."
  2. 要求 inline citations。 "Cite the source after each claim."
  3. 要求 AI 标出无法验证的内容。 "If a claim cannot be supported by the cited sources, mark it 'unverified'."

这三行能减少最常见 failure mode:AI 悄悄跨 sources 综合,并写出一句没有单一 source 支撑的 confident sentence。


Part 2: 好好与 AI 对话

4. Context is the whole game

人类 active working memory 能同时抓住的东西很少。现代 AI models 可以一次容纳几十万 words,有时甚至一百万。大约 750,000 words 相当于前 4 到 5 本 Harry Potter,或连续几天的语音。model 可以在回答前读完这些。

但它只能读你给它的东西。context 是某次 response 中进入 model window 的一切:产品设置的 system prompt、tools descriptions(web search、code、file access)、你的 prompt、chat history,以及你上传的 files。

Context stack:五层垂直堆叠,合起来构成 model 对某次 response 所知道的一切。从上到下:uploaded files(PDFs、spreadsheets、images、voice memos)、chat history、your prompt(每次都由你编辑,突出显示)、tool descriptions(web search、code execution、file access),以及底部由 AI tool 设置的 invisible system prompt。model 只知道这个 stack 中的东西;容量约 750,000 words 或 4–5 本 Harry Potter;你没放进 stack 的东西,对本次 answer 就不存在。

具体对比:

  • Bare prompt:"pros and cons of studying physics versus zoology." 你会得到通用 high-school-counselor advice。
  • **Context-rich prompt:**同一个问题,加上你的 career assessment PDF 和 high-school schedule screenshot。现在 AI 能谈你的具体 aptitude profile、course history,以及哪种选择适合什么条件。

同一个 model。同一个问题。不同 answer。差异来自 context,不是 prompt cleverness。

你正在学习的纪律是:按 send 前,问自己一位聪明的新同事要把这事答好,需要面前有什么。 然后附上那些东西。这个同事会认真阅读你放在面前的一切;它不会猜你没说的,不会搜索你的文件柜,不会推断你的行业、团队历史或昨天的邮件线程。

问题如果是,就 attach 或 describe
answer 需要与某个 document 保持一致吗?是:attach。
是否有 AI 无法 infer 的 constraint(budget、time、team)?是:state it。
是否有 prior context(previous decision、existing process)?是:一段话 summarize。
是否有 output format(table、email、bullet list)?是:name it。
是否有 audience(boss、child、stranger)?是:name them。

五行选对的 context,胜过五段 cleverness。

Context rot

现代 context windows 很大,但不是无限,而且 recall 会在其中退化。最大的实践错误是:在一条很长 conversation 中不断跨 unrelated topics。AI 刚帮你 plan workout,现在你让它 debug spreadsheet,再让它写给 aunt 的 thank-you note。workout context 仍在里面,干扰 model。

经验规则:topic 变化时,开启 new conversation。 便宜、免费,而且 answer 会明显更好。

5. Reasoning,或「think hard」

Reasoning mode 不是魔法短语,而是让 model 花更多 compute 进行 search、compare、revise,再回答。适合需要推理、权衡或多步骤判断的任务。不适合简单查询。

适合:

Read these three proposals and tell me which one is strongest for a two-person team with a $10k budget. Think through trade-offs before recommending.

不适合:

What's the capital of France?
什么时候不要用 thinking mode

不要为 trivial lookup、简单 rewrite、短 email、格式转换、已知步骤的重复任务开启 thinking。它会更慢、更贵,而且未必更好。把 reasoning budget 留给真正需要它的地方。

6. Sycophancy and how to neutralize it

AI 会倾向于顺着你说,尤其当你的 prompt 已经暗示你想被赞同时。修复方法不是要求「be honest」这种空话,而是改变 frame。

差的 prompt:

I have a great startup idea. Tell me why it will work.

更好的 prompt:

Evaluate this idea objectively using a strict rubric:
1. Is there a painful problem?
2. Is there a reachable market?
3. Is there a defensible advantage?
4. What evidence would disconfirm it?
Score it from 0 to 100 and do not soften the critique.
这是 mechanical,不是 deep

你不是让 AI 变得「更诚实」;你是在改变它被要求完成的 task。rubric、counterarguments、disconfirming evidence 和 explicit score,会把 reply 从 praise mode 拉回 evaluation mode。

7. The brainstorm-iterate loop

最常见的低质量做法,是要求 AI 一次性写出 final。更好的做法是先扩散,再反馈,再收敛。

Brainstorm-iterate loop:load context,要求 3–5 个 options,给 explicit feedback,在 options 与 feedback 之间迭代 2–3 次,最后才展开 chosen option。

基本 loop:

Give me 5 possible approaches. Do not write the final answer yet.
Option 2 is closest, but it is too formal. Option 4 has the right structure, but the examples are weak. Make 3 revised options.
Use the best parts of options 2 and 4. Now draft the final version.
不要跳步骤

如果你直接要求 final,AI 会锁定第一条路径。先要 options,再 critique,再 expand,通常能让同一个 model 输出高一个档次。


Part 3: Beyond text

8. Multimodal:images、audio,以及接下来会发生什么

2026 年的 AI 不只是 text box。你可以上传 screenshot、photo、PDF、spreadsheet、voice memo、slide deck,让 model 直接围绕它们工作。prompt 重点也随之变化:你不再只描述问题,而是把 evidence 放进去。

常见模式:

  • screenshot:让 AI 解释 error、UI、invoice 或 form。
  • photo:让 AI 判断 plant disease、房间布局、whiteboard notes。
  • PDF:让 AI 对比合同、summarize report、抽出 deadlines。
  • audio:让 AI 把 meeting notes 转成 action items。
  • folder:让 AI 从一组 files 中找到 pattern。

多模态不是「更酷的输入」。它减少了你手动描述现实的负担,也减少了描述错误。

9. Building small apps with one prompt

当 AI 可以写 code、run code、preview UI 时,一个 prompt 可以生成小工具:calculator、dashboard、quiz、data explorer、mockup。秘诀仍然是 context 和 constraint。

弱 prompt:

Build me a budgeting app.

强 prompt:

Build a single-page budget calculator for a freelancer. Inputs: monthly income, fixed costs, tax percentage, savings target. Output: monthly safe-to-spend number and a simple bar chart. Keep it local-only, no login, no backend.

10. Data analysis(model writes and runs code)

数据分析不是让 model 猜表格,而是让它写 code 读取数据、清洗数据、计算、画图,然后解释。你给 spreadsheet,它写 Python 或 JS 去 analyze。你的 prompt 应该指定 question、columns、acceptable assumptions 和 output format。

一个有用模式:先问它会画什么 chart

在让 AI 直接分析前,先问:"What charts would you draw to answer this question, and why?" 这能在它运行 code 前暴露错误的 interpretation。


Part 4: Working safely and choosing tools

11. AI desktop apps and permissions

Desktop AI apps 能读取 files、calendar、mail、browser context,甚至代表你点击或执行 actions。能力越强,permission discipline 越重要。

给任何 AI app 文件访问权之前先读这段

只给完成任务所需的最小 access。不要把整个 home folder、password vault、tax files 和 client data 一次性全给它。先从 read-only、单个 folder、单个 task 开始;观察它如何行动,再扩大权限。

12. Cost, speed, and which model to use when

不同 modalities 的 iteration cost 差异很大。text 最便宜、最快,所以可以多次迭代。speech 贵一点。images 一次 generation 要几十秒和几美分。video 以分钟和更多成本计,iteration 痛苦得多。

按 modality 展示 cost 和 speed 的横向 bar chart:text iteration 几秒完成,成本是 fractions of a cent,所以一下午可以迭代 50 次。speech 每分钟几美分。images 每次 generation 需要几十秒和几美分,不能 early-stop。video 每 clip 需要几分钟,成本从许多美分到数美元;video iteration 成本大约是 text 的 16 倍。成本逐年下降,所以 bar lengths 会缩短,但排序不会变。

实用规则:

  • 简单 rewrite、brainstorm、formatting:用快而便宜的 model。
  • 多步骤 reasoning、高 stakes decision、复杂 code:用 reasoning model。
  • 当前信息:打开 web search。
  • 多 source report:用 deep research。
  • 需要验证:让另一个 model 检查,或让同一个 model 按 rubric 自评。
一个很值的小 ritual

开始重要任务前,先问:"What information would you need to do this well?" 让 AI 先列缺口,再给它材料。这个 ritual 比大多数 prompt hacks 更可靠。

13. Models checking models

重要工作需要 review。AI 也一样。最轻量做法是让同一个 model critique 自己;更强做法是让第二个 model 从不同角度检查。

The single-model self-critique loop, by itself

  1. 要求 model 按 rubric 给 output 打分。
  2. 让它列出 weakest parts。
  3. 让它重写。
  4. 重复,直到分数 plateau。

cross-model technique 的三层版本,从左到右复杂度递增。Level 1:Concept 6 rubric critique,一次 pass 后停止,用于 quick sanity checks。Level 2:single-model self-critique loop:score、implement、repeat,通常 plateau around 9,用于 drafts 与 emails。Level 3:multi-model loop:self-critique loop 加上第二、第三个 model cross-checking,用于 high-stakes work。being wrong 越贵,就从轻量升级到重量级。


A short recap before you try the prompts

这 13 个概念可以压缩成一句话:把 AI 当作聪明的新同事,给它正确 context,明确 task,要求 options,迭代,检查,高 stakes 时用 search、deep research 或 second model。

Try this now: eleven prompts before the Thinking Baseline

把这些 prompts 直接拿去试。不要只阅读;skill 来自尝试。

I want to learn how to use you well. Ask me five questions about my work, then suggest three ways you can help this week.
Here is a messy note. Turn it into a clear action list with owners, deadlines, and missing information.
Give me five approaches before writing the final answer. Do not decide yet.
Critique this idea using a strict rubric. Score it from 0 to 100 and tell me what evidence would change the score.
What context would you need to answer this well? List missing documents, constraints, and decisions before answering.
Use web search and cite sources inline. Mark anything you cannot verify as unverified.
Research this thoroughly and produce a structured report with citations, trade-offs, and open questions.
Look at this screenshot/photo/PDF and tell me what matters, what is uncertain, and what you would ask next.
Analyze this spreadsheet. First tell me which charts you would draw and why; then run the analysis.
Review your own answer using this rubric, then rewrite it once.
Give the same task to a second model or tool, compare the answers, and tell me where they disagree.