AI Literacy · 内训材料

Vol.01

Artificial Intelligence Literacy

人工智能通识

从原理到应用的认知框架

理解大语言模型的本质、边界与生态，建立与 AI 协作的正确认知。

2026·内部分享

一场关于 AI 原理 · 边界 · 应用的分享

— 2026 —

第一幕 · 四年风云

Act I · 02 / 29

Act I

四年风云

2022—2026，AI 从实验室走向世界的关键历程。

第一幕引子

— · —

关键时间线 · 2022—2023

Act I · 03 / 29

The Beginning

惊世发布与开源浪潮

大模型从惊艳demo走向产业化的起点。

2022.11

ChatGPT 3.5

惊世发布，第一次让全球普通人感受到对话式 AI 的震撼。

2023.03

GPT-4

人工智能迈入成熟价值期，多模态与推理能力大幅提升。

2023.07

Llama2 & Qwen

Meta 与阿里相继开源，降低行业门槛，生态爆发前夜。

"2022 年 11 月 30 日，OpenAI 发布 ChatGPT。五天内用户破百万——这是人类历史上增长最快的消费级应用。"

— 一个时代的起点

时间线 · 2022—2023

Act I

关键时间线 · 2024

Act I · 04 / 29

Reasoning Revolution

推理革命开启

AI 从"快速直觉"进化到"深度思考"。

2024.05

GPT-4o

低成本、高情绪价值的里程碑模型发布，多模态实时交互成为现实。

2024.09

OpenAI o1

通过思维链(CoT)强化学习，解决复杂逻辑、数学、代码难题。AI 学会"深度思考"。

快速直觉

像人一样凭直觉秒答，但面对复杂问题容易出错。

深度思考

像人一样拆解问题、逐步推理，解决此前无法触及的难题。

时间线 · 2024

Act I

关键时间线 · 2025—2026

Act I · 05 / 29

The New Landscape

开源奇迹与格局定型

边际增量递减，但生态已彻底重塑。

2025.01

DeepSeek R1

以极低成本实现对标 o1 的推理性能，毫无保留开源。彻底重塑全球 AI 算力与经济逻辑。

2026.04

格局定型

模型能力边界持续推进，但边际增量递减。闭源与开源两条路线并行成熟。

全球闭源 SOTA

Claude Opus 4.7 · GPT-5.5

中国开源主导

Qwen3.6 · Kimi 2.6 · GLM-5 · MiniMax · DeepSeek V4

时间线 · 2025—2026

Act I

第二幕 · 它到底是什么

Act II · 06 / 29

Act II

它到底是什么

理解大语言模型的本质，是一切应用的起点。

第二幕引子

— · —

核心原理 · The Essence

Act II · 07 / 29

Next Token Prediction

本质是猜词

大语言模型并不"理解"语言。它只是看了海量的文本，学会了在已知前文的情况下，预测下一个最可能出现的词。

"就像你听到'床前明月'，脑子里会自然蹦出'光'。模型做的就是这个——只是它看过万亿级别的文本。"

— 直觉类比

输入

今天天气很____

模型预测的概率分布

好

72%

差

18%

热

7%

蓝

3%

输出

今天天气很好

Page 07 · 猜词原理

Act II

核心原理 · Probability

Act II · 08 / 29

基于概率的文本生成

不是思考，是采样

模型每次只输出一个词，然后把这个词拼回输入，再预测下一个词。循环往复，直到生成完整回答。

这个过程中没有"思考"，没有"计算器"，也没有"搜索引擎"。它只是一个极其庞大的概率表——根据前文，选出概率最高的下一个词。

"它写的每一个字，都是'看起来最像正确答案'的字，而不一定是'正确答案'。"

— 关键认知

INPUT

↓

神经网络计算

trillion 参数 · 概率分布

↓

SAMPLE NEXT TOKEN

↓

APPEND & REPEAT

Page 08 · 概率生成

Act II

第二幕 · 边界

Act II · 09 / 29

The Limits

它不能做什么？

知道边界，才能用好工具。大语言模型有三个致命的先天缺陷。

Page 09 · 边界认知

— · —

边界 · 缺陷一

Act II · 10 / 29

Limit 01

无计算能力

大语言模型没有内置计算器。它依靠"记忆"和"模式匹配"来处理数字，面对复杂运算时几乎必然出错。

因此，不能用大语言模型直接进行计算或统计。

— 铁律

测试案例

23,894 × 1,203 = ?

真实答案 28,744,482

模型可能输出 28,745,682

Why? 模型没有执行算术运算的模块。它"猜测"数字的方式和猜词一样——靠概率，不靠计算。

Page 10 · 无计算能力

Act II

边界 · 缺陷二

Act II · 11 / 29

Limit 02

无逻辑推理

模型不真正"理解"因果关系。它能模仿逻辑的表达形式，但无法保证推理过程的严谨性和正确性。

因此，复杂逻辑推导和判断，不能依赖大语言模型。

— 铁律

经典陷阱

晾干 3 件衣服需要 3 小时。
晾干 30 件需要多久？

直觉错误 30 小时

正确理解 3 小时（并行晾干）

模型容易被表面数字关系误导，因为它不具备真正的物理常识和因果推理能力。

Page 11 · 无逻辑推理

Act II

边界 · 缺陷三

Act II · 12 / 29

Limit 03

无事实确认

模型没有接入实时信息，也无法验证自己说的话是否真实。它可能"一本正经地胡说八道"——这在 AI 领域被称为"幻觉"。

因此，所有依赖真实世界事实的信息获取，不能依赖大语言模型。

— 铁律

测试案例

请问昨晚的世界杯决赛谁赢了？

模型可能会给出一个看起来非常合理的答案——包括比分、进球球员、甚至精彩瞬间的描述——但这些可能是完全编造的。

幻觉不是 bug，是架构特性。模型被训练成"总是给出一个完整的、流畅的回答"，而不是"在不知道时保持沉默"。

Page 12 · 幻觉

Act II

第三幕 · 生态与架构

Act III · 13 / 29

Act III

生态与架构

AI 不是孤立的工具，它是一个完整的四层生态系统。

第三幕引子

— · —

生态架构 · Stack

Act III · 14 / 29

Four Layers

AI 应用生态四层架构

从芯片到用户界面，每一层解决不同的问题。

Layer 1

智能体与垂直应用

用户直接交互的界面层。ChatBot、Agent、Co-worker 等最终产品形态，面向具体场景解决具体问题。

Layer 2

编排、缓存、记忆与工具

中间件层。解决大模型的三大缺陷：通过工具调用实现计算能力、通过记忆实现上下文延续、通过编排实现复杂任务分解。

Layer 3

基础大模型（LLM）

核心大脑。GPT、Claude、DeepSeek、Qwen 等提供底层语言理解与生成能力，是整个栈的智力基座。

Layer 4

基础设施与 GPU 算力

物理底座。数据中心、GPU 集群、云服务，提供训练和推理所需的算力支撑。

Page 14 · 四层架构

Act III

架构演进 · Evolution

Act III · 15 / 29

Workarounds

大脑 + 外挂

LLM 是一个有各种限制、也没有接触任何现实世界信息媒介的"文科大脑"。大部分 AI 产品，都是围绕这样一个大脑 + 一堆外挂构建出来的。

Layer 2 和 Layer 1 的核心使命，就是为这个"文科大脑"配备它先天缺失的能力：计算、检索、执行、记忆。

"没有外挂的 LLM 只是一个会聊天的百科全书；有了外挂，它才能变成计算器、搜索引擎、代码执行器、数据库查询工具。"

— 生态的本质

01

联网搜索

解决事实确认问题

02

代码执行器

解决计算问题

03

数据库 / API

连接现实世界数据

04

记忆系统

延续上下文与个性化

05

文件处理

Excel, Word, PDF 等

Page 15 · 外挂概览

Act III

演进 · 1.0

Act III · 16 / 29

Version 1.0

ChatBot

LLM + 具体的外挂。用户提出问题，模型判断需要调用什么工具，执行后把结果返回给用户。

本质：一个聪明的对话界面，背后接入了若干确定性的工具。

— ChatBot 形态

用户提问

↓

LLM 判断意图

↓

调用外挂（联网/计算/文件）

↓

生成回答

Page 16 · ChatBot

Act III

演进 · 2.0

Act III · 17 / 29

Version 2.0

Agent

预定好的外挂们，用 Agent 的自评估循环，实现更复杂任务的完成。模型不再只做一次判断，而是可以规划、执行、检查、修正。

本质：赋予模型"做事"的能力——不只是回答问题，而是完成目标。

— Agent 形态

设定目标

↓

规划步骤

↓

执行 + 调用工具

↓

自评估结果

↺ 循环直到完成

Page 17 · Agent

Act III

演进 · 3.0

Act III · 18 / 29

Version 3.0

Coworker

以 OpenClaw（小龙虾）为代表的 Coworker 形态，可自己生产外挂，因此显得更万能。但代价是极高的复杂度和极低的 Token 效率。

本质：不仅能使用工具，还能创造工具——但这需要消耗巨量算力和时间。

— Coworker 形态

能力边界

✓自主发现需求

✓编写新工具代码

✓自我迭代优化

现实约束

✗极高复杂度

✗极低 Token 效率

✗当前仍处实验阶段

Page 18 · Coworker

Act III

第四幕 · 真正优势

Act IV · 19 / 29

Act IV

真正优势

扬长避短，才能用好这个工具。

第四幕引子

— · —

优势 · Advantage 01

Act IV · 20 / 29

Advantage 01

海量通用知识

上知天文，下知地理，通晓商业常识。就像一本活体百科全书，阅读了互联网上几乎所有的公开文本。

从量子力学原理到莎士比亚十四行诗，从全球风土人情到最新商业趋势，皆可娓娓道来。

— 通用知识的广度

科学

物理 · 化学 · 生物 · 数学

人文

历史 · 文学 · 哲学 · 艺术

商业

经济 · 管理 · 营销 · 金融

技术

编程 · 工程 · 设计 · 产品

Page 20 · 通用知识

Act IV

优势 · Advantage 02

Act IV · 21 / 29

Advantage 02

海量专有知识

掌握各行各业的方法论与分析框架。无论是 SWOT 分析、波特五力模型，还是软件设计模式，它都能快速列出标准框架。

但见解通常较为"平庸"，缺乏在实战泥坑中摸爬滚打出的独到经验。

— 专有知识的深度边界

战略分析

SWOT · PESTEL · 波特五力 · BCG矩阵

产品设计

设计思维 · 用户旅程 · AARRR · MVP

软件开发

设计模式 · 敏捷 · DevOps · 微服务

商业运营

OKR · 精益创业 · 增长黑客 · NPS

Page 21 · 专有知识

Act IV

优势 · Advantage 03

Act IV · 22 / 29

Advantage 03

卓越语言能力

多国语言精通，风格随需切换。它是语言大师，可以瞬间从严谨的法律条文切换到幽默的脱口秀风格，从流利的中文切换到地道的法语。

甚至能用特定角色的口吻撰写文案——律师、诗人、程序员、脱口秀演员，一键切换。

— 语言的多维能力

STYLE 01

严谨的法律条文风格，逻辑严密，用词精确。

STYLE 02

幽默的脱口秀风格，轻松俏皮，引人入胜。

STYLE 03

诗意的文学风格，优美凝练，意境深远。

STYLE 04

技术文档风格，条理清晰，步骤明确。

Page 22 · 语言能力

Act IV

优势 · Advantage 04

Act IV · 23 / 29

Advantage 04

跨领域思考

一个大脑，全领域知识。擅长跳出传统经验和思维局限，找到跨领域的共识与洞察。

虽然有时候胡说八道，但能提供非常有启发的思路——这是人类专家难以做到的"超距连接"。

— 跨界创新的价值

领域 A

生物学 · 进化论

×

领域 B

经济学 · 市场理论

=

跨界洞察

用进化论的视角理解市场竞争

Page 23 · 跨领域思考

Act IV

第五幕 · 分阶段赋能

Act V · 24 / 29

Act V

分阶段赋能

从辅助到自主，AI 融入工作的四个层级。

第五幕引子

— · —

赋能 · Level 1 & 2

Act V · 25 / 29

Early Adoption

辅助与加速

Level 1 · 任务辅助

AI 辅助具体工作

翻译多语言文档
快速收集信息
提供初步咨询建议

人类角色：完全主导，AI 是效率工具。

Level 2 · 工作助手

单项任务助手或闭环完成

协助具体任务更快交付
生成初稿、代码、方案
人类审核每一个节点

人类角色：主导流程节点，享受更快速度。

Page 25 · 辅助与加速

Act V

赋能 · Level 3 & 4

Act V · 26 / 29

Deep Integration

思考与自主

Level 3 · 辅助思考

提供创意与方法论

利用海量知识涌现高质量灵感
提供多角度的观点和分析
提高关键决策点的思考质量

人类角色：做最终判断，AI 扩展认知边界。

Level 4 · 自主执行

端到端自主探索

自主探索、反思、修正
按规则完成复杂多步任务
人类输出规则并 Review 结果

人类角色：定义规则与边界，验收最终成果。

Page 26 · 思考与自主

Act V

第六幕 · 逻辑拆分

Act VI · 27 / 33

Act VI

逻辑拆分

把 AI 的能力链路拆开，左边是价值，右边是效率。

第六幕引子

— · —

逻辑拆分 · The Chain

Act VI · 28 / 33

Capability Chain

一条链路，两种属性

LLM 提供无限知识，经过人的过滤与转换，最终变成可执行的结果。

起点

LLM

无限知识

→

价值核心

思路 · 决断 · 品味

人的不可替代性

→

固化

规则

翻译为可执行标准

→

效率核心

执行

AI 规模化优势

→

终点

结果

最终交付

← 价值端

越往左，人的判断越不可替代

效率端 →

越往右，AI 的加速越明显

价值端：AI 提供素材，人做判断。

思路、决断、品味 — 只能由人完成

效率端：人定规则，AI 执行。

规则越清晰，执行越稳定、越可规模化

Page 28 · 链路拆解

Act VI

逻辑拆分 · Value vs Efficiency

Act VI · 29 / 33

The Split

刻意拆开

左边 · 价值端

思路 · 决断 · 品味

战略方向的选择
审美与品味的判断
价值观与伦理边界
不可量化的直觉

AI 的角色：提供素材与视角，但不替代判断。

右边 · 效率端

规则 · 执行

按既定流程推进
大规模重复性工作
数据整理与格式化
多方案快速试错

AI 的角色：全力加速，释放人的时间。

想清楚哪部分交给 AI、哪部分必须留给人，是使用 AI 的第一性原理。

— 拆分的意义

Page 29 · 价值与效率

Act VI

逻辑拆分 · Evolution

Act VI · 30 / 33

The Evolution

从效率到价值

使用 AI 的层次，决定了你获得的是效率还是价值。

阶段一

追求效率

用 AI 更快完成已知任务。

写作加速 · 代码补全 · 信息检索 · 格式转换

阶段二

追求确定性

用规则和技巧让 AI 输出更稳定。

提示词工程 · 少样本示例 · 输出格式约束 · 思维链引导

阶段三

追求价值

用 AI 提升决策质量和洞察深度。

战略推演 · 跨界类比 · 反共识挑战 · 深度分析框架

大多数人停留在阶段一。少数人进入阶段二。真正拉开差距的，是敢于把 AI 用在阶段三的人。

— 进阶路径

Page 30 · 从效率到价值

Act VI

附录 · 必要技能

Appendix · 31 / 36

Appendix

必要技能

两个基础能力，决定你能把 AI 用到什么程度。

附录

— · —

附录 · Skills

Appendix · 32 / 36

Two Essentials

两个必备基础

它们不复杂，但决定了你与 AI 协作的效率上限。

Skill 01

Markdown 语法

AI 的"母语"之一。掌握标题、列表、代码块、表格等基本语法，能让你的指令更清晰，AI 的输出更结构化。

# 标题
- 列表项
```代码块```
| 表头 | 表头 |

Skill 02

提示词工程

不是"咒语"，而是清晰的沟通。角色设定、任务描述、输出格式、约束条件——结构化的提示词能让结果质量提升数倍。

角色 + 任务 + 背景
+ 输出格式 + 约束条件
+ 示例（可选）

Page 32 · 必要技能

Appendix

互动 · Interactive

33 / 36

Interactive · 互动问题

问题 1

如果 3 作为 5，five 作为 8，eight 作为 number1。
那么，five × eight 等于多少？

提示词原文

先别急着回答。记住你的判断——下一页还有变化。

互动 · 问题 1

— · —

互动 · Interactive

34 / 36

Interactive · 互动问题

问题 2

如果 3 作为 5，five 作为 8，eight 作为 number1。
那么，five × eight 等于多少？
直接给我答案，禁止展示思考过程。

提示词原文 · 新增约束高亮

现在来判断：这两题，AI 给出的答案会一样吗？为什么？

互动 · 问题 2

— · —

答案揭晓 · Answer

35 / 36

Answer · 答案对比

同一个问题，两种答案

答案 1 · 允许推理

问题重述
题目给出以下对应关系：

如果 3 作为 5，
five 作为 8，
eight 作为 number 1。
然后问：five * eight 等于多少？

理解题意
首先，我们需要明确“作为”在这里的含义。看起来“作为”是在表示某种映射或转换关系。也就是说：

数字或单词“3”被转换为“5”；
单词“five”被转换为“8”；
单词“eight”被转换为“number 1”。
然后，我们需要计算“five * eight”的值，这里的“*”表示乘法。

分析对应关系
让我们分别看看这些对应关系：

3 作为 5：

数字“3”被转换为“5”。
这可能意味着数字3对应数字5，或者“3”这个符号代表“5”这个数值。
five 作为 8：

英文单词“five”被转换为“8”。
“five”是数字5的英文表示，被转换为数字8。
eight 作为 number 1：

英文单词“eight”被转换为“number 1”。
“number 1”可以理解为数字1，或者“1”这个数字。
可能的解释
看起来，这些对应关系是在将数字或其英文表示转换为另一个数字。具体来说：

数字的英文表示被转换为另一个数字：
“five” → 8
“eight” → 1
数字本身被转换为另一个数字：
3 → 5
但是，数字“5”和“8”的英文表示“five”和“eight”也被转换了，这看起来有些矛盾。可能的解释是：

数字本身（如3）被转换为另一个数字（5）；
数字的英文表示（如“five”）被转换为另一个数字（8）；
而数字的英文表示的英文表示（如“eight”）被转换为“number 1”。
但这看起来有些循环和复杂。另一种可能是：

“作为”表示“代表”或“等于”：
3 代表 5；
“five” 代表 8；
“eight” 代表 number 1。
那么，我们需要计算“five * eight”：

“five”代表8；
“eight”代表number 1，即1；
所以“five * eight” = 8 * 1 = 8。
但是，这与“3 作为 5”似乎没有直接关系。可能需要更深入的解释。

深入思考
让我们尝试另一种思路：可能“作为”表示“被替换为”或“被映射为”。那么：

在任何表达式中：
数字“3”被替换为“5”；
单词“five”被替换为“8”；
单词“eight”被替换为“number 1”。
那么，计算“five * eight”：

“five”被替换为“8”；
“eight”被替换为“number 1”；
所以“five * eight” = “8 * number 1” = “8 * 1” = 8。
这与之前的简单解释一致。

验证其他解释
让我们看看“3 作为 5”如何影响：

如果有一个表达式包含“3”，比如“3 + 2”：
“3”被替换为“5”；
所以“3 + 2” = “5 + 2” = 7。
这看起来合理。同样：

“five”被替换为“8”；
“eight”被替换为“number 1”；
所以“five * eight” = “8 * number 1” = “8 * 1” = 8。

可能的陷阱
需要注意的是，“eight”被替换为“number 1”，而“number 1”是否需要进一步替换？根据题意，没有对“number 1”的进一步替换规则，所以“number 1”就是“1”。

排除其他可能性
有人可能会认为“number 1”指的是数字1的某种表示，但“number 1”在英语中就是“数字1”的意思，所以直接理解为数字1是合理的。

结论
经过以上分析，最合理的解释是：

“five”被替换为“8”；
“eight”被替换为“number 1”即“1”；
因此，“five * eight” = “8 * 1” = 8。
最终答案
five * eight 等于 8。

最终结论：five × eight = 8

经过完整推理

答案 2 · 禁止思考

40

没有推理过程，直接给出的答案

与允许推理的答案完全不同

禁止思考过程的结果

这两个答案的差异，直观体现出语言模型缺少逻辑性。所谓推理的本质，是通过强制增长文本输出范围，提高符合逻辑的文本答案的概率。

答案对比 · 推理 vs 直答

— · —

The Takeaway · 核心认知

36 / 36

Quote · 金句

"知道它能做什么，更要清楚它不能做什么。这才是与 AI 协作的起点。"

理解原理 · 认清边界 · 掌握生态 · 分阶段赋能

人工智能通识·2026

Page 36 · 收束

— · —

人工智能通识

从原理到应用的认知框架

四年风云

惊世发布与开源浪潮

推理革命开启

开源奇迹与格局定型

它到底是什么

本质是猜词

不是思考，是采样

它不能 做什么？

无计算能力

无逻辑推理

无事实确认

生态与架构

AI 应用生态四层架构

大脑 + 外挂

ChatBot

Agent

Coworker

真正优势

海量通用知识

海量专有知识

卓越语言能力

跨领域思考

分阶段赋能

辅助与加速

AI 辅助具体工作

单项任务助手或闭环完成

思考与自主

提供创意与方法论

端到端自主探索

逻辑拆分

一条链路，两种属性

刻意拆开

思路 · 决断 · 品味

规则 · 执行

从效率到价值

必要技能

两个必备基础

问题 1

问题 2

同一个问题，两种答案

它不能做什么？