← → 翻页 · B 静态 · ESC 索引
AI Literacy · 内训材料
Vol.01
Artificial Intelligence Literacy

人工智能通识

从原理到应用的认知框架

理解大语言模型的本质、边界与生态,建立与 AI 协作的正确认知。

2026·内部分享
一场关于 AI 原理 · 边界 · 应用的分享
— 2026 —
第一幕 · 四年风云
Act I · 02 / 29
Act I

四年风云

2022—2026,AI 从实验室走向世界的关键历程。

第一幕引子
— · —
关键时间线 · 2022—2023
Act I · 03 / 29
The Beginning

惊世发布与开源浪潮

大模型从惊艳demo走向产业化的起点。

2022.11
ChatGPT 3.5
惊世发布,第一次让全球普通人感受到对话式 AI 的震撼。
2023.03
GPT-4
人工智能迈入成熟价值期,多模态与推理能力大幅提升。
2023.07
Llama2 & Qwen
Meta 与阿里相继开源,降低行业门槛,生态爆发前夜。
"2022 年 11 月 30 日,OpenAI 发布 ChatGPT。五天内用户破百万——这是人类历史上增长最快的消费级应用。"
— 一个时代的起点
时间线 · 2022—2023
Act I
关键时间线 · 2024
Act I · 04 / 29
Reasoning Revolution

推理革命开启

AI 从"快速直觉"进化到"深度思考"。

2024.05
GPT-4o
低成本、高情绪价值的里程碑模型发布,多模态实时交互成为现实。
2024.09
OpenAI o1
通过思维链(CoT)强化学习,解决复杂逻辑、数学、代码难题。AI 学会"深度思考"。
快速直觉

像人一样凭直觉秒答,但面对复杂问题容易出错。

深度思考

像人一样拆解问题、逐步推理,解决此前无法触及的难题。

时间线 · 2024
Act I
关键时间线 · 2025—2026
Act I · 05 / 29
The New Landscape

开源奇迹与格局定型

边际增量递减,但生态已彻底重塑。

2025.01
DeepSeek R1
以极低成本实现对标 o1 的推理性能,毫无保留开源。彻底重塑全球 AI 算力与经济逻辑。
2026.04
格局定型
模型能力边界持续推进,但边际增量递减。闭源与开源两条路线并行成熟。
全球闭源 SOTA
Claude Opus 4.7 · GPT-5.5
中国开源主导
Qwen3.6 · Kimi 2.6 · GLM-5 · MiniMax · DeepSeek V4
时间线 · 2025—2026
Act I
第二幕 · 它到底是什么
Act II · 06 / 29
Act II

它到底是什么

理解大语言模型的本质,是一切应用的起点。

第二幕引子
— · —
核心原理 · The Essence
Act II · 07 / 29
Next Token Prediction

本质是猜词

大语言模型并不"理解"语言。它只是看了海量的文本,学会了在已知前文的情况下,预测下一个最可能出现的词。

"就像你听到'床前明月',脑子里会自然蹦出'光'。模型做的就是这个——只是它看过万亿级别的文本。"
— 直觉类比
输入
今天天气很____
模型预测的概率分布
72%
18%
7%
3%
输出
今天天气很
Page 07 · 猜词原理
Act II
核心原理 · Probability
Act II · 08 / 29
基于概率的文本生成

不是思考,是采样

模型每次只输出一个词,然后把这个词拼回输入,再预测下一个词。循环往复,直到生成完整回答。

这个过程中没有"思考",没有"计算器",也没有"搜索引擎"。它只是一个极其庞大的概率表——根据前文,选出概率最高的下一个词。

"它写的每一个字,都是'看起来最像正确答案'的字,而不一定是'正确答案'。"
— 关键认知
INPUT
神经网络计算
trillion 参数 · 概率分布
SAMPLE NEXT TOKEN
APPEND & REPEAT
Page 08 · 概率生成
Act II
第二幕 · 边界
Act II · 09 / 29
The Limits

它不能 做什么?

知道边界,才能用好工具。大语言模型有三个致命的先天缺陷。

Page 09 · 边界认知
— · —
边界 · 缺陷一
Act II · 10 / 29
Limit 01

无计算能力

大语言模型没有内置计算器。它依靠"记忆"和"模式匹配"来处理数字,面对复杂运算时几乎必然出错。

因此,不能用大语言模型直接进行计算或统计。
— 铁律
测试案例
23,894 × 1,203 = ?
真实答案 28,744,482
模型可能输出 28,745,682
Why? 模型没有执行算术运算的模块。它"猜测"数字的方式和猜词一样——靠概率,不靠计算。
Page 10 · 无计算能力
Act II
边界 · 缺陷二
Act II · 11 / 29
Limit 02

无逻辑推理

模型不真正"理解"因果关系。它能模仿逻辑的表达形式,但无法保证推理过程的严谨性和正确性。

因此,复杂逻辑推导和判断,不能依赖大语言模型。
— 铁律
经典陷阱
晾干 3 件衣服需要 3 小时。
晾干 30 件需要多久?
直觉错误 30 小时
正确理解 3 小时 (并行晾干)
模型容易被表面数字关系误导,因为它不具备真正的物理常识和因果推理能力。
Page 11 · 无逻辑推理
Act II
边界 · 缺陷三
Act II · 12 / 29
Limit 03

无事实确认

模型没有接入实时信息,也无法验证自己说的话是否真实。它可能"一本正经地胡说八道"——这在 AI 领域被称为"幻觉"。

因此,所有依赖真实世界事实的信息获取,不能依赖大语言模型。
— 铁律
测试案例
请问昨晚的世界杯决赛谁赢了?
模型可能会给出一个看起来非常合理的答案——包括比分、进球球员、甚至精彩瞬间的描述——但这些可能是完全编造的
幻觉不是 bug,是架构特性。模型被训练成"总是给出一个完整的、流畅的回答",而不是"在不知道时保持沉默"。
Page 12 · 幻觉
Act II
第三幕 · 生态与架构
Act III · 13 / 29
Act III

生态与架构

AI 不是孤立的工具,它是一个完整的四层生态系统。

第三幕引子
— · —
生态架构 · Stack
Act III · 14 / 29
Four Layers

AI 应用生态四层架构

从芯片到用户界面,每一层解决不同的问题。

Layer 1
智能体与垂直应用
用户直接交互的界面层。ChatBot、Agent、Co-worker 等最终产品形态,面向具体场景解决具体问题。
Layer 2
编排、缓存、记忆与工具
中间件层。解决大模型的三大缺陷:通过工具调用实现计算能力、通过记忆实现上下文延续、通过编排实现复杂任务分解。
Layer 3
基础大模型(LLM)
核心大脑。GPT、Claude、DeepSeek、Qwen 等提供底层语言理解与生成能力,是整个栈的智力基座。
Layer 4
基础设施与 GPU 算力
物理底座。数据中心、GPU 集群、云服务,提供训练和推理所需的算力支撑。
Page 14 · 四层架构
Act III
架构演进 · Evolution
Act III · 15 / 29
Workarounds

大脑 + 外挂

LLM 是一个有各种限制、也没有接触任何现实世界信息媒介的"文科大脑"。大部分 AI 产品,都是围绕这样一个大脑 + 一堆外挂构建出来的。

Layer 2 和 Layer 1 的核心使命,就是为这个"文科大脑"配备它先天缺失的能力:计算、检索、执行、记忆。

"没有外挂的 LLM 只是一个会聊天的百科全书;有了外挂,它才能变成计算器、搜索引擎、代码执行器、数据库查询工具。"
— 生态的本质
01
联网搜索
解决事实确认问题
02
代码执行器
解决计算问题
03
数据库 / API
连接现实世界数据
04
记忆系统
延续上下文与个性化
05
文件处理
Excel, Word, PDF 等
Page 15 · 外挂概览
Act III
演进 · 1.0
Act III · 16 / 29
Version 1.0

ChatBot

LLM + 具体的外挂。用户提出问题,模型判断需要调用什么工具,执行后把结果返回给用户。

本质:一个聪明的对话界面,背后接入了若干确定性的工具。
— ChatBot 形态
用户提问
LLM 判断意图
调用外挂(联网/计算/文件)
生成回答
Page 16 · ChatBot
Act III
演进 · 2.0
Act III · 17 / 29
Version 2.0

Agent

预定好的外挂们,用 Agent 的自评估循环,实现更复杂任务的完成。模型不再只做一次判断,而是可以规划、执行、检查、修正。

本质:赋予模型"做事"的能力——不只是回答问题,而是完成目标。
— Agent 形态
设定目标
规划步骤
执行 + 调用工具
自评估结果
↺ 循环直到完成
Page 17 · Agent
Act III
演进 · 3.0
Act III · 18 / 29
Version 3.0

Coworker

以 OpenClaw(小龙虾)为代表的 Coworker 形态,可自己生产外挂,因此显得更万能。但代价是极高的复杂度和极低的 Token 效率。

本质:不仅能使用工具,还能创造工具——但这需要消耗巨量算力和时间。
— Coworker 形态
能力边界
自主发现需求
编写新工具代码
自我迭代优化
现实约束
极高复杂度
极低 Token 效率
当前仍处实验阶段
Page 18 · Coworker
Act III
第四幕 · 真正优势
Act IV · 19 / 29
Act IV

真正优势

扬长避短,才能用好这个工具。

第四幕引子
— · —
优势 · Advantage 01
Act IV · 20 / 29
Advantage 01

海量通用知识

上知天文,下知地理,通晓商业常识。就像一本活体百科全书,阅读了互联网上几乎所有的公开文本。

从量子力学原理到莎士比亚十四行诗,从全球风土人情到最新商业趋势,皆可娓娓道来。
— 通用知识的广度
科学
物理 · 化学 · 生物 · 数学
人文
历史 · 文学 · 哲学 · 艺术
商业
经济 · 管理 · 营销 · 金融
技术
编程 · 工程 · 设计 · 产品
Page 20 · 通用知识
Act IV
优势 · Advantage 02
Act IV · 21 / 29
Advantage 02

海量专有知识

掌握各行各业的方法论与分析框架。无论是 SWOT 分析、波特五力模型,还是软件设计模式,它都能快速列出标准框架。

但见解通常较为"平庸",缺乏在实战泥坑中摸爬滚打出的独到经验。
— 专有知识的深度边界
战略分析
SWOT · PESTEL · 波特五力 · BCG矩阵
产品设计
设计思维 · 用户旅程 · AARRR · MVP
软件开发
设计模式 · 敏捷 · DevOps · 微服务
商业运营
OKR · 精益创业 · 增长黑客 · NPS
Page 21 · 专有知识
Act IV
优势 · Advantage 03
Act IV · 22 / 29
Advantage 03

卓越语言能力

多国语言精通,风格随需切换。它是语言大师,可以瞬间从严谨的法律条文切换到幽默的脱口秀风格,从流利的中文切换到地道的法语。

甚至能用特定角色的口吻撰写文案——律师、诗人、程序员、脱口秀演员,一键切换。
— 语言的多维能力
STYLE 01
严谨的法律条文风格,逻辑严密,用词精确。
STYLE 02
幽默的脱口秀风格,轻松俏皮,引人入胜。
STYLE 03
诗意的文学风格,优美凝练,意境深远。
STYLE 04
技术文档风格,条理清晰,步骤明确。
Page 22 · 语言能力
Act IV
优势 · Advantage 04
Act IV · 23 / 29
Advantage 04

跨领域思考

一个大脑,全领域知识。擅长跳出传统经验和思维局限,找到跨领域的共识与洞察。

虽然有时候胡说八道,但能提供非常有启发的思路——这是人类专家难以做到的"超距连接"。
— 跨界创新的价值
领域 A
生物学 · 进化论
×
领域 B
经济学 · 市场理论
=
跨界洞察
用进化论的视角理解市场竞争
Page 23 · 跨领域思考
Act IV
第五幕 · 分阶段赋能
Act V · 24 / 29
Act V

分阶段赋能

从辅助到自主,AI 融入工作的四个层级。

第五幕引子
— · —
赋能 · Level 1 & 2
Act V · 25 / 29
Early Adoption

辅助与加速

Level 1 · 任务辅助

AI 辅助具体工作

  • 翻译多语言文档
  • 快速收集信息
  • 提供初步咨询建议
人类角色:完全主导,AI 是效率工具。
Level 2 · 工作助手

单项任务助手或闭环完成

  • 协助具体任务更快交付
  • 生成初稿、代码、方案
  • 人类审核每一个节点
人类角色:主导流程节点,享受更快速度。
Page 25 · 辅助与加速
Act V
赋能 · Level 3 & 4
Act V · 26 / 29
Deep Integration

思考与自主

Level 3 · 辅助思考

提供创意与方法论

  • 利用海量知识涌现高质量灵感
  • 提供多角度的观点和分析
  • 提高关键决策点的思考质量
人类角色:做最终判断,AI 扩展认知边界。
Level 4 · 自主执行

端到端自主探索

  • 自主探索、反思、修正
  • 按规则完成复杂多步任务
  • 人类输出规则并 Review 结果
人类角色:定义规则与边界,验收最终成果。
Page 26 · 思考与自主
Act V
第六幕 · 逻辑拆分
Act VI · 27 / 33
Act VI

逻辑拆分

把 AI 的能力链路拆开,左边是价值,右边是效率。

第六幕引子
— · —
逻辑拆分 · The Chain
Act VI · 28 / 33
Capability Chain

一条链路,两种属性

LLM 提供无限知识,经过人的过滤与转换,最终变成可执行的结果。

起点
LLM
无限知识
价值核心
思路 · 决断 · 品味
人的不可替代性
固化
规则
翻译为可执行标准
效率核心
执行
AI 规模化优势
终点
结果
最终交付
← 价值端
越往左,人的判断越不可替代
效率端 →
越往右,AI 的加速越明显
价值端:AI 提供素材,人做判断。
思路、决断、品味 — 只能由人完成
效率端:人定规则,AI 执行。
规则越清晰,执行越稳定、越可规模化
Page 28 · 链路拆解
Act VI
逻辑拆分 · Value vs Efficiency
Act VI · 29 / 33
The Split

刻意拆开

左边 · 价值端

思路 · 决断 · 品味

  • 战略方向的选择
  • 审美与品味的判断
  • 价值观与伦理边界
  • 不可量化的直觉
AI 的角色:提供素材与视角,但不替代判断。
右边 · 效率端

规则 · 执行

  • 按既定流程推进
  • 大规模重复性工作
  • 数据整理与格式化
  • 多方案快速试错
AI 的角色:全力加速,释放人的时间。
想清楚哪部分交给 AI、哪部分必须留给人,是使用 AI 的第一性原理。
— 拆分的意义
Page 29 · 价值与效率
Act VI
逻辑拆分 · Evolution
Act VI · 30 / 33
The Evolution

从效率到价值

使用 AI 的层次,决定了你获得的是效率还是价值。

阶段一
追求效率
用 AI 更快完成已知任务。
写作加速 · 代码补全 · 信息检索 · 格式转换
阶段二
追求确定性
规则技巧让 AI 输出更稳定。
提示词工程 · 少样本示例 · 输出格式约束 · 思维链引导
阶段三
追求价值
用 AI 提升决策质量洞察深度
战略推演 · 跨界类比 · 反共识挑战 · 深度分析框架
大多数人停留在阶段一。少数人进入阶段二。真正拉开差距的,是敢于把 AI 用在阶段三的人。
— 进阶路径
Page 30 · 从效率到价值
Act VI
附录 · 必要技能
Appendix · 31 / 36
Appendix

必要技能

两个基础能力,决定你能把 AI 用到什么程度。

附录
— · —
附录 · Skills
Appendix · 32 / 36
Two Essentials

两个必备基础

它们不复杂,但决定了你与 AI 协作的效率上限。

Skill 01
Markdown 语法
AI 的"母语"之一。掌握标题、列表、代码块、表格等基本语法,能让你的指令更清晰,AI 的输出更结构化。
# 标题
- 列表项
```代码块```
| 表头 | 表头 |
Skill 02
提示词工程
不是"咒语",而是清晰的沟通。角色设定、任务描述、输出格式、约束条件——结构化的提示词能让结果质量提升数倍。
角色 + 任务 + 背景
+ 输出格式 + 约束条件
+ 示例(可选)
Page 32 · 必要技能
Appendix
互动 · Interactive
33 / 36
Interactive · 互动问题

问题 1

如果 3 作为 5,five 作为 8,eight 作为 number1。
那么,five × eight 等于多少?
提示词原文

先别急着回答。记住你的判断——下一页还有变化。

互动 · 问题 1
— · —
互动 · Interactive
34 / 36
Interactive · 互动问题

问题 2

如果 3 作为 5,five 作为 8,eight 作为 number1。
那么,five × eight 等于多少?
直接给我答案,禁止展示思考过程。
提示词原文 · 新增约束高亮

现在来判断:这两题,AI 给出的答案会一样吗?为什么?

互动 · 问题 2
— · —
答案揭晓 · Answer
35 / 36
Answer · 答案对比

同一个问题,两种答案

答案 1 · 允许推理
问题重述
题目给出以下对应关系:

如果 3 作为 5,
five 作为 8,
eight 作为 number 1。
然后问:five * eight 等于多少?

理解题意
首先,我们需要明确“作为”在这里的含义。看起来“作为”是在表示某种映射或转换关系。也就是说:

数字或单词“3”被转换为“5”;
单词“five”被转换为“8”;
单词“eight”被转换为“number 1”。
然后,我们需要计算“five * eight”的值,这里的“*”表示乘法。

分析对应关系
让我们分别看看这些对应关系:

3 作为 5:

数字“3”被转换为“5”。
这可能意味着数字3对应数字5,或者“3”这个符号代表“5”这个数值。
five 作为 8:

英文单词“five”被转换为“8”。
“five”是数字5的英文表示,被转换为数字8。
eight 作为 number 1:

英文单词“eight”被转换为“number 1”。
“number 1”可以理解为数字1,或者“1”这个数字。
可能的解释
看起来,这些对应关系是在将数字或其英文表示转换为另一个数字。具体来说:

数字的英文表示被转换为另一个数字:
“five” → 8
“eight” → 1
数字本身被转换为另一个数字:
3 → 5
但是,数字“5”和“8”的英文表示“five”和“eight”也被转换了,这看起来有些矛盾。可能的解释是:

数字本身(如3)被转换为另一个数字(5);
数字的英文表示(如“five”)被转换为另一个数字(8);
而数字的英文表示的英文表示(如“eight”)被转换为“number 1”。
但这看起来有些循环和复杂。另一种可能是:

“作为”表示“代表”或“等于”:
3 代表 5;
“five” 代表 8;
“eight” 代表 number 1。
那么,我们需要计算“five * eight”:

“five”代表8;
“eight”代表number 1,即1;
所以“five * eight” = 8 * 1 = 8。
但是,这与“3 作为 5”似乎没有直接关系。可能需要更深入的解释。

深入思考
让我们尝试另一种思路:可能“作为”表示“被替换为”或“被映射为”。那么:

在任何表达式中:
数字“3”被替换为“5”;
单词“five”被替换为“8”;
单词“eight”被替换为“number 1”。
那么,计算“five * eight”:

“five”被替换为“8”;
“eight”被替换为“number 1”;
所以“five * eight” = “8 * number 1” = “8 * 1” = 8。
这与之前的简单解释一致。

验证其他解释
让我们看看“3 作为 5”如何影响:

如果有一个表达式包含“3”,比如“3 + 2”:
“3”被替换为“5”;
所以“3 + 2” = “5 + 2” = 7。
这看起来合理。同样:

“five”被替换为“8”;
“eight”被替换为“number 1”;
所以“five * eight” = “8 * number 1” = “8 * 1” = 8。

可能的陷阱
需要注意的是,“eight”被替换为“number 1”,而“number 1”是否需要进一步替换?根据题意,没有对“number 1”的进一步替换规则,所以“number 1”就是“1”。

排除其他可能性
有人可能会认为“number 1”指的是数字1的某种表示,但“number 1”在英语中就是“数字1”的意思,所以直接理解为数字1是合理的。

结论
经过以上分析,最合理的解释是:

“five”被替换为“8”;
“eight”被替换为“number 1”即“1”;
因此,“five * eight” = “8 * 1” = 8。
最终答案
five * eight 等于 8。
          
最终结论:five × eight = 8
经过完整推理
答案 2 · 禁止思考
40
没有推理过程,直接给出的答案
与允许推理的答案完全不同
禁止思考过程的结果

这两个答案的差异,直观体现出语言模型缺少逻辑性。所谓推理的本质,是通过强制增长文本输出范围,提高符合逻辑的文本答案的概率。

答案对比 · 推理 vs 直答
— · —
The Takeaway · 核心认知
36 / 36
Quote · 金句
"知道它能做什么, 更要清楚它不能做什么。 这才是与 AI 协作的起点。"

理解原理 · 认清边界 · 掌握生态 · 分阶段赋能

人工智能通识·2026
Page 36 · 收束
— · —