你说的"AI 技能",
其实是个文件夹
一份关于 AI 概念边界滑动的深度调研报告。
从 Alexa Skills 到 Anthropic Skills,十年间 "skill" 这个词被悄悄改写了三次 —— 多数人以为他们在谈论同一件事。
引子:你的笔记,其实是一把钥匙
你在笔记里写下:"要理解一个词,不能只理解它当下的含义,而是要理解它始终处于动态变化之中,它的范围在不断调整。"
这句话不是哲学,是观测报告。
Mark Pagel 用 6000 年的语言演变证明了它:高频词稳如化石,低频词流动如沙。Joshua Conrad Jackson 找到了流速的加速器:负面情绪让一个词的"半衰期"减半。凯文·凯利干脆把它命名为时代的底色 —— "形成"(Becoming)和"流"(Flow)。
今天我们解剖的样本,是一个看似无害的英文单词:skill(技能)。
它在 2014 年是一个东西。
在 2023 年是另一个东西。
在 2025 年 10 月之后,变成了第三个东西。
而你以为你在用它指代同一件事。
这就是这份报告的起点。
词源考古:"skill" 的三次借尸还魂
追溯 · 2014 → 2025词典定义:祖先的样子
skill /skɪl/ n. 能力、技艺、熟练程度。
字典里的 skill 是人的属性。它是名词,但根植于经验 —— 你不能"安装"一项技能,只能"习得"。
记住这个原始含义。后面三次借尸还魂,没有一次真正回到了它。
1.1第一次借尸(2014—2017):Alexa Skills —— 其实是"语音应用"
2014 年 Amazon 推出 Echo,随后开放了 Alexa Skills Kit (ASK)。开发者可以为 Alexa "添加 skills"。2017 年微软在 Build 大会跟进,发布 Cortana Skills Kit。
但这里的 skill 是什么?
技术文档说得很清楚:从架构上看,一个 skill 就是一个 REST endpoint。当用户说 "Alexa, ask Domino's to order a pizza",Alexa 把语音转成 JSON,POST 到你的 HTTP 端点。你的服务器返回 JSON,Alexa 念出来。
"From a technical perspective, skills are basically REST endpoints." — Microsoft Developer Documentation
换句话说,Alexa Skills 是 web app 的伪装。它不是"技能",是"应用商店里的应用" —— 只是入口从触屏变成了麦克风。
之所以被叫 skill 而不是 app,是营销修辞:让助手听起来像"会做事的人"而不是"装了一堆 app 的设备"。这是第一次偷换:把"产品"叫成了"能力"。
这一波 skill 在 2020 年后逐渐式微。Cortana Skills Kit 2021 年关停。Alexa Skills 仍在,但被边缘化。它们的命运注定:当大模型出现,装在助手里的"app"全部过时了 —— 你不再需要为每个意图写一个 endpoint,模型自己就能理解和执行。
1.2第二次借尸(2023—2024):隐性的 skill —— Function Calling、Plugins、GPTs
2023 年 OpenAI 发布 Function Calling 和 Plugins,后来又有 GPTs。
OpenAI 没有用 "skill" 这个词。但社区开始把这些东西类比为 "GPT 的 skills" —— 能扩展能力的外挂模块。
这次借尸的本质是什么?
它把"skill"从应用层(Alexa)拉到了模型层(LLM)。但本质仍然是"接口的伪装":Function Calling 是 JSON Schema 描述的函数签名,Plugins 是 OpenAPI 规范的 web service。
这一波"skill"的特征:
- 由模型在推理过程中决定何时调用
- 通过结构化协议(JSON Schema)与外部连接
- 仍然是外部代码 + 内部决策的二分法
但它没成为标准词。OpenAI 叫 "tools",社区叫 "plugins",有人叫 "actions"(GPTs)。词的混乱本身,就是边界模糊的证据。
直到 Anthropic 在 2024 年 11 月端出 Model Context Protocol (MCP),才把"工具"这一层标准化。MCP 是"工具的开放协议",它清晰地占据了"模型如何与外部世界连接"这条赛道。
那么,留给"skill"的空间是什么?
1.3第三次借尸(2025 年 10 月起):Anthropic Skills —— "渐进式披露的知识包"
2025 年 10 月,Anthropic 发布 Agent Skills。
2025 年 12 月 18 日,把它定为开放标准。
官方定义:
"Agent Skills are organized folders of instructions, scripts, and resources that agents can discover and load dynamically to perform better at specific tasks."
翻译过来:Skill 是一个文件夹。里面必须有一个 SKILL.md,可以附带 Python/Bash 脚本、参考文档、模板资源。
但这只是壳。真正的革命在内部机制 —— Progressive Disclosure(渐进式披露):
| 层级 | 内容 | 加载时机 |
|---|---|---|
| L1 | YAML frontmatter(name + description,限字数) | 永远在 system prompt |
| L2 | SKILL.md 主体内容 | Claude 判断相关时才加载 |
| L3 | 引用的子文件、脚本、资源 | 按需触达 |
这个三层结构,让 skill 可以无限大 —— 因为模型不会一次性把它装进上下文窗口。
"The amount of context that can be bundled into a skill is effectively unbounded." — Anthropic Engineering Blog
到这里,你以为我要赞美这个设计。
不。我要告诉你它的真相:Anthropic Skills 本质上仍然是 prompt —— 只是穿上了文件系统的衣服。
边界混乱:skill 与它的 五个邻居
辨析 · skill ↔ model / prompt / context / harness / agent业界文章在反复争论:skill 和 agent 哪个大?skill 是 prompt 还是 tool?MCP 和 skill 怎么区分?
这种混乱不是偶然 —— 它是因为这五个概念其实在抢占同一片认知空间。
2.1skill vs Model:谁才是真正的"能力"持有者?
- 模型(Model):神经网络权重。Claude Opus 4.7 有它的"能力天花板" —— 它能写多好的代码、它的推理深度、它的知识截止日期。
- Skill:外置的指令包。它不会让模型变聪明,只会让模型在某个具体任务上少犯错。
如果模型本来就不会某件事(比如解一个超出训练数据的数学难题),给它一万个 skill 也没用。Skill 只能在"模型有潜力做对,但默认会做错"的位置上发挥作用 —— 那是一片经验差(experience gap)的区域,不是能力差(capability gap)。
很多人以为装上 skill 就让 Claude 变成了"专家"。错了。Claude 还是 Claude,只是有人在它身后递条子。
2.2skill vs Prompt:他们其实是同一个东西穿着不同的衣服
让我直接引述 Lee Han Chung 的深度剖析:
"Skills are specialized prompt templates that inject domain-specific instructions into the conversation context...not executable code. They do NOT run Python or JavaScript [by themselves]."
读懂了吗?Skill 不是代码,是 prompt 模板。
它和你写在系统提示里的指令在本质上完全一样 —— 都是文本,都通过被读入上下文窗口来影响模型行为。
那它和 prompt 的区别到底是什么?
| 维度 | 传统 Prompt | Skill |
|---|---|---|
| 加载时机 | 一次性全部进入上下文 | 按需分层加载 |
| 组织形式 | 单条指令或长段文本 | 文件夹结构,可包含多个文件 |
| 触发方式 | 用户/开发者主动写入 | Claude 根据元数据自主判断是否加载 |
| 复用性 | 复制粘贴 | 版本化、可分发、可组合 |
所以 skill 的"创新"不在内容,而在打包和加载协议。
这是一个被刻意忽视的真相:Skill 是 prompt 工程的工业化形态 —— 就像 npm 包是 JavaScript 代码的工业化形态一样。npm 包不是"新的编程语言",它只是让代码可以分发。Skill 不是"新的智能",它只是让 prompt 可以分发。
2.3skill vs Context:skill 是"上下文工程"的具体形态
2024 年下半年,业界流行起一个新词:Context Engineering(上下文工程)。Anthropic 自己也写了文章:Effective Context Engineering for AI Agents。
"Context engineering is the practice of what you put in the context window — and how."
那 skill 是什么?
Skill 是 context engineering 的产品化形式。它把"什么时候放什么内容进上下文窗口"这个动态决策,固化成了一个静态结构(三层 progressive disclosure)。
换句话说:
- 上下文工程是理论(怎么管理 token 预算)
- Skill 是工程(把理论变成可分发的文件夹)
许多人混淆了这两层。看到 skill,以为这是一种"新机制";其实它只是把"决定加载什么"这件事,从开发者的脑子里搬到了 SKILL.md 的 metadata 字段里。
2.4skill vs Harness:skill 是 harness 中的"知识层"
这是最容易混淆的对比。让我把这个新词先说清楚。
Harness Engineering(挽具工程)是 2025—2026 年涌现的概念。HumanLayer 的文章 Skill Issue: Harness Engineering for Coding Agents 直接用了这个对比作标题 —— 意思是"如果你在抱怨 AI agent 不行,问题不在 skill,在 harness"。
定义层级:
每一层都包含前一层。Harness 是整个 agent 运行的环境 —— 什么时候调子模型、如何路由、如何管理多 agent 的输出、如何处理失败、如何持久化状态。
Claude Code 本身就是一个 harness。它决定:
- 何时调用 Read/Edit/Bash
- 何时压缩上下文
- 何时启动 sub-agent
- 何时加载哪个 skill
Skill 在 harness 内部扮演什么角色?它是 harness 决定要加载的"知识包"之一。
类比:
| Model | 发动机 |
| Prompt | 油门 |
| Context | 仪表盘和后视镜 |
| Skill | 手套箱里的说明书 |
| Harness | 整辆车的电子控制系统 |
这个比喻揭示了真相:skill 在整个 AI 系统里其实只是一个不起眼的子系统。但因为它的名字最像"能力",所以非技术人员把它当成了主角。
第二个真相:那个被叫做 "skill" 的东西,在 AI agent 架构里,既不在最上层(harness),也不在最下层(model),只是中间被装载的一份文档。
2.5skill vs Agent / Workflow:三胞胎的身份混乱
社区里最热的争论是:skill、agent、workflow 怎么区分?
它们的尴尬在于 —— 结构上几乎完全一样,都是 markdown 文件。Daniel Miessler 直接点破:
"One reason AI systems feel confusing is that teams reuse the same words for different layers of the stack."
清晰的边界(目前业界共识):
| 概念 | 关键特征 | 类比 |
|---|---|---|
| Skill | 一个封装好的能力,被调用时执行一件事 | 工具箱里的螺丝刀 |
| Workflow | 一个预定义的步骤序列,路径已知 | 装配流水线 |
| Agent | 一个自主决策的执行者,路径未知 | 工人 |
判断准则:
- 路径已知 → workflow
- 路径未知,需推理 → agent
- 单点能力打包 → skill
但请注意:这只是 2025 年底的共识。半年后可能又变了。语言演化的速度,在 AI 领域是按月计算的。
深层洞察:三个被掩盖的真相
挖到底层到这里你已经看到了表象。现在我们挖到下面一层。
skill 的"创新"是包装,不是本质
Anthropic 把 skill 设计成"文件夹 + SKILL.md + progressive disclosure"。这个组合很聪明,但它在解决的问题,不是 AI 的问题,是软件工程的问题:
- 可分发(npm-like 的包系统)
- 可版本化(git-like 的演进)
- 可组合(microservices-like 的解耦)
- 可发现(metadata 让模型知道它存在)
这些是包管理学的经典问题。Anthropic 把它们重新发明了一遍,然后把这个发明叫做"skill"。
为什么这么做?因为如果叫 "prompt package manager",听起来像 2018 年的 npm,不性感。叫 skill,听起来像 AI 在长出新的能力。
这是一次精心设计的命名营销。它让一个工程问题听起来像一个智能问题。
渐进式披露,在解决一个 Anthropic 不想直说的问题 —— 模型的"短期记忆"瓶颈
为什么需要 progressive disclosure?
官方说法是 "avoiding context window overload" —— 避免上下文窗口溢出。
听起来很合理,直到你问:为什么会溢出?
答案是:模型的有效注意力,远小于它的上下文窗口长度。Claude Opus 可能有 200K token 窗口,但当你真的塞满 200K,模型在中段的注意力会显著下降 —— 这是著名的 "lost in the middle" 现象,2023 年就被多篇论文证实。
所以 progressive disclosure 不是"用户体验设计",是对模型缺陷的工程补救。它把"模型其实读不完它的窗口"这个尴尬,优雅地包装成了"我们让加载更高效"。
你看到的"先进设计",有时候是对底层缺陷的体面修补。
把 skill 设为开放标准,是在抢"知识层"的控制权
2025 年 12 月 18 日,Anthropic 把 Skills 开放为标准。
这一步的剧本和 MCP 一模一样。Anthropic 在 2024 年开放 MCP —— 抢"工具协议"的标准。一年后,他们用同样的剧本,抢"知识协议"的标准。
因为谁定义了协议,谁就定义了认知边界。
- 当全世界的开发者都在写 SKILL.md,他们的工作就默认兼容 Claude。
- 当企业的内部知识都封装成 Anthropic 格式的 skill,迁移到其他 AI 的成本就高了。
- 当 Canva、Notion、Figma、Atlassian 都发布 Anthropic 格式的 skill(已经在做了),生态系统的引力让 OpenAI 和 Google 必须跟随。
这就是为什么 Anthropic 的 skill 不只是技术,是地缘。它在用"开放"的姿态,做最封闭的事 —— 让自己的内部抽象,变成行业的默认抽象。
凯文·凯利说"流动的时代,确定性在降低"。但他没说全:总有人在流动中拼命树立路标,而那些路标不是为了帮你认路,是为了让所有路最终通向他们的城。
流沙之上:你的笔记,在 AI 领域兑现了
把抽象拉回个人观察Pagel 的发现:高频词演变慢,低频词演变快
skill 在自然语言里是高频词 —— 它的核心含义(技艺/能力)千年未变。
但在 AI 子语言里,它是新生的低频词 —— 所以它在十年里被重写了三次。
预测:再过 5 年,如果 skill 这个词还活着,它的语义会再次稳定;如果它消失,会被另一个词替代 —— 大概率是另一个英文单词被偷换成 AI 术语,比如 routine、capability、expertise。
Jackson 的发现:负面情绪加速词的死亡
在 AI 领域,这个规律惊人地准确。看几个例子:
- "Hallucination"(幻觉) —— 本是负面词,2024 年开始被各家公司换成更柔和的 "confabulation"、"context error"、"groundedness issue"。
- "Bias"(偏见) —— 被换成 "alignment gap"、"value drift"。
- "Bug" —— 在 AI 时代被换成 "limitation"、"behavior"、"emergent property"。
而正面词如 "capability"、"skill"、"intelligence" —— 几乎没动过。
洞察:你以为公司在"创新术语",其实他们在执行 Jackson 描述的本能 —— 逃避让人不舒服的词。
skill 这个词之所以被反复借尸,正是因为它听起来正面。没有人会反对自己的 AI 多一些 skill。但如果他们把它叫做 "prompt template package" —— 那听起来像加班的工程师文档,不会有人激动。
凯文·凯利:在流沙上跳舞
KK 的预言"一切东西都在变成别的东西" —— 在 AI 词典里被以最极端的形式兑现。
但他给了一个不那么悲观的结论:"踩在这样的流沙上,我们反而心里不慌。"
为什么不慌?因为当你接受了这种流动,你不再追求"找到真正的定义",而是开始问更有用的问题:
旧问题:"Skill 到底是什么?"
新问题:"在 2025 年底这个时间点,当 Anthropic 说 skill 时,他们在指什么具体的工程结构?"
旧问题让你焦虑,新问题让你能干活。
赫拉克利特的回响
"人不能两次踏进同一条河流。"
我们今天用 skill 这个词,和 2014 年的 Echo 工程师用 skill,字形相同,语义无关。
我们和 2023 年讨论 ChatGPT plugins 的人用 skill,字形相同,边界不同。
当一个词被三次借尸还魂,我们该问的不是"哪个是真的",而是"为什么这个词成了高价值的容器" —— 值得反复被偷换。
答案隐藏在这个词的语用学里:skill 听起来像人的属性。当我们说 AI 有 skill,我们在不知不觉中,把它人格化了。
而每一次这种人格化,都让人类更容易接受 AI 的下一次扩张。
结语:三个让你失眠的问题
读完这份报告,如果你还能心安理得地使用 "skill" 这个词,那是你的自由。
但有三个问题,我希望你之后每次说出 "skill" 之前,在脑子里过一遍。
当我说"AI 有这个 skill",我究竟是在说什么?
是模型的能力?是被加载的文件?是 harness 的路由策略?是 prompt 工程的产物?
你现在知道,这四个答案完全不同。
我在多大程度上,被这个词的"人格化暗示"操控了?
当 Alexa 有 100,000 个 skill 时,你下意识觉得它"很厉害"。
但你刚才已经看到,那些 skill 的本质是 REST endpoint。
你被一个名词骗了。如果它叫 "REST 接口商店",你不会有任何感觉。
下一次,这个词会被偷换成什么?
历史告诉我们,2027 年的 skill 大概率不是今天的 skill。
当那一天到来,你会是第一批察觉的人,还是最后一批?
这份报告本身,是一次概念偷换的样本
你注意到了吗?这份报告的第一页和最后一页,"skill" 这个词的内涵,已经发生了变化。
- 第一页:你以为 skill 是 AI 的能力。
- 最后一页:你知道 skill 是 一个被精心包装的文件夹格式。
这种变化,在你脑子里发生的时间,只有 30 分钟。
而在文明史上,自然语言完成同样幅度的变化,需要 500 年。
AI 时代真正的特征,不是技术加速,是认知加速。
你今天写笔记捕捉到的"动态理解" —— 它不是一种思维习惯,是 2026 年生存的必备能力。
在流动的时代,最稳定的定义就是"它正在变化"。
而最稳定的智者,是那些记得每一次变化是怎么发生的人。