返回博客
深度调研 · CONCEPT FORENSICS

你说的"AI 技能",
其实是个文件夹

一份关于 AI 概念边界滑动的深度调研报告。
从 Alexa Skills 到 Anthropic Skills,十年间 "skill" 这个词被悄悄改写了三次 —— 多数人以为他们在谈论同一件事。

📝 作者:Bearjojo & ClaudeCode 2026.04.25 约 18 分钟阅读 13 引用

引子:你的笔记,其实是一把钥匙

你在笔记里写下:"要理解一个词,不能只理解它当下的含义,而是要理解它始终处于动态变化之中,它的范围在不断调整。"

这句话不是哲学,是观测报告。

Mark Pagel 用 6000 年的语言演变证明了它:高频词稳如化石,低频词流动如沙。Joshua Conrad Jackson 找到了流速的加速器:负面情绪让一个词的"半衰期"减半。凯文·凯利干脆把它命名为时代的底色 —— "形成"(Becoming)和"流"(Flow)。

但他们都在描述自然语言。没人告诉你,在 AI 领域,这种偷换是按年计算的,而且偷换者就站在你面前 —— 他们叫 Amazon、Microsoft、OpenAI、Anthropic。

今天我们解剖的样本,是一个看似无害的英文单词:skill(技能)。

它在 2014 年是一个东西。
在 2023 年是另一个东西。
在 2025 年 10 月之后,变成了第三个东西。
而你以为你在用它指代同一件事。

这就是这份报告的起点。


CHAPTER 01

词源考古:"skill" 的三次借尸还魂

追溯 · 2014 → 2025

词典定义:祖先的样子

skill /skɪl/ n. 能力、技艺、熟练程度。

字典里的 skill 是的属性。它是名词,但根植于经验 —— 你不能"安装"一项技能,只能"习得"。

记住这个原始含义。后面三次借尸还魂,没有一次真正回到了它

1.1第一次借尸(2014—2017):Alexa Skills —— 其实是"语音应用"

2014 年 Amazon 推出 Echo,随后开放了 Alexa Skills Kit (ASK)。开发者可以为 Alexa "添加 skills"。2017 年微软在 Build 大会跟进,发布 Cortana Skills Kit。

但这里的 skill 是什么?

技术文档说得很清楚:从架构上看,一个 skill 就是一个 REST endpoint。当用户说 "Alexa, ask Domino's to order a pizza",Alexa 把语音转成 JSON,POST 到你的 HTTP 端点。你的服务器返回 JSON,Alexa 念出来。

"From a technical perspective, skills are basically REST endpoints." — Microsoft Developer Documentation

换句话说,Alexa Skills 是 web app 的伪装。它不是"技能",是"应用商店里的应用" —— 只是入口从触屏变成了麦克风。

之所以被叫 skill 而不是 app,是营销修辞:让助手听起来像"会做事的人"而不是"装了一堆 app 的设备"。这是第一次偷换:把"产品"叫成了"能力"。

这一波 skill 在 2020 年后逐渐式微。Cortana Skills Kit 2021 年关停。Alexa Skills 仍在,但被边缘化。它们的命运注定:当大模型出现,装在助手里的"app"全部过时了 —— 你不再需要为每个意图写一个 endpoint,模型自己就能理解和执行。

第一个 skill 死了。但词没死,这是它的第一次重生。

1.2第二次借尸(2023—2024):隐性的 skill —— Function Calling、Plugins、GPTs

2023 年 OpenAI 发布 Function Calling 和 Plugins,后来又有 GPTs。

OpenAI 没有用 "skill" 这个词。但社区开始把这些东西类比为 "GPT 的 skills" —— 能扩展能力的外挂模块。

这次借尸的本质是什么?

它把"skill"从应用层(Alexa)拉到了模型层(LLM)。但本质仍然是"接口的伪装":Function Calling 是 JSON Schema 描述的函数签名,Plugins 是 OpenAPI 规范的 web service。

这一波"skill"的特征:

  • 由模型在推理过程中决定何时调用
  • 通过结构化协议(JSON Schema)与外部连接
  • 仍然是外部代码 + 内部决策的二分法

但它没成为标准词。OpenAI 叫 "tools",社区叫 "plugins",有人叫 "actions"(GPTs)。词的混乱本身,就是边界模糊的证据。

直到 Anthropic 在 2024 年 11 月端出 Model Context Protocol (MCP),才把"工具"这一层标准化。MCP 是"工具的开放协议",它清晰地占据了"模型如何与外部世界连接"这条赛道。

那么,留给"skill"的空间是什么?

Anthropic 看到了一个未被定义的位置 —— "模型如何被教会做某件事" —— 并把"skill"塞了进去。

1.3第三次借尸(2025 年 10 月起):Anthropic Skills —— "渐进式披露的知识包"

2025 年 10 月,Anthropic 发布 Agent Skills。
2025 年 12 月 18 日,把它定为开放标准。

官方定义:

"Agent Skills are organized folders of instructions, scripts, and resources that agents can discover and load dynamically to perform better at specific tasks."

翻译过来:Skill 是一个文件夹。里面必须有一个 SKILL.md,可以附带 Python/Bash 脚本、参考文档、模板资源。

但这只是壳。真正的革命在内部机制 —— Progressive Disclosure(渐进式披露)

层级内容加载时机
L1YAML frontmatter(name + description,限字数)永远在 system prompt
L2SKILL.md 主体内容Claude 判断相关时才加载
L3引用的子文件、脚本、资源按需触达

这个三层结构,让 skill 可以无限大 —— 因为模型不会一次性把它装进上下文窗口。

"The amount of context that can be bundled into a skill is effectively unbounded." — Anthropic Engineering Blog

到这里,你以为我要赞美这个设计。

不。我要告诉你它的真相:Anthropic Skills 本质上仍然是 prompt —— 只是穿上了文件系统的衣服。


CHAPTER 02

边界混乱:skill 与它的 五个邻居

辨析 · skill ↔ model / prompt / context / harness / agent

业界文章在反复争论:skill 和 agent 哪个大?skill 是 prompt 还是 tool?MCP 和 skill 怎么区分?

这种混乱不是偶然 —— 它是因为这五个概念其实在抢占同一片认知空间。

2.1skill vs Model:谁才是真正的"能力"持有者?

  • 模型(Model):神经网络权重。Claude Opus 4.7 有它的"能力天花板" —— 它能写多好的代码、它的推理深度、它的知识截止日期。
  • Skill:外置的指令包。它不会让模型变聪明,只会让模型在某个具体任务上少犯错。
关键洞察:Skill 是模型的"外置记忆",不是"能力升级"。

如果模型本来就不会某件事(比如解一个超出训练数据的数学难题),给它一万个 skill 也没用。Skill 只能在"模型有潜力做对,但默认会做错"的位置上发挥作用 —— 那是一片经验差(experience gap)的区域,不是能力差(capability gap)

很多人以为装上 skill 就让 Claude 变成了"专家"。错了。Claude 还是 Claude,只是有人在它身后递条子。

2.2skill vs Prompt:他们其实是同一个东西穿着不同的衣服

让我直接引述 Lee Han Chung 的深度剖析:

"Skills are specialized prompt templates that inject domain-specific instructions into the conversation context...not executable code. They do NOT run Python or JavaScript [by themselves]."

读懂了吗?Skill 不是代码,是 prompt 模板。

它和你写在系统提示里的指令在本质上完全一样 —— 都是文本,都通过被读入上下文窗口来影响模型行为。

那它和 prompt 的区别到底是什么?

维度传统 PromptSkill
加载时机一次性全部进入上下文按需分层加载
组织形式单条指令或长段文本文件夹结构,可包含多个文件
触发方式用户/开发者主动写入Claude 根据元数据自主判断是否加载
复用性复制粘贴版本化、可分发、可组合

所以 skill 的"创新"不在内容,而在打包和加载协议

这是一个被刻意忽视的真相:Skill 是 prompt 工程的工业化形态 —— 就像 npm 包是 JavaScript 代码的工业化形态一样。npm 包不是"新的编程语言",它只是让代码可以分发。Skill 不是"新的智能",它只是让 prompt 可以分发。

2.3skill vs Context:skill 是"上下文工程"的具体形态

2024 年下半年,业界流行起一个新词:Context Engineering(上下文工程)。Anthropic 自己也写了文章:Effective Context Engineering for AI Agents

"Context engineering is the practice of what you put in the context window — and how."

那 skill 是什么?

Skill 是 context engineering 的产品化形式。它把"什么时候放什么内容进上下文窗口"这个动态决策,固化成了一个静态结构(三层 progressive disclosure)。

换句话说:

  • 上下文工程是理论(怎么管理 token 预算)
  • Skill 是工程(把理论变成可分发的文件夹)

许多人混淆了这两层。看到 skill,以为这是一种"新机制";其实它只是把"决定加载什么"这件事,从开发者的脑子里搬到了 SKILL.md 的 metadata 字段里。

2.4skill vs Harness:skill 是 harness 中的"知识层"

这是最容易混淆的对比。让我把这个新词先说清楚。

Harness Engineering(挽具工程)是 2025—2026 年涌现的概念。HumanLayer 的文章 Skill Issue: Harness Engineering for Coding Agents 直接用了这个对比作标题 —— 意思是"如果你在抱怨 AI agent 不行,问题不在 skill,在 harness"。

定义层级:

Harness Engineering ⊃ Context Engineering ⊃ Prompt Engineering

每一层都包含前一层。Harness 是整个 agent 运行的环境 —— 什么时候调子模型、如何路由、如何管理多 agent 的输出、如何处理失败、如何持久化状态。

Claude Code 本身就是一个 harness。它决定:

  • 何时调用 Read/Edit/Bash
  • 何时压缩上下文
  • 何时启动 sub-agent
  • 何时加载哪个 skill

Skill 在 harness 内部扮演什么角色?它是 harness 决定要加载的"知识包"之一。

类比:

Model发动机
Prompt油门
Context仪表盘和后视镜
Skill手套箱里的说明书
Harness整辆车的电子控制系统

这个比喻揭示了真相:skill 在整个 AI 系统里其实只是一个不起眼的子系统。但因为它的名字最像"能力",所以非技术人员把它当成了主角。

第二个真相:那个被叫做 "skill" 的东西,在 AI agent 架构里,既不在最上层(harness),也不在最下层(model),只是中间被装载的一份文档

2.5skill vs Agent / Workflow:三胞胎的身份混乱

社区里最热的争论是:skill、agent、workflow 怎么区分?

它们的尴尬在于 —— 结构上几乎完全一样,都是 markdown 文件。Daniel Miessler 直接点破:

"One reason AI systems feel confusing is that teams reuse the same words for different layers of the stack."

清晰的边界(目前业界共识):

概念关键特征类比
Skill一个封装好的能力,被调用时执行一件事工具箱里的螺丝刀
Workflow一个预定义的步骤序列,路径已知装配流水线
Agent一个自主决策的执行者,路径未知工人

判断准则:

  • 路径已知 → workflow
  • 路径未知,需推理 → agent
  • 单点能力打包 → skill

但请注意:这只是 2025 年底的共识。半年后可能又变了。语言演化的速度,在 AI 领域是按月计算的。


CHAPTER 03

深层洞察:三个被掩盖的真相

挖到底层

到这里你已经看到了表象。现在我们挖到下面一层。

▎真相一

skill 的"创新"是包装,不是本质

Anthropic 把 skill 设计成"文件夹 + SKILL.md + progressive disclosure"。这个组合很聪明,但它在解决的问题,不是 AI 的问题,是软件工程的问题

  • 可分发(npm-like 的包系统)
  • 可版本化(git-like 的演进)
  • 可组合(microservices-like 的解耦)
  • 可发现(metadata 让模型知道它存在)

这些是包管理学的经典问题。Anthropic 把它们重新发明了一遍,然后把这个发明叫做"skill"。

为什么这么做?因为如果叫 "prompt package manager",听起来像 2018 年的 npm,不性感。叫 skill,听起来像 AI 在长出新的能力。

这是一次精心设计的命名营销。它让一个工程问题听起来像一个智能问题

▎真相二

渐进式披露,在解决一个 Anthropic 不想直说的问题 —— 模型的"短期记忆"瓶颈

为什么需要 progressive disclosure?

官方说法是 "avoiding context window overload" —— 避免上下文窗口溢出。

听起来很合理,直到你问:为什么会溢出?

答案是:模型的有效注意力,远小于它的上下文窗口长度。Claude Opus 可能有 200K token 窗口,但当你真的塞满 200K,模型在中段的注意力会显著下降 —— 这是著名的 "lost in the middle" 现象,2023 年就被多篇论文证实。

所以 progressive disclosure 不是"用户体验设计",是对模型缺陷的工程补救。它把"模型其实读不完它的窗口"这个尴尬,优雅地包装成了"我们让加载更高效"。

你看到的"先进设计",有时候是对底层缺陷的体面修补。

▎真相三

把 skill 设为开放标准,是在抢"知识层"的控制权

2025 年 12 月 18 日,Anthropic 把 Skills 开放为标准。

这一步的剧本和 MCP 一模一样。Anthropic 在 2024 年开放 MCP —— 抢"工具协议"的标准。一年后,他们用同样的剧本,抢"知识协议"的标准。

因为谁定义了协议,谁就定义了认知边界

  • 当全世界的开发者都在写 SKILL.md,他们的工作就默认兼容 Claude
  • 当企业的内部知识都封装成 Anthropic 格式的 skill,迁移到其他 AI 的成本就高了
  • 当 Canva、Notion、Figma、Atlassian 都发布 Anthropic 格式的 skill(已经在做了),生态系统的引力让 OpenAI 和 Google 必须跟随

这就是为什么 Anthropic 的 skill 不只是技术,是地缘。它在用"开放"的姿态,做最封闭的事 —— 让自己的内部抽象,变成行业的默认抽象

凯文·凯利说"流动的时代,确定性在降低"。但他没说全:总有人在流动中拼命树立路标,而那些路标不是为了帮你认路,是为了让所有路最终通向他们的城。


CHAPTER 04

流沙之上:你的笔记,在 AI 领域兑现了

把抽象拉回个人观察

Pagel 的发现:高频词演变慢,低频词演变快

skill 在自然语言里是高频词 —— 它的核心含义(技艺/能力)千年未变。
但在 AI 子语言里,它是新生的低频词 —— 所以它在十年里被重写了三次。

洞察:你看到的"AI 概念边界模糊",不是 AI 行业不严谨,是新词没有被时间固定下来。它们仍在 Pagel 曲线的左端 —— 高速演变区。

预测:再过 5 年,如果 skill 这个词还活着,它的语义会再次稳定;如果它消失,会被另一个词替代 —— 大概率是另一个英文单词被偷换成 AI 术语,比如 routinecapabilityexpertise

Jackson 的发现:负面情绪加速词的死亡

在 AI 领域,这个规律惊人地准确。看几个例子:

  • "Hallucination"(幻觉) —— 本是负面词,2024 年开始被各家公司换成更柔和的 "confabulation""context error""groundedness issue"
  • "Bias"(偏见) —— 被换成 "alignment gap""value drift"
  • "Bug" —— 在 AI 时代被换成 "limitation""behavior""emergent property"

而正面词如 "capability""skill""intelligence" —— 几乎没动过。

洞察:你以为公司在"创新术语",其实他们在执行 Jackson 描述的本能 —— 逃避让人不舒服的词

skill 这个词之所以被反复借尸,正是因为它听起来正面。没有人会反对自己的 AI 多一些 skill。但如果他们把它叫做 "prompt template package" —— 那听起来像加班的工程师文档,不会有人激动。

凯文·凯利:在流沙上跳舞

KK 的预言"一切东西都在变成别的东西" —— 在 AI 词典里被以最极端的形式兑现。

但他给了一个不那么悲观的结论:"踩在这样的流沙上,我们反而心里不慌。"

为什么不慌?因为当你接受了这种流动,你不再追求"找到真正的定义",而是开始问更有用的问题:

旧问题:"Skill 到底是什么?"

新问题:"在 2025 年底这个时间点,当 Anthropic 说 skill 时,他们在指什么具体的工程结构?"

旧问题让你焦虑,新问题让你能干活。

赫拉克利特的回响

"人不能两次踏进同一条河流。"

我们今天用 skill 这个词,和 2014 年的 Echo 工程师用 skill,字形相同,语义无关
我们和 2023 年讨论 ChatGPT plugins 的人用 skill,字形相同,边界不同

当一个词被三次借尸还魂,我们该问的不是"哪个是真的",而是"为什么这个词成了高价值的容器" —— 值得反复被偷换。

答案隐藏在这个词的语用学里:skill 听起来像人的属性。当我们说 AI 有 skill,我们在不知不觉中,把它人格化了。

而每一次这种人格化,都让人类更容易接受 AI 的下一次扩张。


EPILOGUE

结语:三个让你失眠的问题

读完这份报告,如果你还能心安理得地使用 "skill" 这个词,那是你的自由。
但有三个问题,我希望你之后每次说出 "skill" 之前,在脑子里过一遍。

▎问题一

当我说"AI 有这个 skill",我究竟是在说什么?

是模型的能力?是被加载的文件?是 harness 的路由策略?是 prompt 工程的产物?

你现在知道,这四个答案完全不同。

▎问题二

我在多大程度上,被这个词的"人格化暗示"操控了?

当 Alexa 有 100,000 个 skill 时,你下意识觉得它"很厉害"。
但你刚才已经看到,那些 skill 的本质是 REST endpoint。

你被一个名词骗了。如果它叫 "REST 接口商店",你不会有任何感觉。

▎问题三

下一次,这个词会被偷换成什么?

历史告诉我们,2027 年的 skill 大概率不是今天的 skill。

当那一天到来,你会是第一批察觉的人,还是最后一批?


FINALE

这份报告本身,是一次概念偷换的样本

你注意到了吗?这份报告的第一页和最后一页,"skill" 这个词的内涵,已经发生了变化。

  • 第一页:你以为 skill 是 AI 的能力
  • 最后一页:你知道 skill 是 一个被精心包装的文件夹格式

这种变化,在你脑子里发生的时间,只有 30 分钟。

而在文明史上,自然语言完成同样幅度的变化,需要 500 年

AI 时代真正的特征,不是技术加速,是认知加速

你今天写笔记捕捉到的"动态理解" —— 它不是一种思维习惯,是 2026 年生存的必备能力。

在流动的时代,最稳定的定义就是"它正在变化"。
而最稳定的智者,是那些记得每一次变化是怎么发生的人
END · 2026.04.25

资料来源

本文构建在以下 13 篇一手文档与深度剖析之上。点击可跳转。
← 回到博客列表