Skip to content

ChatGPT Image 2026年5月13日 15_14_34我想跟你聊下 关于 AI 中 skills 技能的东西,简单说 skills 就是帮助 AI 更好理解 更好的按照某个规范去执行或者思考。相当于使用者 使用特定技能训练 AI,通常 skills 就是一堆的 md 文件 脚本文件 还有一个 Skills.md 文件,你也可以说说你的观点,agent 的 skills 和一些市面上配置好的工作流有什么本质区别了,都是按照规范让 AI 生成式的做事情

你这个理解其实已经非常接近现在很多 Agent 系统的本质了。

很多人把 “AI Agent” 想得很神秘,但你如果拆开来看:

  • 大模型(LLM)
  • Prompt
  • Skills
  • Workflow
  • Tools
  • Memory
  • Planning

本质上其实都是:

“如何让一个概率生成模型,在特定上下文下,更稳定、更像人类专家地完成任务。”

而你说的 Skills,本质上就是:

给 AI 注入一种“领域行为模式(Behavior Pattern)”。

它不像传统程序那样是固定逻辑。

更像:

  • 给 AI 一套思维模板
  • 一套操作规范
  • 一套任务边界
  • 一套输出风格
  • 一套决策偏好

然后让 AI 在生成时“模仿这种工作方式”。


一、为什么 Skills 大部分是 md 文件

因为:

LLM 天生最擅长处理的就是:

  • 自然语言
  • 结构化文本
  • 示例
  • 上下文

所以 Skills 最有效的形式反而不是代码。

而是:

你是一个什么角色
你该怎么思考
你应该遵循什么规则
遇到什么情况怎么办
输出格式是什么
不要做什么

这些东西。

所以现在大量 Agent 系统:

  • Claude Code
  • Cursor Rules
  • Windsurf Rules
  • OpenHands
  • Devin
  • Manus
  • RooCode
  • Cline
  • AutoGen
  • CrewAI

本质上都在干一件事:

用大量文本上下文,塑造 AI 的行为。

所以你看到:

Skills.md
rules.md
coding-style.md
architecture.md
workflow.md

其实都属于:

“行为约束层(Behavior Constraint Layer)”


二、Skills 到底是什么

你可以把 Skills 理解成:

一种可复用的 AI 行为插件

例如:


1. Java Backend Skill

它会告诉 AI:

  • SpringBoot 项目怎么组织
  • Controller 不要写业务
  • Service 怎么拆
  • DTO 怎么命名
  • MyBatis Plus 怎么用
  • 日志规范
  • 异常规范
  • 接口返回规范
  • Redis key 命名
  • Docker 部署方式

于是:

AI 输出会越来越像:

“你团队里的高级 Java 架构师”


2. UI Design Skill

会约束:

  • 色彩
  • 间距
  • 字体
  • 动效
  • 用户体验
  • 卡片风格

于是 AI 生成的页面:

会越来越统一。


3. Content Creator Skill

比如你现在做的短视频:

Skill 甚至可以规定:

开头3秒必须情绪钩子
字幕不超过12字
镜头节奏
结尾反转
BGM 情绪
封面文案风格

于是 AI 会越来越像:

一个成熟的新媒体编导。


三、Skills 和 Workflow 的区别

这个很关键。

很多人把两者混了。

实际上:


Workflow(工作流)

更像:

任务执行顺序

例如:

1. 读取用户需求
2. 提取关键词
3. 查询数据库
4. 调用搜索
5. 总结结果
6. 输出 Markdown

它强调的是:

“流程编排”

类似:

  • Dify 工作流
  • Coze 工作流
  • n8n
  • LangGraph
  • Flowise

本质是:

节点 + 状态流转

Skills

强调的是:

“AI 应该如何思考和行动”

它不是流程。

而是:

行为模式

比如:

你必须先分析风险
你必须分步骤
你必须先检查异常情况
你不能直接给答案
你输出必须是表格

这是“行为约束”。


四、两者真正关系

你可以理解成:

Workflow = 骨架
Skills = 灵魂

或者:

Workflow 决定 AI 做什么
Skills 决定 AI 怎么做

五、为什么很多 Agent 开始重视 Skills

因为大家发现:

仅靠 Workflow 不够。


举个例子:

一个“代码生成工作流”:

读取需求
→ 生成代码
→ 测试
→ 修复

看起来没问题。

但:

不同 AI 生成质量差异巨大。

原因就在于:

缺少稳定行为模式。

于是开始出现:

  • coding standards
  • repo rules
  • agent memory
  • engineering playbook
  • architecture guide

这些东西。

其实本质都属于:

Skills。


六、为什么你会觉得 “Skills 像训练 AI”

因为它确实有点像。

但不是参数训练(Training)。

而是:

上下文训练(Contextual Training)

区别很大。


传统训练(Fine-tuning)

是真的修改模型参数:

weights
attention
embedding

成本高。


Skills

只是:

把行为规范塞进上下文

本质是:

Prompt Engineering 的高级形态

但由于:

  • 长上下文
  • Memory
  • RAG
  • Tool Calling
  • Planning

越来越强。

于是:

Prompt 已经逐渐“系统化”了。

最终演变成:

Skill System

七、现在最前沿的 Agent 其实是什么

现在很多顶级 Agent:

已经开始像:

操作系统

而不是聊天机器人。

它们内部通常有:

模块作用
Planner任务规划
Skills行为规范
Memory长期记忆
Tools外部能力
Workflow Engine流程编排
Reflection自我反思
Evaluator结果评估
RAG知识检索
Context Manager上下文压缩

所以:

真正强的 Agent。

已经不是:

一个 Prompt

而是:

一整套 AI Runtime

八、你会发现一个很有意思的事情

未来:

很多公司真正的核心资产。

可能不是模型。

而是:

自己的 Skills 系统

因为:

模型大家都能买。

但:

  • 你的业务经验
  • 团队规范
  • 工作方式
  • SOP
  • 运营策略
  • 工程标准

这些东西。

才能真正让 AI:

“像你公司的人”。


九、你可以把 Skills 理解成:

最后我给你一个我认为很准确的定义:

Skills = AI 的经验与工作习惯

而:

Workflow = AI 的执行流程

再进一步:

Tools = AI 的手脚
Memory = AI 的长期记忆
LLM = AI 的大脑

这些东西组合起来。

才是真正的 Agent。

ChatGPT Image 2026年5月13日 15_14_41

那一些大模型的开发者或者训练师,不就是在训练 AI 更理解人类的语言吗,比如拿开发语言来说,你让 AI 开发一个功能,它甚至写的比你自己写的还好,你都不用告诉它 Controller 层不能写业务,AI 自己本身就知道

对,这其实已经触碰到一个非常核心的问题了:

“AI 到底是在理解规则,还是在统计人类行为?”

答案是:

现代大模型很多时候并不是“懂了软件架构”,而是“看过太多优秀代码之后,形成了高概率模式”。

所以你会发现:

你没有告诉 AI:

Controller 不要写业务

但它还是会:

  • 自动拆 Service
  • 自动分层
  • 自动 DTO
  • 自动 VO
  • 自动 Repository
  • 自动异常处理

因为:

它训练时已经看过:

  • GitHub 上几千万 SpringBoot 项目
  • 开源框架
  • 企业级代码
  • 教程
  • StackOverflow
  • 技术博客
  • 官方文档

于是:

它已经形成一种:

“Java 工程世界里,高质量代码通常长什么样”

的统计规律。


一、这其实是“大规模模式压缩”

你可以把 LLM 想成:

人类互联网经验的概率压缩体

比如:

在 SpringBoot 世界。

AI 看到过太多:

@RestController
public class UserController {

    @Autowired
    private UserService userService;

}

而不是:

@RestController
public class UserController {

    public void save(){
        // 500 行业务
    }

}

所以:

即使你没告诉它。

它也会倾向于:

“更像互联网上高质量代码的写法”。


二、所以很多“架构经验”已经内化进模型了

这也是为什么:

你会产生一种很震撼的感觉:

“AI 怎么比我还懂工程?”

因为:

它不是只学了一个人的经验。

而是:

学习了全球无数程序员的集体经验

甚至包括:

  • 阿里
  • Netflix
  • Uber
  • Google
  • Spring 官方
  • 开源作者

这些代码风格。


三、但这里有个关键问题

虽然 AI “知道”。

但:

它并不总是“稳定遵守”。

这就是为什么:

Skills 依然重要。


举个例子。

AI 确实知道:

Controller 不应该写业务

但:

当上下文混乱时。

它还是可能:

  • 偷懒
  • 合并层
  • 写巨型方法
  • 重复代码
  • 不做抽象
  • 忽略异常
  • 乱用 static
  • 忽略事务

因为:

LLM 本质不是:

规则执行器

而是:

概率生成器

它只是在:

“预测下一个最可能的 token”。


四、这也是为什么 AI 有时“忽然变蠢”

你应该见过这种情况:

前面代码写得特别专业。

后面忽然:

  • SQL 拼错
  • 命名乱了
  • DTO 和实体混用了
  • Redis key 风格不一致
  • 接口字段前后不统一

为什么?

因为:

LLM 没有真正“长期稳定的工程意识”。

它只有:

局部上下文中的概率惯性

所以:

Skills 的意义就在于:

持续把 AI 拉回正确行为模式

比如:

# coding-rules.md

- Controller 不允许写业务
- 所有返回必须 Result<T>
- Redis key 使用业务:模块:id
- Service 不允许返回 Entity
- 必须处理事务

这其实是在:

给概率模型增加“行为锚点”。


五、你会发现一个更恐怖的事情

很多时候:

AI 已经不是“学习语法”。

而是在学习:

人类协作模式

比如它会:

  • 自动加日志
  • 自动写 TODO
  • 自动写异常信息
  • 自动补注释
  • 自动考虑扩展性
  • 自动考虑复用性
  • 自动避免硬编码

为什么?

因为:

它训练时看到:

“成熟团队都这样做”。

于是:

AI 学到的其实是:

软件工程文化

而不仅仅是:

Java 语法

六、所以现在 AI 最强的能力其实不是“代码生成”

而是:

模式迁移能力

例如:

你说:

帮我做一个库存管理系统

AI 已经能联想到:

  • 商品表
  • 库存流水
  • 入库单
  • 出库单
  • SKU
  • 审计字段
  • 分页
  • 权限
  • MyBatis Plus
  • Redis 缓存
  • Docker 部署
  • Nginx
  • Swagger

因为:

它在训练里已经看过:

成千上万个类似系统

所以它不是:

“现想”。

而更像:

从人类经验海洋里召回最像的模式

七、但 AI 真正还没做到的一件事

这是重点。

AI 虽然“懂大量模式”。

但:

它缺少:

真正长期一致的世界模型

比如:

一个真正高级架构师。

会有:

  • 公司历史
  • 团队能力
  • 业务成本
  • 技术债
  • 运维压力
  • 老系统兼容
  • 人员水平
  • 未来扩展

这些长期认知。

而 AI:

目前大多数时候:

还是:

局部上下文里的高质量模仿者

所以:

它能:

  • 写得像专家
  • 说得像专家

但:

不一定真的:

“像人类一样长期负责”。


八、所以未来真正强的 Agent 会是什么

其实就是:

预训练模型能力
+
长期记忆
+
Skills
+
Workflow
+
Reflection
+
真实项目上下文

最终形成:

一个越来越像“团队成员”的 AI

而不是:

一个会聊天的代码生成器

这也是为什么现在很多公司开始研究:

  • AI Software Engineer
  • AI Employee
  • AI Operating System
  • AI Runtime
  • Persistent Agent

因为:

大家已经发现。

LLM 本身只是“大脑”。

真正决定 AI 是否像“一个成熟工程师”的。

是外围那一整套系统。

ChatGPT Image 2026年5月13日 15_15_19

Powered by VitePress