ChatGPT Image 2026年5月13日 15_14_34 我想跟你聊下关于 AI 中 skills 技能的东西，简单说 skills 就是帮助 AI 更好理解更好的按照某个规范去执行或者思考。相当于使用者使用特定技能训练 AI，通常 skills 就是一堆的 md 文件脚本文件还有一个 Skills.md 文件，你也可以说说你的观点，agent 的 skills 和一些市面上配置好的工作流有什么本质区别了，都是按照规范让 AI 生成式的做事情

你这个理解其实已经非常接近现在很多 Agent 系统的本质了。

很多人把 “AI Agent” 想得很神秘，但你如果拆开来看：

大模型（LLM）
Prompt
Skills
Workflow
Tools
Memory
Planning

本质上其实都是：

“如何让一个概率生成模型，在特定上下文下，更稳定、更像人类专家地完成任务。”

而你说的 Skills，本质上就是：

给 AI 注入一种“领域行为模式（Behavior Pattern）”。

它不像传统程序那样是固定逻辑。

更像：

给 AI 一套思维模板
一套操作规范
一套任务边界
一套输出风格
一套决策偏好

然后让 AI 在生成时“模仿这种工作方式”。

一、为什么 Skills 大部分是 md 文件

因为：

LLM 天生最擅长处理的就是：

自然语言
结构化文本
示例
上下文

所以 Skills 最有效的形式反而不是代码。

而是：

你是一个什么角色
你该怎么思考
你应该遵循什么规则
遇到什么情况怎么办
输出格式是什么
不要做什么

这些东西。

所以现在大量 Agent 系统：

Claude Code
Cursor Rules
Windsurf Rules
OpenHands
Devin
Manus
RooCode
Cline
AutoGen
CrewAI

本质上都在干一件事：

用大量文本上下文，塑造 AI 的行为。

所以你看到：

Skills.md
rules.md
coding-style.md
architecture.md
workflow.md

其实都属于：

“行为约束层（Behavior Constraint Layer）”

二、Skills 到底是什么

你可以把 Skills 理解成：

一种可复用的 AI 行为插件

例如：

1. Java Backend Skill

它会告诉 AI：

SpringBoot 项目怎么组织
Controller 不要写业务
Service 怎么拆
DTO 怎么命名
MyBatis Plus 怎么用
日志规范
异常规范
接口返回规范
Redis key 命名
Docker 部署方式

于是：

AI 输出会越来越像：

“你团队里的高级 Java 架构师”

2. UI Design Skill

会约束：

色彩
间距
字体
动效
用户体验
卡片风格

于是 AI 生成的页面：

会越来越统一。

3. Content Creator Skill

比如你现在做的短视频：

Skill 甚至可以规定：

开头3秒必须情绪钩子
字幕不超过12字
镜头节奏
结尾反转
BGM 情绪
封面文案风格

于是 AI 会越来越像：

一个成熟的新媒体编导。

三、Skills 和 Workflow 的区别

这个很关键。

很多人把两者混了。

实际上：

Workflow（工作流）

更像：

任务执行顺序

例如：

1. 读取用户需求
2. 提取关键词
3. 查询数据库
4. 调用搜索
5. 总结结果
6. 输出 Markdown

它强调的是：

“流程编排”

类似：

Dify 工作流
Coze 工作流
n8n
LangGraph
Flowise

本质是：

节点 + 状态流转

Skills

强调的是：

“AI 应该如何思考和行动”

它不是流程。

而是：

行为模式

比如：

你必须先分析风险
你必须分步骤
你必须先检查异常情况
你不能直接给答案
你输出必须是表格

这是“行为约束”。

四、两者真正关系

你可以理解成：

Workflow = 骨架
Skills = 灵魂

或者：

Workflow 决定 AI 做什么
Skills 决定 AI 怎么做

五、为什么很多 Agent 开始重视 Skills

因为大家发现：

仅靠 Workflow 不够。

举个例子：

一个“代码生成工作流”：

读取需求
→ 生成代码
→ 测试
→ 修复

看起来没问题。

但：

不同 AI 生成质量差异巨大。

原因就在于：

缺少稳定行为模式。

于是开始出现：

coding standards
repo rules
agent memory
engineering playbook
architecture guide

这些东西。

其实本质都属于：

Skills。

六、为什么你会觉得 “Skills 像训练 AI”

因为它确实有点像。

但不是参数训练（Training）。

而是：

上下文训练（Contextual Training）

区别很大。

传统训练（Fine-tuning）

是真的修改模型参数：

weights
attention
embedding

成本高。

Skills

只是：

把行为规范塞进上下文

本质是：

Prompt Engineering 的高级形态

但由于：

长上下文
Memory
RAG
Tool Calling
Planning

越来越强。

于是：

Prompt 已经逐渐“系统化”了。

最终演变成：

Skill System

七、现在最前沿的 Agent 其实是什么

现在很多顶级 Agent：

已经开始像：

操作系统

而不是聊天机器人。

它们内部通常有：

模块	作用
Planner	任务规划
Skills	行为规范
Memory	长期记忆
Tools	外部能力
Workflow Engine	流程编排
Reflection	自我反思
Evaluator	结果评估
RAG	知识检索
Context Manager	上下文压缩

所以：

真正强的 Agent。

已经不是：

一个 Prompt

而是：

一整套 AI Runtime

八、你会发现一个很有意思的事情

未来：

很多公司真正的核心资产。

可能不是模型。

而是：

自己的 Skills 系统

因为：

模型大家都能买。

但：

你的业务经验
团队规范
工作方式
SOP
运营策略
工程标准

这些东西。

才能真正让 AI：

“像你公司的人”。

九、你可以把 Skills 理解成：

最后我给你一个我认为很准确的定义：

Skills = AI 的经验与工作习惯

而：

Workflow = AI 的执行流程

再进一步：

Tools = AI 的手脚
Memory = AI 的长期记忆
LLM = AI 的大脑

这些东西组合起来。

才是真正的 Agent。

ChatGPT Image 2026年5月13日 15_14_41

那一些大模型的开发者或者训练师，不就是在训练 AI 更理解人类的语言吗，比如拿开发语言来说，你让 AI 开发一个功能，它甚至写的比你自己写的还好，你都不用告诉它 Controller 层不能写业务，AI 自己本身就知道

对，这其实已经触碰到一个非常核心的问题了：

“AI 到底是在理解规则，还是在统计人类行为？”

答案是：

现代大模型很多时候并不是“懂了软件架构”，而是“看过太多优秀代码之后，形成了高概率模式”。

所以你会发现：

你没有告诉 AI：

Controller 不要写业务

但它还是会：

自动拆 Service
自动分层
自动 DTO
自动 VO
自动 Repository
自动异常处理

因为：

它训练时已经看过：

GitHub 上几千万 SpringBoot 项目
开源框架
企业级代码
教程
StackOverflow
技术博客
官方文档

于是：

它已经形成一种：

“Java 工程世界里，高质量代码通常长什么样”

的统计规律。

一、这其实是“大规模模式压缩”

你可以把 LLM 想成：

人类互联网经验的概率压缩体

比如：

在 SpringBoot 世界。

AI 看到过太多：

@RestController
public class UserController {

    @Autowired
    private UserService userService;

}

而不是：

@RestController
public class UserController {

    public void save(){
        // 500 行业务
    }

}

所以：

即使你没告诉它。

它也会倾向于：

“更像互联网上高质量代码的写法”。

二、所以很多“架构经验”已经内化进模型了

这也是为什么：

你会产生一种很震撼的感觉：

“AI 怎么比我还懂工程？”

因为：

它不是只学了一个人的经验。

而是：

学习了全球无数程序员的集体经验

甚至包括：

阿里
Netflix
Uber
Google
Spring 官方
开源作者

这些代码风格。

三、但这里有个关键问题

虽然 AI “知道”。

但：

它并不总是“稳定遵守”。

这就是为什么：

Skills 依然重要。

举个例子。

AI 确实知道：

Controller 不应该写业务

但：

当上下文混乱时。

它还是可能：

偷懒
合并层
写巨型方法
重复代码
不做抽象
忽略异常
乱用 static
忽略事务

因为：

LLM 本质不是：

规则执行器

而是：

概率生成器

它只是在：

“预测下一个最可能的 token”。

四、这也是为什么 AI 有时“忽然变蠢”

你应该见过这种情况：

前面代码写得特别专业。

后面忽然：

SQL 拼错
命名乱了
DTO 和实体混用了
Redis key 风格不一致
接口字段前后不统一

为什么？

因为：

LLM 没有真正“长期稳定的工程意识”。

它只有：

局部上下文中的概率惯性

所以：

Skills 的意义就在于：

持续把 AI 拉回正确行为模式

比如：

# coding-rules.md

- Controller 不允许写业务
- 所有返回必须 Result<T>
- Redis key 使用业务:模块:id
- Service 不允许返回 Entity
- 必须处理事务

这其实是在：

给概率模型增加“行为锚点”。

五、你会发现一个更恐怖的事情

很多时候：

AI 已经不是“学习语法”。

而是在学习：

人类协作模式

比如它会：

自动加日志
自动写 TODO
自动写异常信息
自动补注释
自动考虑扩展性
自动考虑复用性
自动避免硬编码

为什么？

因为：

它训练时看到：

“成熟团队都这样做”。

于是：

AI 学到的其实是：

软件工程文化

而不仅仅是：

Java 语法

六、所以现在 AI 最强的能力其实不是“代码生成”

而是：

模式迁移能力

例如：

你说：

帮我做一个库存管理系统

AI 已经能联想到：

商品表
库存流水
入库单
出库单
SKU
审计字段
分页
权限
MyBatis Plus
Redis 缓存
Docker 部署
Nginx
Swagger

因为：

它在训练里已经看过：

成千上万个类似系统

所以它不是：

“现想”。

而更像：

从人类经验海洋里召回最像的模式

七、但 AI 真正还没做到的一件事

这是重点。

AI 虽然“懂大量模式”。

但：

它缺少：

真正长期一致的世界模型

比如：

一个真正高级架构师。

会有：

公司历史
团队能力
业务成本
技术债
运维压力
老系统兼容
人员水平
未来扩展

这些长期认知。

而 AI：

目前大多数时候：

还是：

局部上下文里的高质量模仿者

所以：

它能：

写得像专家
说得像专家

但：

不一定真的：

“像人类一样长期负责”。

八、所以未来真正强的 Agent 会是什么

其实就是：

预训练模型能力
+
长期记忆
+
Skills
+
Workflow
+
Reflection
+
真实项目上下文

最终形成：

一个越来越像“团队成员”的 AI

而不是：

一个会聊天的代码生成器

这也是为什么现在很多公司开始研究：

AI Software Engineer
AI Employee
AI Operating System
AI Runtime
Persistent Agent

因为：

大家已经发现。

LLM 本身只是“大脑”。

真正决定 AI 是否像“一个成熟工程师”的。

是外围那一整套系统。

ChatGPT Image 2026年5月13日 15_15_19

短视频创作方案

微缩场景视频

2025 05 14

2025 05 15

2025 05 16

01 架构演进

02 领域事件与 Saga

03 Specification 与防腐层

04 持久化与缓存

05 BFF 与前后端对接

06 部署与运维

07 踩坑与杂记

08 AI 协作工作流的感悟与 SOP

AI

一、为什么 Skills 大部分是 md 文件 ​

二、Skills 到底是什么 ​

1. Java Backend Skill ​

2. UI Design Skill ​

3. Content Creator Skill ​

三、Skills 和 Workflow 的区别 ​

Workflow（工作流） ​

Skills ​

四、两者真正关系 ​

五、为什么很多 Agent 开始重视 Skills ​

六、为什么你会觉得 “Skills 像训练 AI” ​

传统训练（Fine-tuning） ​

Skills ​

七、现在最前沿的 Agent 其实是什么 ​

八、你会发现一个很有意思的事情 ​

九、你可以把 Skills 理解成： ​

一、这其实是“大规模模式压缩” ​

二、所以很多“架构经验”已经内化进模型了 ​

三、但这里有个关键问题 ​

四、这也是为什么 AI 有时“忽然变蠢” ​

五、你会发现一个更恐怖的事情 ​

六、所以现在 AI 最强的能力其实不是“代码生成” ​

七、但 AI 真正还没做到的一件事 ​

八、所以未来真正强的 Agent 会是什么 ​

一、为什么 Skills 大部分是 md 文件

二、Skills 到底是什么

1. Java Backend Skill

2. UI Design Skill

3. Content Creator Skill

三、Skills 和 Workflow 的区别

Workflow（工作流）

Skills

四、两者真正关系

五、为什么很多 Agent 开始重视 Skills

六、为什么你会觉得 “Skills 像训练 AI”

传统训练（Fine-tuning）

Skills

七、现在最前沿的 Agent 其实是什么

八、你会发现一个很有意思的事情

九、你可以把 Skills 理解成：

一、这其实是“大规模模式压缩”

二、所以很多“架构经验”已经内化进模型了

三、但这里有个关键问题

四、这也是为什么 AI 有时“忽然变蠢”

五、你会发现一个更恐怖的事情

六、所以现在 AI 最强的能力其实不是“代码生成”

七、但 AI 真正还没做到的一件事

八、所以未来真正强的 Agent 会是什么