能力困境
传统提示词方法:
- Token爆炸成本高:每次请求携带完整上下文
- 模型幻觉风险剧增:信息过载导致模型注意力分散
- 维护困难:数千行代码难以版本控制
AgentSkills方法:将能力拆解为独立的技能文件夹,按需动态加载,实现精准调用
- 上下文纯净:只加载必要的技能信息,Token消耗降低80%以上
- 降低幻觉:精准匹配的技能上下文显著提升模型输出准确性
- 支持协作:Git版本控制友好
Agent Skill
- 扩展Agent能力
- Tool use 工具调用
- MCP
- 提供的是 工具能力,一次性加载所有Agent
- 问题
- 如何快准狠调用工具(精度)
- Token 消耗
- 上下文爆炸
- MCP
- Skill
- 渐进式披露
- 三层加载
- 元数据(Agent启动时候加载一次)
- 技能(可重复加载)
- 调用工具)
- 三层加载
- 解决痛点
- 工具精准调用
- 上下文信息密度控制
- 外部资源的引用
- 开发范式
- 渐进式披露
- Tool use 工具调用
AgentSkills核心机制
Skill文件夹结构
核心机制:渐进式披露
Progressive Disclosure - 动态上下文加载策略
- Discovery发现:仅读取技能元数据(名称、描述、标签),Token消耗极低,快速匹配用户意图
- Activation激活:意图匹配后,动态注入该技能的完整指令(SKILL.md+必要参数),精准加载
- Execution执行:根据需要调用脚本(script/)或检索参考资料(references/),完成具体任务
意图识别→技能筛选→动态加载→执行输出
核心架构公式与演示
实现原理
系统启动准备
1 | graph TD |
用户请求处理全流程
1 | sequenceDiagram |
具体实现案例流程(以“千问模型”为例)
1 | flowchart LR |
1 | flowchart LR |
工作流落地
属于具体应用