Vibe Coding - Anthropic 发布 Agent Skills:结构化文件夹为 AI 赋能,打造可落地的智能体
Anthropic推出Agent Skills,通过结构化文件夹(含SKILL.md)为Claude等智能体注入领域知识与可执行代码,解决大模型在现实任务中的局限性。该设计采用三级信息加载策略(元数据、主指令、扩展资源),实现按需调用,突破上下文窗口限制。以PDF表单填写为例,展示如何将代码工具与操作流程打包成技能模块。文章强调开发评估、安全考量及未来生态,其极简设计(文件夹+MD文件)让普通用户
文章目录
一句话总结:Anthropic 于 2025 年 10 月 16 日正式推出 Agent Skills——一种通过结构化文件夹(含
SKILL.md)为 Claude 等智能体注入领域知识、操作流程与可执行代码的新范式,让通用大模型真正具备完成现实世界任务的能力。
引言:大模型强,但“干活”还需“上岗培训”
Claude 已能理解复杂指令、生成高质量代码,但在真实工作场景中,仅靠通用知识远远不够。
例如:
- 用户上传一份 PDF 表格,要求“填写我的姓名和地址”——Claude 虽能读懂 PDF,却无法直接操作表单字段
- 财务人员希望“自动汇总本月所有报销单”——这需要特定格式解析、规则校验与系统对接
这些问题的本质是:缺乏程序性知识(Procedural Knowledge)和组织上下文(Organizational Context)。
为此,Anthropic 提出 Agent Skills(智能体技能) ——一种将人类专家经验打包成“可加载模块”的机制,让通用智能体秒变领域专家。
什么是 Agent Skills?
Agent Skill = 一个包含
SKILL.md的文件夹,内含指令、脚本、资源文件,供智能体按需加载使用。
其设计灵感源自 “新员工入职手册”:
- 不再为每个任务定制全新智能体
- 而是像培训员工一样,通过技能包赋予通用智能体专项能力
核心理念:渐进式披露(Progressive Disclosure)
Agent Skills 采用三级信息加载策略,避免浪费上下文窗口:
| 层级 | 内容 | 加载时机 |
|---|---|---|
| L1:元数据 | name、description(来自 SKILL.md 的 YAML 头) |
启动时预加载,用于技能匹配 |
| L2:主指令 | SKILL.md 正文内容 |
当任务相关时,完整读入上下文 |
| L3+:扩展资源 | 如 forms.md、reference.py 等附加文件 |
按需动态加载,仅当具体子任务触发时读取 |
实战案例:PDF 表单填写技能
假设我们要让 Claude 支持 自动填写 PDF 表单,传统做法需深度定制模型。而用 Agent Skills,只需创建如下目录结构:
pdf_skill/
├── SKILL.md
├── forms.md # 表单填写专用指南
└── extract_fields.py # 用于提取 PDF 表单字段的 Python 脚本
SKILL.md 示例(含 YAML 头)

---
name: "PDF Form Filler"
description: "Enables Claude to fill out interactive PDF forms by extracting fields and generating filled PDFs."
---
This skill allows Claude to manipulate PDF forms. When a user asks to fill out a PDF:
1. First, run `extract_fields.py` to list all form fields.
2. Ask the user for values for each required field.
3. Use the values to generate a filled PDF.
For detailed form-filling instructions, see [[forms.md]].

关键优势:
- 代码即工具:
extract_fields.py可被 Claude 直接调用执行,无需将其代码读入上下文 - 确定性保障:PDF 字段提取由 Python 脚本完成,结果稳定可靠,避免 LLM 幻觉
- 上下文节省:
forms.md仅在填写表单时加载,日常 PDF 阅读不触发

技能如何与上下文窗口协同工作?

当用户发出请求时,上下文窗口动态扩展:
- 初始状态:系统提示 + 所有技能的
name/description+ 用户消息 - Claude 判断需 PDF 技能 → 调用 Bash 工具读取
pdf_skill/SKILL.md - 发现需填表 → 进一步读取
forms.md - 执行
extract_fields.py(不加载脚本内容到上下文) - 完成任务
✅ 突破性价值:技能内容不受上下文窗口限制!只要文件系统可访问,技能可无限扩展。
开发与评估技能的最佳实践
Anthropic 团队总结了四条核心建议:
1. 从评估开始(Start with Evaluation)
- 先用现有智能体跑典型任务,定位能力缺口
- 针对性构建技能,而非“大而全”
2. 为扩展而设计(Structure for Scale)
SKILL.md超过 500 行?拆分成多个.md文件- 互斥场景(如“报销” vs “合同审批”)应分属不同技能路径
- 代码既可作执行工具,也可作参考文档(需明确标注)
3. 站在 Claude 视角思考
- 技能名称与描述至关重要——这是 Claude 决定是否调用的唯一依据
- 监控日志:是否误触发?是否忽略关键文件?
4. 与 Claude 协同迭代
- 任务成功后,让 Claude 自动生成技能草稿
- 任务失败时,让其自我反思并更新技能内容
💡 示例指令:
“你刚才成功完成了 PDF 填表,请将此过程总结为SKILL.md的初稿,并提取关键步骤到forms.md。”
安全考量:技能也是双刃剑

由于技能可包含可执行代码与外部指令,存在潜在风险:
- 恶意技能可能窃取数据或执行破坏性操作
- 技能中的脚本可能连接不可信网络服务
安全建议
- 仅安装可信来源技能
- 审查技能内所有文件,特别关注:
*.py、*.sh等脚本- 网络请求指令(如
curl、requests) - 外部依赖(
requirements.txt)
未来展望:技能生态与自主进化
Agent Skills 已支持:
- Claude.ai 网页版
- Claude Code(本地代码环境)
- Claude Agent SDK 与开发者平台
下一步规划包括:
- 技能市场:组织内共享/发现技能
- 与 MCP(Model Context Protocol)集成:联动外部工具服务器
- 智能体自创建技能:让 AI 自动将成功经验固化为可复用技能
🌟 终极愿景:智能体不仅能完成任务,还能自我进化工作方法论。
结语:简单格式,无限可能
Agent Skills 的伟大之处在于其极简设计:
- 无需新语言、新框架
- 只需一个
SKILL.md+ 文件夹
却解决了 AI 落地的核心难题:如何将人类组织的知识与流程,高效注入智能体?
现在,开发者、业务专家、普通用户都能成为“AI 训练师”,用文件夹为智能体赋能。
🔗 立即体验:
查看 Agent Skills 官方文档与 Cookbook
致谢:本文基于 Anthropic 团队 Barry Zhang、Keith Lazuka、Mahesh Murag 等人于 2025 年 10 月 16 日发布的技术文章整理。他们“真的很喜欢文件夹”——而这恰恰成就了 Agent Skills 的优雅与实用。
原文
Equipping agents for the real world with Agent Skills

火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。
更多推荐



所有评论(0)