在这里插入图片描述

一句话总结:Anthropic 于 2025 年 10 月 16 日正式推出 Agent Skills——一种通过结构化文件夹(含 SKILL.md)为 Claude 等智能体注入领域知识、操作流程与可执行代码的新范式,让通用大模型真正具备完成现实世界任务的能力。


引言:大模型强,但“干活”还需“上岗培训”

Claude 已能理解复杂指令、生成高质量代码,但在真实工作场景中,仅靠通用知识远远不够
例如:

  • 用户上传一份 PDF 表格,要求“填写我的姓名和地址”——Claude 虽能读懂 PDF,却无法直接操作表单字段
  • 财务人员希望“自动汇总本月所有报销单”——这需要特定格式解析、规则校验与系统对接

这些问题的本质是:缺乏程序性知识(Procedural Knowledge)和组织上下文(Organizational Context)

为此,Anthropic 提出 Agent Skills(智能体技能) ——一种将人类专家经验打包成“可加载模块”的机制,让通用智能体秒变领域专家


什么是 Agent Skills?

Agent Skill = 一个包含 SKILL.md 的文件夹,内含指令、脚本、资源文件,供智能体按需加载使用。

其设计灵感源自 “新员工入职手册”

  • 不再为每个任务定制全新智能体
  • 而是像培训员工一样,通过技能包赋予通用智能体专项能力

核心理念:渐进式披露(Progressive Disclosure)

Agent Skills 采用三级信息加载策略,避免浪费上下文窗口:

层级 内容 加载时机
L1:元数据 namedescription(来自 SKILL.md 的 YAML 头) 启动时预加载,用于技能匹配
L2:主指令 SKILL.md 正文内容 当任务相关时,完整读入上下文
L3+:扩展资源 forms.mdreference.py 等附加文件 按需动态加载,仅当具体子任务触发时读取
系统启动
加载所有技能的 name/description
用户请求
Claude 判断是否需某技能?
读取 SKILL.md 全文
是否需更细粒度内容?
读取 forms.md / script.py 等
执行任务

实战案例:PDF 表单填写技能

假设我们要让 Claude 支持 自动填写 PDF 表单,传统做法需深度定制模型。而用 Agent Skills,只需创建如下目录结构:

pdf_skill/
├── SKILL.md
├── forms.md          # 表单填写专用指南
└── extract_fields.py # 用于提取 PDF 表单字段的 Python 脚本

SKILL.md 示例(含 YAML 头)

在这里插入图片描述

---
name: "PDF Form Filler"
description: "Enables Claude to fill out interactive PDF forms by extracting fields and generating filled PDFs."
---

This skill allows Claude to manipulate PDF forms. When a user asks to fill out a PDF:

1. First, run `extract_fields.py` to list all form fields.
2. Ask the user for values for each required field.
3. Use the values to generate a filled PDF.

For detailed form-filling instructions, see [[forms.md]].

在这里插入图片描述

关键优势:

  • 代码即工具extract_fields.py 可被 Claude 直接调用执行,无需将其代码读入上下文
  • 确定性保障:PDF 字段提取由 Python 脚本完成,结果稳定可靠,避免 LLM 幻觉
  • 上下文节省forms.md 仅在填写表单时加载,日常 PDF 阅读不触发

在这里插入图片描述


技能如何与上下文窗口协同工作?

在这里插入图片描述

当用户发出请求时,上下文窗口动态扩展:

  1. 初始状态:系统提示 + 所有技能的 name/description + 用户消息
  2. Claude 判断需 PDF 技能 → 调用 Bash 工具读取 pdf_skill/SKILL.md
  3. 发现需填表 → 进一步读取 forms.md
  4. 执行 extract_fields.py不加载脚本内容到上下文
  5. 完成任务

突破性价值:技能内容不受上下文窗口限制!只要文件系统可访问,技能可无限扩展。


开发与评估技能的最佳实践

Anthropic 团队总结了四条核心建议:

1. 从评估开始(Start with Evaluation)

  • 先用现有智能体跑典型任务,定位能力缺口
  • 针对性构建技能,而非“大而全”

2. 为扩展而设计(Structure for Scale)

  • SKILL.md 超过 500 行?拆分成多个 .md 文件
  • 互斥场景(如“报销” vs “合同审批”)应分属不同技能路径
  • 代码既可作执行工具,也可作参考文档(需明确标注)

3. 站在 Claude 视角思考

  • 技能名称与描述至关重要——这是 Claude 决定是否调用的唯一依据
  • 监控日志:是否误触发?是否忽略关键文件?

4. 与 Claude 协同迭代

  • 任务成功后,让 Claude 自动生成技能草稿
  • 任务失败时,让其自我反思并更新技能内容

💡 示例指令:
“你刚才成功完成了 PDF 填表,请将此过程总结为 SKILL.md 的初稿,并提取关键步骤到 forms.md。”


安全考量:技能也是双刃剑

在这里插入图片描述

由于技能可包含可执行代码与外部指令,存在潜在风险:

  • 恶意技能可能窃取数据执行破坏性操作
  • 技能中的脚本可能连接不可信网络服务

安全建议

  • 仅安装可信来源技能
  • 审查技能内所有文件,特别关注:
    • *.py*.sh 等脚本
    • 网络请求指令(如 curlrequests
    • 外部依赖(requirements.txt

未来展望:技能生态与自主进化

Agent Skills 已支持:

  • Claude.ai 网页版
  • Claude Code(本地代码环境)
  • Claude Agent SDK 与开发者平台

下一步规划包括:

  • 技能市场:组织内共享/发现技能
  • 与 MCP(Model Context Protocol)集成:联动外部工具服务器
  • 智能体自创建技能:让 AI 自动将成功经验固化为可复用技能

🌟 终极愿景:智能体不仅能完成任务,还能自我进化工作方法论


结语:简单格式,无限可能

Agent Skills 的伟大之处在于其极简设计

  • 无需新语言、新框架
  • 只需一个 SKILL.md + 文件夹

却解决了 AI 落地的核心难题:如何将人类组织的知识与流程,高效注入智能体?

现在,开发者、业务专家、普通用户都能成为“AI 训练师”,用文件夹为智能体赋能。

🔗 立即体验
查看 Agent Skills 官方文档与 Cookbook


致谢:本文基于 Anthropic 团队 Barry Zhang、Keith Lazuka、Mahesh Murag 等人于 2025 年 10 月 16 日发布的技术文章整理。他们“真的很喜欢文件夹”——而这恰恰成就了 Agent Skills 的优雅与实用。

原文

Equipping agents for the real world with Agent Skills

在这里插入图片描述

Logo

火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。

更多推荐