
大家好,我是 Ai 学习的老章
你有没有这种感觉——用 AI 写代码速度飞快,但写出来的东西总像"能跑就行"的原型?测试没写、安全没考虑、代码 Review 形同虚设,跟真正上生产的代码差了十万八千里
今天介绍一个让我眼前一亮的项目——Agent Skills,来自 Google Chrome 工程经理 Addy Osmani,5.5 万星,一句话总结:把资深工程师的工作纪律,打包成 AI Agent 可以执行的结构化工作流

Agent Skills 要解决的问题很直接:AI 编程 Agent 默认走最短路径——跳过规格说明、跳过测试、跳过安全审查、跳过代码 Review。这些正好是让软件从"能跑"变成"能用"的关键环节
这个项目把整个软件开发生命周期拆成了 6 个阶段,覆盖了从需求定义到生产部署的完整链路:
DEFINE PLAN BUILD VERIFY REVIEW SHIP
┌──────┐ ┌──────┐ ┌──────┐ ┌──────┐ ┌──────┐ ┌──────┐
│ Idea │ ───▶ │ Spec │ ───▶ │ Code │ ───▶ │ Test │ ───▶ │ QA │ ───▶ │ Go │
│Refine│ │ PRD │ │ Impl │ │Debug │ │ Gate │ │ Live │
└──────┘ └──────┘ └──────┘ └──────┘ └──────┘ └──────┘
/spec /plan /build /test /review /ship
核心功能与特点:
说实话,AI 编程领域的 prompt 工程项目我见过太多了,但 Agent Skills 有几个让我觉得"这玩意儿是真懂工程"的地方:
1. 来自 Google 工程文化的硬核实践
这不是拍脑门写的最佳实践。项目明确引用了《Software Engineering at Google》和 Google 工程实践指南里的核心概念:
这些不是抽象原则,而是直接嵌在 Agent 的每一步操作中
2. "怀疑驱动开发"——对 AI 自信的纠偏
这是我觉得最有创意的一个 Skill:doubt-driven-development
核心逻辑是:AI 给出的"自信答案"不等于"正确答案"。长时间对话会让假设悄悄变成"事实"。这个 Skill 强制要求在关键决策点召唤一个"对立面审查者"——专门来挑刺的
流程是这样的:
Doubt cycle:
- [ ] Step 1: CLAIM — 写明你的决策 + 为什么重要
- [ ] Step 2: EXTRACT — 剥离推理过程,只留结论
- [ ] Step 3: DOUBT — 召唤全新上下文的审查者,带对抗性提示
- [ ] Step 4: RECONCILE — 逐条核实每个发现
- [ ] Step 5: STOP — 满足终止条件才放行
什么时候用?当决策涉及生产环境、安全逻辑、不可逆操作,或者你对不熟悉的代码"感觉没问题"的时候——恰恰是最需要怀疑的时候
3. Context Engineering——给 Agent "喂"对信息
另一个我特别认同的 Skill。上下文就是 Agent 输出质量的最大杠杆:太少就幻觉,太多就失焦
它设计了一个 5 层上下文层级:
┌─────────────────────────────────────┐
│ 1. Rules Files (CLAUDE.md等) │ ← 始终加载,项目全局
├─────────────────────────────────────┤
│ 2. Spec / Architecture Docs │ ← 按功能/会话加载
├─────────────────────────────────────┤
│ 3. Relevant Source Files │ ← 按任务加载
├─────────────────────────────────────┤
│ 4. Error Output / Test Results │ ← 按迭代加载
├─────────────────────────────────────┤
│ 5. Conversation History │ ← 持续累积、定期压缩
└─────────────────────────────────────┘
最持久的信息放顶层(比如技术栈、代码规范),最临时的放底层(比如报错信息)。这个分层思维,做 AI 编程的都该记住
阶段 | Skill | 干什么 |
|---|---|---|
Define | interview-me | 一问一答挖需求,直到 95% 确信才停 |
Define | idea-refine | 发散→收敛,把模糊想法变成具体方案 |
Define | spec-driven-development | 写 PRD,覆盖目标、命令、结构、测试 |
Plan | planning-and-task-breakdown | 把规格拆成小任务,带验收标准和依赖排序 |
Build | incremental-implementation | 薄切片开发:实现→测试→验证→提交 |
Build | test-driven-development | 红→绿→重构,金字塔比例 80/15/5 |
Build | context-engineering | 给 Agent 喂对的信息 |
Build | source-driven-development | 每个决策都要有官方文档出处 |
Build | doubt-driven-development | 对抗性审查:CLAIM→DOUBT→RECONCILE |
Build | frontend-ui-engineering | 组件架构、设计系统、WCAG 2.1 AA |
Build | api-and-interface-design | Contract-first、Hyrum's Law、边界校验 |
Verify | browser-testing-with-devtools | Chrome DevTools MCP 实时调试 |
Verify | debugging-and-error-recovery | 五步分诊:复现→定位→缩小→修复→防护 |
Review | code-review-and-quality | 五轴审查、~100 行变更、严重级别标签 |
Review | code-simplification | Chesterton's Fence、Rule of 500 |
Review | security-and-hardening | OWASP Top 10、密钥管理、三层边界 |
Review | performance-optimization | 先测量再优化、Core Web Vitals |
Ship | git-workflow-and-versioning | Trunk-based、原子提交、commit-as-save |
Ship | ci-cd-and-automation | Shift Left、Feature Flag、质量门 |
Ship | deprecation-and-migration | Code-as-liability 思维、僵尸代码清理 |
Ship | documentation-and-adrs | ADR 架构决策记录、记录"为什么" |
Ship | observability-and-instrumentation | 结构化日志、RED 指标、OpenTelemetry |
Ship | shipping-and-launch | 发布清单、灰度发布、回滚方案 |
Meta | using-agent-skills | 元技能:路由到正确的 Skill |
Claude Code 用户(推荐)直接 Marketplace 安装:
/plugin marketplace add addyosmani/agent-skills
/plugin install agent-skills@addy-agent-skills
本地开发方式:
git clone https://github.com/addyosmani/agent-skills.git
claude --plugin-dir /path/to/agent-skills
Gemini CLI 用户:
gemini skills install https://github.com/addyosmani/agent-skills.git --path skills
Cursor 用户直接把 SKILL.md 复制到 .cursor/rules/ 就行。其他工具(Windsurf、Copilot、Kiro、Codex)都有对应的接入文档
其实本质上,Skills 就是纯 Markdown 文件——任何能接受系统提示词或指令文件的 Agent 都能用
每个 Skill 都遵循统一的"解剖结构":
SKILL.md
├── Frontmatter → name + description(Agent 自动发现的触发条件)
├── Overview → 这个 Skill 干什么
├── When to Use → 什么时候该触发
├── Core Process → 一步步怎么做(核心!)
├── Rationalizations → 借口 + 反驳表(防偷懒!)
├── Red Flags → 哪些迹象说明做错了
└── Verification → 退出标准:拿证据说话
四个关键设计决策我给满分:
/build auto —— 一键自动流水线这是个杀手级功能:当 Spec 写好之后,输入 /build auto,Agent 会自动生成计划、逐个任务执行,每个任务依然走 TDD 流程、单独提交。你只需要批准一次计划,后面全自动
去掉的是人在任务之间的"点击下一步",保留的是每个任务内部的验证纪律。在失败或高风险步骤时自动暂停。既快又稳
优点:
局限:
适合谁用:
Agent Skills 解决了 AI 编程领域一个核心矛盾:AI 追求速度,工程追求可靠。通过把高级工程师的工作纪律编码成结构化工作流,它让 AI Agent 在保持速度优势的同时,不再跳过那些"看起来可以省略但实际上不能省"的关键步骤
如果你正在认真用 AI 写生产代码,这个项目值得花时间研究。最少加载三个核心 Skill 就能覆盖最关键的质量缺口:spec-driven-development + test-driven-development + code-review-and-quality