谷歌工程师开源，超强 Skills 让AI编程从原型走向生产级

Ai学习的老章

发布于 2026-06-24 11:11:49

大家好，我是 Ai 学习的老章

你有没有这种感觉——用 AI 写代码速度飞快，但写出来的东西总像"能跑就行"的原型？测试没写、安全没考虑、代码 Review 形同虚设，跟真正上生产的代码差了十万八千里

今天介绍一个让我眼前一亮的项目——Agent Skills，来自 Google Chrome 工程经理 Addy Osmani，5.5 万星，一句话总结：把资深工程师的工作纪律，打包成 AI Agent 可以执行的结构化工作流

简介

Agent Skills 要解决的问题很直接：AI 编程 Agent 默认走最短路径——跳过规格说明、跳过测试、跳过安全审查、跳过代码 Review。这些正好是让软件从"能跑"变成"能用"的关键环节

这个项目把整个软件开发生命周期拆成了 6 个阶段，覆盖了从需求定义到生产部署的完整链路：

DEFINE          PLAN           BUILD          VERIFY         REVIEW          SHIP
┌──────┐      ┌──────┐      ┌──────┐      ┌──────┐      ┌──────┐      ┌──────┐
│ Idea │ ───▶ │ Spec │ ───▶ │ Code │ ───▶ │ Test │ ───▶ │  QA  │ ───▶ │  Go  │
│Refine│      │  PRD │      │ Impl │      │Debug │      │ Gate │      │ Live │
└──────┘      └──────┘      └──────┘      └──────┘      └──────┘      └──────┘
/spec          /plan          /build        /test         /review       /ship

核心功能与特点：

24 个结构化 Skill：不是笼统的 prompt，每个 Skill 都是有步骤、有检查点、有退出标准的完整工作流。从需求访谈（interview-me）到部署上线（shipping-and-launch）全覆盖
反合理化机制（Anti-rationalization）：这是我最欣赏的设计——每个 Skill 都内置了一张"借口 vs 反驳"对照表。Agent 想偷懒说"测试后面再补"？直接被堵死。相当于给 AI 装了个"良心"
7 个斜杠命令：一键触发对应阶段的工作流，/spec 写规格、/plan 拆任务、/build 写代码、/test 跑测试、/review 代码审查、/ship 上线部署
4 个专家人设（Agent Personas）：高级 Staff 工程师做代码审查、QA 专家做测试策略、安全工程师做漏洞扫描、性能工程师做 Web Vitals 审计
兼容几乎所有主流 AI 编程工具：Claude Code（推荐）、Cursor、Gemini CLI、Windsurf、GitHub Copilot、Kiro IDE、Antigravity CLI——只要你的 Agent 能读 Markdown，就能用

为什么这个项目值得关注

说实话，AI 编程领域的 prompt 工程项目我见过太多了，但 Agent Skills 有几个让我觉得"这玩意儿是真懂工程"的地方：

1. 来自 Google 工程文化的硬核实践

这不是拍脑门写的最佳实践。项目明确引用了《Software Engineering at Google》和 Google 工程实践指南里的核心概念：

Hyrum's Law 在 API 设计里
Beyonce Rule 和测试金字塔在测试策略里
Chesterton's Fence 在代码简化里
Trunk-based Development 在 Git 工作流里
Shift Left 和 Feature Flag 在 CI/CD 里

这些不是抽象原则，而是直接嵌在 Agent 的每一步操作中

2. "怀疑驱动开发"——对 AI 自信的纠偏

这是我觉得最有创意的一个 Skill：doubt-driven-development

核心逻辑是：AI 给出的"自信答案"不等于"正确答案"。长时间对话会让假设悄悄变成"事实"。这个 Skill 强制要求在关键决策点召唤一个"对立面审查者"——专门来挑刺的

流程是这样的：

Doubt cycle:
- [ ] Step 1: CLAIM — 写明你的决策 + 为什么重要
- [ ] Step 2: EXTRACT — 剥离推理过程，只留结论
- [ ] Step 3: DOUBT — 召唤全新上下文的审查者，带对抗性提示
- [ ] Step 4: RECONCILE — 逐条核实每个发现
- [ ] Step 5: STOP — 满足终止条件才放行

什么时候用？当决策涉及生产环境、安全逻辑、不可逆操作，或者你对不熟悉的代码"感觉没问题"的时候——恰恰是最需要怀疑的时候

3. Context Engineering——给 Agent "喂"对信息

另一个我特别认同的 Skill。上下文就是 Agent 输出质量的最大杠杆：太少就幻觉，太多就失焦

它设计了一个 5 层上下文层级：

┌─────────────────────────────────────┐
│  1. Rules Files (CLAUDE.md等)       │ ← 始终加载，项目全局
├─────────────────────────────────────┤
│  2. Spec / Architecture Docs        │ ← 按功能/会话加载
├─────────────────────────────────────┤
│  3. Relevant Source Files            │ ← 按任务加载
├─────────────────────────────────────┤
│  4. Error Output / Test Results      │ ← 按迭代加载
├─────────────────────────────────────┤
│  5. Conversation History             │ ← 持续累积、定期压缩
└─────────────────────────────────────┘

最持久的信息放顶层（比如技术栈、代码规范），最临时的放底层（比如报错信息）。这个分层思维，做 AI 编程的都该记住

24 个 Skill 全景图

阶段	Skill	干什么
Define	interview-me	一问一答挖需求，直到 95% 确信才停
Define	idea-refine	发散→收敛，把模糊想法变成具体方案
Define	spec-driven-development	写 PRD，覆盖目标、命令、结构、测试
Plan	planning-and-task-breakdown	把规格拆成小任务，带验收标准和依赖排序
Build	incremental-implementation	薄切片开发：实现→测试→验证→提交
Build	test-driven-development	红→绿→重构，金字塔比例 80/15/5
Build	context-engineering	给 Agent 喂对的信息
Build	source-driven-development	每个决策都要有官方文档出处
Build	doubt-driven-development	对抗性审查：CLAIM→DOUBT→RECONCILE
Build	frontend-ui-engineering	组件架构、设计系统、WCAG 2.1 AA
Build	api-and-interface-design	Contract-first、Hyrum's Law、边界校验
Verify	browser-testing-with-devtools	Chrome DevTools MCP 实时调试
Verify	debugging-and-error-recovery	五步分诊：复现→定位→缩小→修复→防护
Review	code-review-and-quality	五轴审查、~100 行变更、严重级别标签
Review	code-simplification	Chesterton's Fence、Rule of 500
Review	security-and-hardening	OWASP Top 10、密钥管理、三层边界
Review	performance-optimization	先测量再优化、Core Web Vitals
Ship	git-workflow-and-versioning	Trunk-based、原子提交、commit-as-save
Ship	ci-cd-and-automation	Shift Left、Feature Flag、质量门
Ship	deprecation-and-migration	Code-as-liability 思维、僵尸代码清理
Ship	documentation-and-adrs	ADR 架构决策记录、记录"为什么"
Ship	observability-and-instrumentation	结构化日志、RED 指标、OpenTelemetry
Ship	shipping-and-launch	发布清单、灰度发布、回滚方案
Meta	using-agent-skills	元技能：路由到正确的 Skill

安装

Claude Code 用户（推荐）直接 Marketplace 安装：

/plugin marketplace add addyosmani/agent-skills
/plugin install agent-skills@addy-agent-skills

本地开发方式：

git clone https://github.com/addyosmani/agent-skills.git
claude --plugin-dir /path/to/agent-skills

Gemini CLI 用户：

gemini skills install https://github.com/addyosmani/agent-skills.git --path skills

Cursor 用户直接把 SKILL.md 复制到 .cursor/rules/ 就行。其他工具（Windsurf、Copilot、Kiro、Codex）都有对应的接入文档

其实本质上，Skills 就是纯 Markdown 文件——任何能接受系统提示词或指令文件的 Agent 都能用

Skill 的结构设计

每个 Skill 都遵循统一的"解剖结构"：

SKILL.md
├── Frontmatter        → name + description（Agent 自动发现的触发条件）
├── Overview           → 这个 Skill 干什么
├── When to Use        → 什么时候该触发
├── Core Process       → 一步步怎么做（核心！）
├── Rationalizations   → 借口 + 反驳表（防偷懒！）
├── Red Flags          → 哪些迹象说明做错了
└── Verification       → 退出标准：拿证据说话

四个关键设计决策我给满分：

Process not Prose：是流程，不是文档。有步骤、有检查点、有退出标准
Anti-rationalization：每个可能被跳过的步骤都有对应的"防偷懒"条目。这招太聪明了——直接堵死 AI"等会儿再补"的退路
Verification non-negotiable：每个 Skill 最后都要求"用证据说话"。测试通过了？构建成功了？截图呢？"感觉没问题"不算数
Progressive disclosure：SKILL.md 是入口，补充材料按需加载，不浪费 token

`/build auto` —— 一键自动流水线

这是个杀手级功能：当 Spec 写好之后，输入 /build auto，Agent 会自动生成计划、逐个任务执行，每个任务依然走 TDD 流程、单独提交。你只需要批准一次计划，后面全自动

去掉的是人在任务之间的"点击下一步"，保留的是每个任务内部的验证纪律。在失败或高风险步骤时自动暂停。既快又稳

我的看法

优点：

这是目前最系统化的 AI 编程工程规范项目，没有之一
作者 Addy Osmani 在 Google 做了十几年工程，这些 Skill 背后有真实的工程判断
"反合理化表"的设计堪称天才——AI 最大的问题就是太"听话"，给它装个批判性思维模块刚刚好
覆盖全生命周期，从需求到上线一条龙
纯 Markdown 实现，零依赖，任何 Agent 都能用

局限：

24 个 Skill 一次性全加载会占大量上下文窗口，需要按需加载
主要面向 Web 开发场景（前端 + Node.js 后端），其他技术栈可能需要自行扩展
目前英文内容为主，中文开发者需要一定的英文阅读能力
对于快速原型场景可能显得太"重"——不是每个项目都需要走完整套流程

适合谁用：

正在用 AI Agent 做生产级项目的开发者
希望规范化团队 AI 编程实践的技术 Lead
想从"能跑就行"升级到"生产就绪"的个人开发者
对 AI 编程 Skill 设计有兴趣的工程师——想自己写 Skill 的话，这套格式规范可以直接抄

总结

Agent Skills 解决了 AI 编程领域一个核心矛盾：AI 追求速度，工程追求可靠。通过把高级工程师的工作纪律编码成结构化工作流，它让 AI Agent 在保持速度优势的同时，不再跳过那些"看起来可以省略但实际上不能省"的关键步骤

如果你正在认真用 AI 写生产代码，这个项目值得花时间研究。最少加载三个核心 Skill 就能覆盖最关键的质量缺口：spec-driven-development + test-driven-development + code-review-and-quality

本文参与腾讯云自媒体同步曝光计划，分享自微信公众号。

原始发表：2026-06-15，如有侵权请联系 cloudcommunity@tencent.com 删除

原型

本文分享自机器学习与统计学微信公众号，前往查看

如有侵权，请联系 cloudcommunity@tencent.com 删除。

本文参与腾讯云自媒体同步曝光计划，欢迎热爱写作的你一起参与！

登录后参与评论

0 条评论

热度