Agent 上岗以后，谁来管权限、审计和编制？

曹犟

发布于 2026-06-24 13:35:11

你好，我是曹犟。

在最强模型 Fable 5，开始不让你随便用了里，我讲了模型厂商怎么对用户分级：安全分类器、明确的转接开关、强制 30 天数据留存。结尾我也说：等企业里真的跑起来几十个 Agent，你也会对它们做类似的事：分权限、留日志、设降级、定责任。到那一天，你就变成了自己公司里的 Anthropic。

今天把这个判断展开：当 Agent 真的上岗，谁来管它们的权限、审计和编制。

一、讨论的重心，正在从能力转向治理

去年大家聊 Agent，问的基本是：它能不能干活。今年的问题明显变了：它能不能稳定干活，能不能被管住。我自己的感受一样：去年同行和客户问我的多半是“你们用的什么模型”，最近半年，问得越来越多的是“你们怎么管控它”。

最近有两个案例很说明问题。Microsoft 去年 11 月发布了 Agent 365，今年 5 月正式商用，官方定位就叫“The Control Plane for Agents”：企业里所有 Agent 进入统一注册表，每个 Agent 分配一个唯一身份，管理员能看到它们的活动和健康状况，连员工私装在电脑上的“影子 Agent”也会被发现并纳管。

Pinterest 则在今年 3 月公开了内部的 MCP 生态：统一注册中心，两层鉴权（用户身份加服务身份），敏感数据系统按业务组开权限，所有调用全量留日志，每个月跑 6.6 万次调用。

再加上 Anthropic：给最强模型配分类器、强制留存日志、把转接开关写进 API。三家做的其实是同一件事，只是定位不同：Anthropic 管自家的模型，Microsoft 和 Pinterest 管自家的 Agent。

而这些动作和模型能力关系并不大，全是管理动作：注册、身份、权限、日志。当大公司开始认真做这些“无聊”的事情，说明 Agent 正在从个人外挂变成企业资产。个人好用和企业可用，是两个完全不同的问题。

二、企业为什么不会让 Agent 野蛮生长

设想一个不远的场景：你的团队里有 10 个正式员工，还有 30 个数字同事。它们能写报告、查数据、改页面、发邮件、跟进任务。到这一步，作为团队管理者，你最关心的早就不是它们聪不聪明，而是五个更具体的问题。

• 权限：它能访问哪些系统，能执行哪些动作？查数据可以，那删数据呢？

• 审计：它做了什么，基于什么上下文做的，谁批准它做的？

• 成本：它调了多少工具、花了多少 token？这个任务交给它，到底值不值？

• 责任：错发邮件、误删数据、越权操作，责任算谁的？

• 协作：30 个 Agent 之间怎么分工？怎么避免重复劳动，甚至互相打架？

举一个最容易出事的例子：某个 Agent 给客户错发了一封带错误报价的邮件。事后复盘才发现，它有权发邮件，是三个月前某次配置留下的；它引用的价格表，是一份早就过期的文档；中间没有任何人批准过这个动作。每一个环节单独看都不算离谱，连起来就是一次客户事故，而你根本说不清该追责谁、该改哪里。

过去企业主要治理两类对象：员工，靠 HR、编制和绩效；软件，靠账号、权限和 API Key。现在出现了第三类对象：Agent，也就是数字劳动力。它像员工一样会自主行动，又像软件一样可以无限复制，过往的老办法都不完全适用。

可能还有一个更别扭的问题：编制。Agent 不占 headcount，但占预算；不发工资，但花 token；不算人力，却实实在在承担着原来某个岗位的工作量。部门扩张时，要不要为 Agent 申请“数字编制”？财务上要把它记作人力成本还是软件成本？绩效考核要不要把“人加 Agent”当成一个整体来看？这些问题今天听起来还有点早，但预算审批迟早会逼着每家公司给出答案。

三、Agent Control Plane：数字劳动力的中控台

这套东西，行业里已经有了名字，叫 Agent Control Plane。

它可以拆成六个部分来理解：

1. 身份体系：这个 Agent 到底代表谁在行动。Microsoft 的做法很直接，每个 Agent 发唯一 ID，像员工工号一样管理。

2. 权限体系：它能读什么、写什么、调用什么工具。

3. 上下文体系：它能拿到哪些文档、知识和历史记录。这一条最容易被低估，上下文给得越全，Agent 越好用，但泄露和误用的口子也越多，本质上是数据权限的延伸。

4. 执行体系：什么时候触发、跑多久、失败了怎么重试。

5. 审计体系：全链路日志，能回放，能归因。

6. 成本体系：预算、配额、单位任务成本。

简单说，Agent Control Plane 就是企业管理数字劳动力的中控台。

对照人类员工的管理体系看会更直观。员工有 HR 系统管身份和编制，有权限系统管账号，有 OA 管审批，有财务管预算。Control Plane 本质上是把这一整套给数字员工重建一遍。

但有一个根本的不同。管员工的体系，建立在人会自我约束的前提上：员工有职业声誉，有劳动合同，有法律法规约束，知道哪些事不能做。Agent 没有这些，它不会害怕，不懂得承担责任。所有约束都必须外置，变成系统里的硬规则。这也是为什么 Control Plane 只能是一套工程系统，而不是一份规章制度。

我们自己的实践也是如此：Omni-Growth 的投放 Agent 动的是客户真金白银的广告预算，所以从第一天起，我们就给它配了预算上限、动作白名单、全量操作日志和回滚机制；调价、扩预算这类高风险动作，都需要人工确认；客户用自然语言提出探索性问题时，也要严格控制 Agent 能看到的上下文，避免信息泄露。这和上篇里 Anthropic 给 Fable 5 设计的“高风险请求拦截”是同一个思路，只是规模小了几个数量级。我们内部还有一条原则：一次任务失败后，要能回答“这是谁的问题”。没有这套中控台，这个问题根本答不出来。

四、治理能力会是 To B 软件的下一道护城河

站在 To B 软件从业者的角度，这件事还有另一层含义。

过去企业软件比的是功能多不多，这两年比的是接入的模型强不强。再往后，比的可能是第三件事：谁能让 Agent 以安全、稳定、算得清楚的方式进入企业的真实生产流程。

具体要看三件事：接入深度，看你连着企业多少真实系统和业务流程；治理能力，看权限、审计、审批、可观测性这套东西做得是否扎实；结果责任，看你敢不敢对 Agent 干出来的活负责，而不是只交付一次回答。

神策做了十一年数据基础设施，我对“长在流程里”这件事体感很深。最开始客户选分析工具，比的是图表漂不漂亮、功能全不全；用上几年后才发现，真正难换的从来不是界面，而是埋点体系、数据模型和已经跑顺的业务流程。Agent 时代极有可能重演这一幕：模型本身会越来越像水电，谁家都买得到，价格还在跌；但中控台长在企业的流程、权限和数据体系里，换掉的成本极高。功能可以抄，模型可以换，扎进流程里的治理体系，才是真正的卡位。

这和我之前写 RaaS（按结果付费）时的判断是同一条线：你能管住 Agent 的全过程，才敢按它的结果收费。治理能力不只是合规要求，它是按效果付费这种商业模式的前提。

五、先把底座补齐，再谈全员配 Agent

回到具体的落地路径。我觉得实际路径会很现实：大厂从低风险、高重复的辅助流程开始；中型企业更可能从单点岗位切入，比如运营、销售支持、知识管理。知识管理往往是最好的起点，风险低、数据边界清晰、出错有人兜底，跑顺了再往核心业务迁移。

选择什么模型，算不上真正的难点。难的是三个更基础的问题：内部系统是否足够标准化？权限边界是否清晰？流程能不能拆解成可验收的环节？很多企业今天最缺的不是 Agent，而是能让 Agent 接得进去、管得起来、算得清楚的数字化底座。

如果你是管理者，有五件事现在就可以做。

1. 盘点工作：哪些岗位的工作高重复、低风险、结果可验收，适合先交给 Agent。

2. 梳理权限：把关键系统的访问边界画清楚，别让 Agent 直接继承某个员工的全部权限。

3. 结构化沉淀：把 SOP、知识库和审批链条整理成 Agent 读得懂的形式。这一步最累，但也最值钱。

4. 建立兜底机制：日志、验收、回滚三件套先搭起来，再让 Agent 碰真实业务。

5. 小范围试点：在少数关键场景做出可复制的样板，别急着全员配发。

未来管理者要管的，不再只是人和软件，还会多出一种介于二者之间的对象：可执行、可调度、可审计、可扩展的数字劳动力。

如果你的团队明天就多出 20 个 24 小时在线的 Agent，你最先想管的，是它们的能力，还是它们的权限？欢迎在评论区聊聊，个人观点，仅供参考