咨询交付进入控制面时代：Agent 上生产先交三张票

我最近最想劝企业的一句话是：别急着讨论“要不要上智能体平台”，先把“能不能追责、能不能回退、能不能审计”讲清楚。

因为一旦把 Agent 放进真实流程，三件事会立刻把你从 Demo 拉回生产：

1）系统会挂、接口会抖；2）数据会脏、上下文会缺；3）出了事一定有人问：它凭什么这么做？谁批准的？怎么回滚？

这时你会发现，真正的门槛从来不是“模型够不够聪明”。

门槛是：你有没有一套让 Agent 可控、可查、可退的“流程控制面”。

一个产业信号：咨询交付在往“控制面工程”迁移

按北京时间 2026 年 05 月 31 日（00:00-23:59）的资讯窗口看，一个方向越来越清楚：

大家讨论的重心，正在从“Agent 更聪明”转向 governance、 orchestration、 policy、 audit 这些更“难听”的词。

它听起来不性感，但它才是落地的门槛： Agent 不可控，就进不了流程；进不了流程，就谈不上交付。

很多团队把“编排”当控制面。

但我更愿意把控制面拆成三张可验收的“票”，你拿不出来，就不要让 Agent 动真系统：

① 身份与权限（Identity / Policy）

它是以谁的身份在做事？哪些字段能读、哪些不能读？哪些动作能做、哪些必须二次确认？谁能授权、谁能追溯？

② 证据链（Audit / Replay）

它当时拿到了哪些输入快照？调用了哪些工具/接口？做了哪些关键判断？产物落在哪里？谁验收？如何复盘？

③ 失败路径（Failover / Fallback）

当模型不可用、工具超时、数据缺失时，它怎么降级？回到哪个人工节点？怎么保底交付“最小可用产物”？

我在本机资料里反复看到一个观点（我非常认同）：企业真正要的不是“多一个会说话的助手”，而是“多一段能跑起来、能验收的能力”。

翻译成人话就是：把能力写成 Skill，把执行交给“运行时”，把结果落到可交付物上。

别把 Skill 当 Prompt。

Skill 是一段可复用、可测量、可追溯的工作能力；它应该有输入、规则、动作、产物、验收与失败兜底。

我用一个很粗糙但很管用的分层，帮你定位自己现在到底“卡在哪”。

注意：这不是技术成熟度，是交付成熟度。

L0：PPT 阶段

讲愿景、讲路线图、讲平台，落不到任何一个可验收产物。

L1：聊天框阶段

回答不错，但不进系统、不动数据、不产出文件；交付仍然靠人复制粘贴。

L2：工具调用阶段

能调 API、能跑几步任务，但没有证据链、没有失败兜底，出事就靠人擦屁股。

L3：流程闭环阶段（推荐目标）

有控制面：身份权限、证据链、失败路径齐全；能产出结构化交付物并验收。

L4：可运营能力阶段

能度量、能复盘、能持续迭代；把 Agent 当成“流程能力资产”运营，而不是一次性项目。

如果你今天就要动手，我建议从这四步开始（顺序别反）：

我见过太多项目，平台建得很漂亮，Agent 名字起得很响亮。

但一问：产物在哪里？验收标准是什么？失败怎么兜底？日志怎么复盘？权限谁签字？——现场就沉默了。

如果你只记住今天一件事：控制面三张票拿不出来，Agent 先别上生产。

1）IBM / IBM Consulting：围绕 agentic 平台与企业治理/编排能力的公开信息

2）AWS：企业侧落地 GenAI/Agent 的平台化交付线索（含与 OpenAI 的合作内容）

3）Docusign：面向合同流程的 AI 能力/Agent 化产品线索（从“写文书”走向“跑流程”）

4）Dell × OpenAI：围绕企业落地与开发者生产力（含 Codex/agentic）相关的公开线索