OpenAI最新Codex报告：Agent时代的工作方式变了

6月25日，OpenAI 最新发布了一份基于 Codex 的智能体应用研究报告，题目是《The Shift to Agentic AI: Evidence from Codex》。

这份报告分析的不是一次产品发布，也不是一组功能更新。它看的是三类人群在真实工作中如何使用 Codex：个人用户、组织用户和 OpenAI 内部员工。

报告里最有价值的结论是： AI 正在从回答问题，转向接管一段工作。

这句话放到企业里很具体。很多团队还在培训员工怎么把 prompt 写漂亮，前沿用户已经开始同时调度多个 Agent，让它们读文件、改东西、生成材料、跑验证、写报告，自己只负责分配任务、检查结果和拍板。

这不是换了一个工具入口。

这是工作方式的代际差距。

一、这份材料最重要的不是 Codex，而是 AI 开始接任务了

过去我们用 AI，最熟悉的是一句话一来一回。

你问一句，它答一句。你改一句，它再答一句。这个模式很像一个聪明助理坐在旁边，随时帮你解释、润色、总结、翻译。

但 Codex 这类 Agent 的变化，是它不只等你追问。你可以直接交给它一件事：看这些资料，按这个目标处理，最后把结果交回来让我审。

这份材料里有一个非常关键的表达：传统聊天界面主要是对话式的，Agentic AI 则让人把多步骤任务委派给系统。这个差别看起来小，落到企业里就是另一套生产关系。

以前一个员工要自己查资料、整理材料、打开系统、改文档、回到群里汇报。现在这段活可以先交给 Agent：你给出目标、边界、资料位置和验收标准，它先跑一版，人再检查和拍板。

企业要抓住的不是 AI 会不会聊天，而是 AI 能不能接走一段可控流程。

二、报告里的数字，说明这种变化已经发生

材料里有几组数字很有冲击力。

2026 年上半年，Codex 周活用户增长超过 5 倍。到 2026 年 6 月 11 日，OpenAI 内部工作场景里，Codex 已经贡献了 Codex 和 ChatGPT 合计输出 token 的 99.8%。组织用户对应比例是 63.3%，个人用户是 16.5%。

这些数字不能简单读成“大家换了一个工具”。更准确的读法是：当用户真的把工作交给 Agent，输出形态会发生迁移。聊天框不再是主入口，任务线程、运行会话、工具调用、产物修改，开始变成新的工作入口。

这和我以前讲“系统 CLI 化”是一回事。企业系统过去等人点按钮，未来要越来越多地开放给 Agent 调用。能查什么、能改什么、失败怎么返回、权限怎么控制，都要变成机器可执行的入口。

一个审批系统，如果只能让人打开页面、看附件、写意见，它就还是传统系统。一个审批系统，如果能让 Agent 在授权范围内读取单据、生成摘要、检查预算、识别风险、写出建议，再把高风险项交给人确认，它才开始进入 Agent 时代。

三、企业现在最大的误区，是把 AI 放在流程旁边

很多公司说自己在做 Agent，其实只是给员工多放了一个聊天入口。

你可以用四句话自测一下：第一种，工作还是靠人推，AI 偶尔帮忙写材料；第二种，人做主，AI 帮忙整理摘要、补字段、查资料；第三种，AI 已经进入流程节点，能先处理一部分材料，再交给人确认；第四种，低风险节点可以自动跑，高风险节点交给人确认，全程留下日志、评测和回放。

现在大部分企业的问题，不是没有上 AI，而是上错了位置。它们把 AI 放在流程旁边，让员工多了一个询问入口，却没有让流程本身多一个执行者。

结果就会变成：人还是要下载附件，人还是要复制字段，人还是要打开三个系统，人还是要写意见。AI 只是帮他写得更快一点。

这当然有价值，但价值不够大。

真正的变化，是把流程节点拆到足够细，然后重新问：这一步由谁先做？AI 自动做、AI 给建议、人确认，还是人兜底？

四、前沿用户已经在做三件事：并行、长跑、复用

这份材料最打动我的，不是用户数增长，而是它观察到的使用深度。

第一，并行。OpenAI 内部用户中，接近 28.6% 的人在观察窗口里曾经同时管理 5 个或更多 Codex Agent。外部组织和个人用户还没这么激进，但趋势已经出现。

这意味着人的工作不再是“我自己一件一件做”。它更像是“我开出一组任务，让几个 Agent 同时跑，等它们交付后我来审”。

第二，长跑。材料显示，OpenAI 内部中位员工在 2026 年 6 月 11 日当天有 2.5 小时的 Codex 任务运行时间，最前沿的 99 分位用户每天累计 Agent 运行时长达到约 71 小时。因为多个 Agent 可以重叠运行，所以一天超过 24 小时并不奇怪。

第三，复用。到 2026 年 6 月 11 日，活跃 Codex 用户里有 26.6% 调用了至少一个 Skill。组织用户是 30.4%，OpenAI 内部则达到 96.2%。

这组数字很关键。它说明真正高阶的 Agent 使用，不是每次重新写一段提示词，而是把流程、标准、工具、经验沉淀成可复用的 Skill。

五、把它放回流程管理：系统 CLI 化、流程 Skill 化、员工 Agent 化

我一直讲一个判断：下一代企业数字化架构，不是把所有系统都换掉，而是让系统、流程和人同时换一种工作方式。

底层是系统 CLI 化。不是让员工继续点页面，而是让系统能力能被安全调用。采购系统能查历史价格，合同系统能取争议条款，审批系统能读单据和附件，项目系统能回写状态。

中层是流程 Skill 化。Skill 不是提示词。Skill 是企业把业务经验变成 AI 可执行资产的方式。一个审批摘要 Skill，应该写清输入边界、处理步骤、判断规则、输出格式、异常处理和评测标准。

上层是员工 Agent 化。这里不是说每个人都变成机器人，而是说人的角色会从亲自执行，迁移到定义任务、分配任务、审查结果、整合产物。

放到采购场景里，变化非常具体。过去是人提需求、人补字段、人查预算、人找供应商、人写审批意见、人追回执。未来应该是 AI 先补齐需求、校验预算、生成审批包、监听供应商回执、准备入库材料，人只在责任、金额、合规和争议点上确认。

这不是单点自动化。

这是流程驱动力变了。

六、最危险的误区：一上来做一个大而全 Agent

很多企业听到 Agent，会本能想做一个“大采购 Agent”“大法务 Agent”“大人力 Agent”。

这个方向听起来兴奋，落地时很容易失控。

因为流程不是一条直线。它里面有低风险的整理动作，有中风险的建议动作，有高风险的责任动作，还有不可判断的例外动作。你把它们全塞给一个 Agent，本质上是在让一个黑箱同时承担信息处理、业务判断和责任决策。

正确做法是先拆 Skill，再组合 Agent。

比如采购流程，可以拆成需求解析 Skill、预算校验 Skill、供应商推荐 Skill、比价分析 Skill、审批摘要 Skill、回执监听 Skill、入库建卡 Skill。再把这些能力交给不同阶段的 Agent 调用。

Agent 是角色，Skill 是能力，平台负责调度。人负责在关键点确认、纠偏和兜底。

不能评测的 Skill，不能进生产流程；不能审计的 Agent，不能接高风险任务。

七、真正的切入点，是选一条流程重新拆

把 Agent 放进企业，不一定从买平台开始，也不一定从做一个大而全的智能体开始。

更稳的切入点，是选一条高频、规则相对清楚、价值能衡量的流程，比如采购、报销、合同评审、客服工单、项目周报。然后不要急着自动化，先把它拆成三张表。

第一张表，叫 As-Is 节点表。它回答的是：现在这条流程到底怎么跑？每一步的输入、输出、角色、系统、耗时和异常是什么？

第二张表，叫 AI To-Be 边界表。它回答的是：哪一步可以让 AI 先做，哪一步只能给建议，哪一步必须人确认，哪一步一定要人兜底？写不出来 AI 先做什么，说明节点还没有拆细。

第三张表，叫 Skill 机会表。它回答的是：哪些节点可以沉淀成可复用能力？每个节点的输入、输出、复用频率、风险等级、评测样本和失败处理是什么？

这三张表的价值，不只是帮助你做一个试点。它会逼着团队把隐性经验说清楚，把责任边界说清楚，把系统能力说清楚。等这些问题清楚了，再决定平台、自建、采购、插件、自动化脚本、流程集成，都会更稳。

所以问题不是“我们要不要买 Agent 平台”。更应该问的是：我们有没有一条流程，已经被拆成 Agent 能接、Skill 能复用、人能确认、结果能评测的颗粒度？

八、人不会退场，人会从执行者变成调度者

到这里，再回头看这份 Codex 材料，它的意义就不只是工具增长，而是组织分工开始变化。

当 AI 从咨询走向委派，组织就不能只统计有多少人用了 AI、发了多少条消息、写了多少提示词。更重要的指标会变成：一个人能委派多复杂的任务，能并行管理多少条工作流，能把多少经验沉淀成 Skill，能不能评测和整合 Agent 的输出。

这会改变人才标准。过去的好员工，是稳定执行、及时汇报、配合流程。未来的强个体，要能定义问题、拆解流程、调用工具、管理 Agent、验证结果、沉淀方法。

这也会改变组织能力。流程负责人不能只会画流程图，要能把节点翻译成 AI 可执行的 Skill；IT 不能只维护系统，要把系统能力开放成安全可调用的入口；业务负责人不能只提需求，要能给出验收标准、风险边界和例外处理。

所以，Agent 时代真正会被重估的，不是某一个工具，而是一套组织能力：流程能拆，Skill 能建，Agent 能编排，评测能闭环，团队能复用。

这份报告给企业的提醒很直接：不要只追问“我们用了多少 AI”，而要追问“AI 已经接走了哪一段活”。前一个问题只能证明你跟上了热闹，后一个问题才会逼近生产方式的变化。

当一个组织能把流程拆清楚，把能力沉淀下来，把人放到判断、调度和整合的位置上，AI 才不再只是外部买来的工具。它会变成组织内部持续改造工作的方式。

九、参考依据

1. OpenAI 研究材料《The Shift to Agentic AI: Evidence from Codex》，分析 Codex 在个人、组织和 OpenAI 内部三类人群中的使用变化。查看来源

2. OpenAI 文章 How agents are transforming work，对这项研究和可视化结果作了公开介绍。查看来源

3. McKinsey 关于 AI Agent 的分析指出，Agent 更适合处理输入输出变化较大、需要工具调用和人类反馈的复杂流程。查看来源

4. IBM 对 AI workflow 和 human-in-the-loop 的解释，强调 AI 可以参与组织流程中的执行、协调和增强活动，人仍要承担监督与关键判断。 AI workflow / Human-in-the-loop