AAIPROS

AIPROS · Static Essay Page

OpenAI最新Codex报告:Agent时代的工作方式变了

技术观察 公众号文章 2026-06-27 6 min

6月25日,OpenAI 最新发布了一份基于 Codex 的智能体应用研究报告,题目是《The Shift to Agentic AI: Evidence from Codex》。

6月25日,OpenAI 最新发布了一份基于 Codex 的智能体应用研究报告,题目是《The Shift to Agentic AI: Evidence from Codex》。

这份报告分析的不是一次产品发布,也不是一组功能更新。它看的是三类人群在真实工作中如何使用 Codex:个人用户、组织用户和 OpenAI 内部员工。

报告里最有价值的结论是: AI 正在从回答问题,转向接管一段工作。

这句话放到企业里很具体。很多团队还在培训员工怎么把 prompt 写漂亮,前沿用户已经开始同时调度多个 Agent,让它们读文件、改东西、生成材料、跑验证、写报告,自己只负责分配任务、检查结果和拍板。

这不是换了一个工具入口。

这是工作方式的代际差距。

一、这份材料最重要的不是 Codex,而是 AI 开始接任务了

过去我们用 AI,最熟悉的是一句话一来一回。

你问一句,它答一句。你改一句,它再答一句。这个模式很像一个聪明助理坐在旁边,随时帮你解释、润色、总结、翻译。

但 Codex 这类 Agent 的变化,是它不只等你追问。你可以直接交给它一件事:看这些资料,按这个目标处理,最后把结果交回来让我审。

这份材料里有一个非常关键的表达:传统聊天界面主要是对话式的,Agentic AI 则让人把多步骤任务委派给系统。这个差别看起来小,落到企业里就是另一套生产关系。

以前一个员工要自己查资料、整理材料、打开系统、改文档、回到群里汇报。现在这段活可以先交给 Agent:你给出目标、边界、资料位置和验收标准,它先跑一版,人再检查和拍板。

企业要抓住的不是 AI 会不会聊天,而是 AI 能不能接走一段可控流程。

二、报告里的数字,说明这种变化已经发生

材料里有几组数字很有冲击力。

2026 年上半年,Codex 周活用户增长超过 5 倍。到 2026 年 6 月 11 日,OpenAI 内部工作场景里,Codex 已经贡献了 Codex 和 ChatGPT 合计输出 token 的 99.8%。组织用户对应比例是 63.3%,个人用户是 16.5%。

这些数字不能简单读成“大家换了一个工具”。更准确的读法是:当用户真的把工作交给 Agent,输出形态会发生迁移。聊天框不再是主入口,任务线程、运行会话、工具调用、产物修改,开始变成新的工作入口。

这和我以前讲“系统 CLI 化”是一回事。企业系统过去等人点按钮,未来要越来越多地开放给 Agent 调用。能查什么、能改什么、失败怎么返回、权限怎么控制,都要变成机器可执行的入口。

一个审批系统,如果只能让人打开页面、看附件、写意见,它就还是传统系统。一个审批系统,如果能让 Agent 在授权范围内读取单据、生成摘要、检查预算、识别风险、写出建议,再把高风险项交给人确认,它才开始进入 Agent 时代。

三、企业现在最大的误区,是把 AI 放在流程旁边

很多公司说自己在做 Agent,其实只是给员工多放了一个聊天入口。

你可以用四句话自测一下:第一种,工作还是靠人推,AI 偶尔帮忙写材料;第二种,人做主,AI 帮忙整理摘要、补字段、查资料;第三种,AI 已经进入流程节点,能先处理一部分材料,再交给人确认;第四种,低风险节点可以自动跑,高风险节点交给人确认,全程留下日志、评测和回放。

现在大部分企业的问题,不是没有上 AI,而是上错了位置。它们把 AI 放在流程旁边,让员工多了一个询问入口,却没有让流程本身多一个执行者。

结果就会变成:人还是要下载附件,人还是要复制字段,人还是要打开三个系统,人还是要写意见。AI 只是帮他写得更快一点。

这当然有价值,但价值不够大。

真正的变化,是把流程节点拆到足够细,然后重新问:这一步由谁先做?AI 自动做、AI 给建议、人确认,还是人兜底?

四、前沿用户已经在做三件事:并行、长跑、复用

这份材料最打动我的,不是用户数增长,而是它观察到的使用深度。

第一,并行。OpenAI 内部用户中,接近 28.6% 的人在观察窗口里曾经同时管理 5 个或更多 Codex Agent。外部组织和个人用户还没这么激进,但趋势已经出现。

这意味着人的工作不再是“我自己一件一件做”。它更像是“我开出一组任务,让几个 Agent 同时跑,等它们交付后我来审”。

第二,长跑。材料显示,OpenAI 内部中位员工在 2026 年 6 月 11 日当天有 2.5 小时的 Codex 任务运行时间,最前沿的 99 分位用户每天累计 Agent 运行时长达到约 71 小时。因为多个 Agent 可以重叠运行,所以一天超过 24 小时并不奇怪。

第三,复用。到 2026 年 6 月 11 日,活跃 Codex 用户里有 26.6% 调用了至少一个 Skill。组织用户是 30.4%,OpenAI 内部则达到 96.2%。

这组数字很关键。它说明真正高阶的 Agent 使用,不是每次重新写一段提示词,而是把流程、标准、工具、经验沉淀成可复用的 Skill。

五、把它放回流程管理:系统 CLI 化、流程 Skill 化、员工 Agent 化

我一直讲一个判断:下一代企业数字化架构,不是把所有系统都换掉,而是让系统、流程和人同时换一种工作方式。

底层是系统 CLI 化。不是让员工继续点页面,而是让系统能力能被安全调用。采购系统能查历史价格,合同系统能取争议条款,审批系统能读单据和附件,项目系统能回写状态。

中层是流程 Skill 化。Skill 不是提示词。Skill 是企业把业务经验变成 AI 可执行资产的方式。一个审批摘要 Skill,应该写清输入边界、处理步骤、判断规则、输出格式、异常处理和评测标准。

上层是员工 Agent 化。这里不是说每个人都变成机器人,而是说人的角色会从亲自执行,迁移到定义任务、分配任务、审查结果、整合产物。

放到采购场景里,变化非常具体。过去是人提需求、人补字段、人查预算、人找供应商、人写审批意见、人追回执。未来应该是 AI 先补齐需求、校验预算、生成审批包、监听供应商回执、准备入库材料,人只在责任、金额、合规和争议点上确认。

这不是单点自动化。

这是流程驱动力变了。

六、最危险的误区:一上来做一个大而全 Agent

很多企业听到 Agent,会本能想做一个“大采购 Agent”“大法务 Agent”“大人力 Agent”。

这个方向听起来兴奋,落地时很容易失控。

因为流程不是一条直线。它里面有低风险的整理动作,有中风险的建议动作,有高风险的责任动作,还有不可判断的例外动作。你把它们全塞给一个 Agent,本质上是在让一个黑箱同时承担信息处理、业务判断和责任决策。

正确做法是先拆 Skill,再组合 Agent。

比如采购流程,可以拆成需求解析 Skill、预算校验 Skill、供应商推荐 Skill、比价分析 Skill、审批摘要 Skill、回执监听 Skill、入库建卡 Skill。再把这些能力交给不同阶段的 Agent 调用。

Agent 是角色,Skill 是能力,平台负责调度。人负责在关键点确认、纠偏和兜底。

不能评测的 Skill,不能进生产流程;不能审计的 Agent,不能接高风险任务。

七、真正的切入点,是选一条流程重新拆

把 Agent 放进企业,不一定从买平台开始,也不一定从做一个大而全的智能体开始。

更稳的切入点,是选一条高频、规则相对清楚、价值能衡量的流程,比如采购、报销、合同评审、客服工单、项目周报。然后不要急着自动化,先把它拆成三张表。

第一张表,叫 As-Is 节点表。它回答的是:现在这条流程到底怎么跑?每一步的输入、输出、角色、系统、耗时和异常是什么?

第二张表,叫 AI To-Be 边界表。它回答的是:哪一步可以让 AI 先做,哪一步只能给建议,哪一步必须人确认,哪一步一定要人兜底?写不出来 AI 先做什么,说明节点还没有拆细。

第三张表,叫 Skill 机会表。它回答的是:哪些节点可以沉淀成可复用能力?每个节点的输入、输出、复用频率、风险等级、评测样本和失败处理是什么?

这三张表的价值,不只是帮助你做一个试点。它会逼着团队把隐性经验说清楚,把责任边界说清楚,把系统能力说清楚。等这些问题清楚了,再决定平台、自建、采购、插件、自动化脚本、流程集成,都会更稳。

所以问题不是“我们要不要买 Agent 平台”。更应该问的是:我们有没有一条流程,已经被拆成 Agent 能接、Skill 能复用、人能确认、结果能评测的颗粒度?

八、人不会退场,人会从执行者变成调度者

到这里,再回头看这份 Codex 材料,它的意义就不只是工具增长,而是组织分工开始变化。

当 AI 从咨询走向委派,组织就不能只统计有多少人用了 AI、发了多少条消息、写了多少提示词。更重要的指标会变成:一个人能委派多复杂的任务,能并行管理多少条工作流,能把多少经验沉淀成 Skill,能不能评测和整合 Agent 的输出。

这会改变人才标准。过去的好员工,是稳定执行、及时汇报、配合流程。未来的强个体,要能定义问题、拆解流程、调用工具、管理 Agent、验证结果、沉淀方法。

这也会改变组织能力。流程负责人不能只会画流程图,要能把节点翻译成 AI 可执行的 Skill;IT 不能只维护系统,要把系统能力开放成安全可调用的入口;业务负责人不能只提需求,要能给出验收标准、风险边界和例外处理。

所以,Agent 时代真正会被重估的,不是某一个工具,而是一套组织能力:流程能拆,Skill 能建,Agent 能编排,评测能闭环,团队能复用。

这份报告给企业的提醒很直接:不要只追问“我们用了多少 AI”,而要追问“AI 已经接走了哪一段活”。前一个问题只能证明你跟上了热闹,后一个问题才会逼近生产方式的变化。

当一个组织能把流程拆清楚,把能力沉淀下来,把人放到判断、调度和整合的位置上,AI 才不再只是外部买来的工具。它会变成组织内部持续改造工作的方式。

九、参考依据

1. OpenAI 研究材料《The Shift to Agentic AI: Evidence from Codex》,分析 Codex 在个人、组织和 OpenAI 内部三类人群中的使用变化。 查看来源

2. OpenAI 文章 How agents are transforming work,对这项研究和可视化结果作了公开介绍。 查看来源

3. McKinsey 关于 AI Agent 的分析指出,Agent 更适合处理输入输出变化较大、需要工具调用和人类反馈的复杂流程。 查看来源

4. IBM 对 AI workflow 和 human-in-the-loop 的解释,强调 AI 可以参与组织流程中的执行、协调和增强活动,人仍要承担监督与关键判断。 AI workflow / Human-in-the-loop