OpenAI彻底重构Codex,长出独立鼠标,自己排班狂卷打工人
今天,OpenAI发布了对Codex的重大重构,其功能已经远超传统意义上的代码生成工具。现在的Codex不仅能理解用户的指令,还能自主“看”屏幕内容,操控鼠标、键盘,并记住用户的使用习惯,甚至可以在后台自动运行多个AI Agent协同工作,而用户的鼠标和键盘操作完全不受干扰。
技术突破:Codex的新能力
重构后的Codex具备了以下核心能力:
- 屏幕观察与操作:Codex可以实时观察用户屏幕内容,并进行独立操作,例如点击按钮、运行程序、调试代码等。
- 用户习惯记忆:通过分析用户的使用历史,Codex能够记住用户的行为偏好,并据此优化后续的操作。
- 自主排班:Codex可以自己规划任务日程,合理安排不同AI Agent的工作时间,实现高效运作。
- 多Agent协同:后台运行的多个AI Agent能够分工协作,完成复杂的任务链,比如开发、测试、修复一体化流程。
典型应用场景
根据最新演示,Codex已经能够独立完成一系列复杂的任务:

-
用户只需发出简单指令,如「在Xcode里运行这个井字棋App,自己玩一局测试它,修复你发现的bug」,Codex便会自动执行以下步骤:
- 启动Xcode并加载项目
- 模拟用户操作运行App
- 以AI Agent身份进行游戏测试
- 分析运行日志并定位潜在bug
- 自动生成修复代码并验证
-
Codex还能在系统中运行多个任务,例如:
- 一个Agent负责监控邮件并分类
- 另一个Agent负责整理文档并生成摘要
- 第三个Agent可以进行网页自动化测试
这些任务可以并行执行,互不干扰。
对工作方式的冲击
Codex的这一系列升级,直接冲击了传统的人机协作模式:
- 效率飞跃:原本需要多个程序员配合完成的任务,现在Codex可在后台自动完成。
- 工作替代风险:一些重复性、机械性的工作岗位可能被Codex及其Agent取代,尤其是在软件测试、初级代码维护等领域。
- 打工人“被卷”危机:AI不仅能完成任务,还能自己给自己“排班”,实现全天候工作,进一步加剧了人类打工人在职场中的压力。
许多开发者开始担忧,Codex的“狂卷”行为是否会成为未来AI取代人力的一个缩影。
行业反应与未来展望
重构后的Codex引发了技术圈的广泛讨论:
-
积极评价:
- 认为这是迈向真正“自主AI助手”的关键一步
- 可大幅提升开发效率,降低人为错误
- 有助于解决技术人才短缺的问题
-
担忧声音:
- 对数据隐私和系统安全提出质疑
- 担心AI自主操作可能导致误操作或权限滥用
- 人类开发者是否会被边缘化?
未来,OpenAI可能会进一步将Codex的能力扩展到更多操作系统和开发平台,甚至集成进日常办公工具中,形成真正的“AI同事”。
结语
Codex的这次重构,标志着AI开始真正从“工具”向“协作者”甚至“替代者”转变。它不仅能生成代码,还能像人类一样“看”屏幕、“动”鼠标、“做”任务、“排”日程。这或许只是AI代理(Agent)技术爆发的开端,而我们打工人,是否准备好迎接这个“狂卷”的新同事了?