OpenAI Codex迎来更新:可排班可断点续跑,还能直接操作Mac应用

核心升级:Mac桌面应用操控能力

本次更新最受关注的亮点之一,是Codex获得了直接操作Mac桌面应用的能力。它现在拥有一个独立的光标,可以自主查看屏幕内容、点击界面元素、输入文字,完全无需人工干预。这一功能特别适合用于自动化测试和前端界面的快速迭代。开发者只需设定好任务,Codex便可独立运行,模拟用户行为完成操作。

  • 自动化测试:Codex能够模拟用户在桌面应用上的操作,进行功能测试和UI验证。
  • 界面迭代:在用户界面开发中,可自动执行点击、输入等操作,提升前端开发效率。
  • 独立运行:多个智能体可并行操作,互不干扰,不影响用户正常使用电脑。

多智能体并行与任务记忆功能

此次更新还引入了多智能体并行运行机制,开发者可以在不同的项目中同时管理多个AI代理,每个代理都能独立完成任务。任务之间不会互相干扰,用户也无需频繁切换窗口或上下文,大幅提升开发效率。

此外,Codex新增了记忆功能,能够保存用户的偏好、常用工作流和技术栈信息。当任务暂停后,Codex可通过现有对话线程无缝恢复进度。它还能自主调度未来数天甚至数周的工作计划,并结合项目上下文和已连接插件主动提出推进任务的建议。

  • 多AI代理并行操作
  • 任务进度可恢复,支持长期运行
  • 自主任务调度与上下文感知建议

浏览器与图像生成能力强化

Codex的应用内浏览器也得到了升级。用户现在可以直接在网页上添加批注,为智能体提供更精确的执行指令。据OpenAI透露,完整的浏览器操控能力正在开发中,未来Codex将能够自主打开网站、执行用户指定的操作流程,并通过截图验证结果。

在图像生成方面,Codex集成了gpt-image-1.5模型,可用于生成产品概念图和界面原型。这一集成大大增强了AI在设计阶段的辅助能力,使得从代码到视觉呈现的全流程自动化成为可能。

  • 浏览器内添加批注功能
  • 即将支持自主执行网页任务
  • 使用gpt-image-1.5生成设计原型

文件预览与插件生态扩展

Codex在文件处理方面也更加便捷。侧边栏现在支持直接预览PDF和电子表格等文档,用户无需切换应用即可查看相关内容。

与此同时,插件生态大幅扩充,新增超过90款插件。这些插件涵盖技能组合、应用集成与MCP服务器接入,进一步拓宽了Codex的上下文获取与任务执行边界。插件的引入使得Codex在不同开发场景下更加灵活,可以无缝对接各类外部工具。

  • PDF和电子表格文件直接预览
  • 插件生态新增90+项
  • 支持技能组合与MCP服务器接入

行业影响与未来展望

此次更新让Codex从单纯的编程助手向“超级应用”迈进了一大步。它不再只是辅助写代码的工具,而是能主动调度任务、操作电脑、生成图像、处理文件的全能型AI工作伙伴。这一升级也加剧了AI编程助手之间的竞争,Anthropic的Claude Code和微博的Kimi Claw也在近期推出了类似的功能。

OpenAI此次更新不仅提升了开发者的工作效率,也预示着未来AI在桌面操作、自动化流程与跨平台协作方面将扮演更重要的角色。随着更多功能的落地,Codex或将彻底改变人们与电脑协作的方式。

  • AI助手竞争加剧,行业加速进入“智能办公”时代
  • Codex正在向“超级应用”靠拢
  • 未来将进一步实现跨平台自动化协作