Mac 版 Codex 更新 Appshots 功能,窗口可直接“喂”给 AI

18 小时前
3 阅读

左右Command键一按,屏幕内容瞬间“喂”给AI

在最新版本的Codex Mac客户端中,OpenAI新增了名为“Appshots”的实用功能。用户只需同时按下键盘上的左Command键和右Command键(该组合键可在设置中自定义),当前活跃的应用程序窗口就会立刻被截屏,并自动发送到Codex的对话界面。这意味着开发者无需手动截图、保存或拖拽文件,一步操作即可将任何窗口内的信息——无论是代码编辑器、设计稿、终端输出还是网页内容——直接作为视觉输入提供给AI模型。

从“看”到“理解”:Appshots如何改变AI交互范式

过去,将屏幕信息传递给AI通常需要繁琐的步骤:要么粘贴图片文件,要么手动描述界面状态。Appshots的巧妙之处在于它打通了系统级截图与AI理解之间的桥梁。当窗口被截取后,Codex内置的视觉模型能够识别截图中的代码、文本、图标甚至布局结构,并据此提供上下文相关的建议。例如,当你发现某段代码报错时,只需按下快捷键,AI就能立刻看到报错信息所在的行号和错误提示,直接给出修复方案,无需再手动复制粘贴错误消息。

灵活自定义:快捷键可随心修改,适配不同工作流

考虑到不同用户的使用习惯,OpenAI为Appshots的触发快捷键提供了完全自定义的能力。在Codex的设置面板中,用户可以任意更改激活截图的热键组合,避免与系统或其他软件的快捷键冲突。无论是习惯于单手操作的开发者,还是需要使用特定键位组合的创意工作者,都能找到最适合自己的触发方式。这种设计体现了对用户工作流深度适配的考量,让功能真正融入日常开发节奏。

不止于写代码:Appshots的实用场景扩展

虽然Codex以代码生成和辅助著称,但Appshots的能力远不止于此。它可以用于:快速捕获设计稿中的UI元素并请求AI生成对应代码;截取网页上的图标或配色方案,请求AI提取视觉风格;甚至可以直接截图包含错误信息的对话框,让AI进行日志分析。对于需要频繁切换多个应用窗口进行开发的程序员,这个功能显著减少了上下文切换的摩擦,让“看到问题-召唤AI-获得答案”的闭环接近于零延迟。

更新背后:OpenAI加速推进桌面端AI Agent能力

Appshots功能的推出,标志着OpenAI在桌面端AI交互体验上的又一次进化。相比传统的文本或文件上传,截图输入提供了一种更直观、更无感的交互方式——用户不需要思考“如何描述当前状况”,AI可以直接“看见”工作现场。这为未来更复杂的AI代理(Agent)能力奠定了基础:当AI能够实时感知屏幕内容,它就有可能主动建议操作、自动化重复步骤,甚至在不打断用户流的情况下从旁协助。Mac版Codex的此次更新,正是朝着这个方向迈出的坚实一步。