浏览器原地变龙虾!Chrome上线Skills,技能一键复用帮你干活
摘要:Chrome 推出全新 Skills 功能,将 AI 技能整合进浏览器,实现自动化操作,大幅提升用户效率。
背景
在 AI 技术迅速发展的背景下,浏览器的功能也逐步从单纯的网页访问工具扩展为智能化助手。近日,谷歌在 Chrome 浏览器中上线了 Skills 功能,允许用户将 AI 技能直接集成到浏览器环境中,实现一键复用。这一功能与 OpenClaw 等自动化工具结合,使得浏览器不仅能执行常规操作,还能通过结构化命令实现远程调试和自动化任务,从而提升工作效率。
Chrome Skills 功能详情
Chrome 的 Skills 功能让用户能够通过简单的命令操作浏览器,例如填写表单、点击元素、滚动页面、上传文件等。以下是一些常见命令示例:
agent-browser open https://example.com(打开网页)agent-browser fill @e2 "输入内容"(清空并输入内容)agent-browser click @e1(点击特定元素)agent-browser scroll down 500(向下滚动页面)agent-browser upload @e1 file.pdf(上传文件)

这些命令允许 AI 助手通过脚本方式控制浏览器,实现复杂的网页交互任务。用户无需手动重复操作,从而节省时间。此外,Chrome 还支持将页面保存为 PDF 或截图,进一步扩展了其自动化能力。
Agent Browser 工具与 OpenClaw 集成
Agent Browser 是一个基于 Rust 开发的无头浏览器自动化 CLI 工具,同时也支持 Node.js 回退。它与 OpenClaw 集成后,AI 助手能够远程调试和控制浏览器。安装方法也非常简便:
- 将 Skill 文件复制到 OpenClaw 工作目录:
cp -r ~/.openclaw/workspace/skills/self-improving-agent/hooks/openclaw ~/.openclaw/hooks/self-improvement - 启用 Hook 功能,以提升 Skill 使用体验。
结合 Chrome 的 Skills 功能,用户可以通过 OpenClaw 接管 Chrome 浏览器,实现自动登录、表单填写等重复性任务,极大提升了浏览器的智能化水平。
技能复用与效率提升
Skills 功能的核心优势在于技能的一键复用,即用户保存的技能可以直接调用,无需重复设置。例如,在 Gemini 聊天框中输入斜杠(/)或点击加号按钮,即可选择已保存的技能并执行。
这种模式不仅适用于简单的网页操作,还可以通过结构化命令构建复杂的工作流。比如:
- 获取特定元素的文本或输入值:
agent-browser get text @e1
agent-browser get value @e1 - 保存页面为 PDF 或截图:
agent-browser pdf output.pdf
agent-browser screenshot path.png
这些操作让浏览器在执行任务时更加灵活,用户只需设置一次,后续即可一键完成,实现真正的自动化操作。
影响与未来展望
Chrome 推出 Skills 功能标志着浏览器正在从工具向智能助手转变。这一变化不仅提升了用户的操作效率,还为 AI 与浏览器的深度融合提供了可能。通过 OpenClaw 等工具,用户可以进一步拓展 Skills 的应用场景,如自动化测试、网页爬取和任务调度。
未来,随着 AI 技术的发展,浏览器的技能复用功能将变得更加智能。用户有望通过语音指令或自然语言与浏览器互动,甚至实现自动化的跨平台任务执行。Chrome 的 Skills 功能正在引领浏览器智能化的新时代。