浏览器原地变龙虾!Chrome上线Skills,技能一键复用帮你干活

摘要:Chrome 推出全新 Skills 功能,将 AI 技能整合进浏览器,实现自动化操作,大幅提升用户效率。

背景

在 AI 技术迅速发展的背景下,浏览器的功能也逐步从单纯的网页访问工具扩展为智能化助手。近日,谷歌在 Chrome 浏览器中上线了 Skills 功能,允许用户将 AI 技能直接集成到浏览器环境中,实现一键复用。这一功能与 OpenClaw 等自动化工具结合,使得浏览器不仅能执行常规操作,还能通过结构化命令实现远程调试和自动化任务,从而提升工作效率。

Chrome Skills 功能详情

Chrome 的 Skills 功能让用户能够通过简单的命令操作浏览器,例如填写表单、点击元素、滚动页面、上传文件等。以下是一些常见命令示例:

  • agent-browser open https://example.com(打开网页)
  • agent-browser fill @e2 "输入内容"(清空并输入内容)
  • agent-browser click @e1(点击特定元素)
  • agent-browser scroll down 500(向下滚动页面)
  • agent-browser upload @e1 file.pdf(上传文件)

浏览器原地变龙虾!Chrome上线Skills,技能一键复用帮你干活

这些命令允许 AI 助手通过脚本方式控制浏览器,实现复杂的网页交互任务。用户无需手动重复操作,从而节省时间。此外,Chrome 还支持将页面保存为 PDF 或截图,进一步扩展了其自动化能力。

Agent Browser 工具与 OpenClaw 集成

Agent Browser 是一个基于 Rust 开发的无头浏览器自动化 CLI 工具,同时也支持 Node.js 回退。它与 OpenClaw 集成后,AI 助手能够远程调试和控制浏览器。安装方法也非常简便:

  1. 将 Skill 文件复制到 OpenClaw 工作目录:
    cp -r ~/.openclaw/workspace/skills/self-improving-agent/hooks/openclaw ~/.openclaw/hooks/self-improvement
  2. 启用 Hook 功能,以提升 Skill 使用体验。

结合 Chrome 的 Skills 功能,用户可以通过 OpenClaw 接管 Chrome 浏览器,实现自动登录、表单填写等重复性任务,极大提升了浏览器的智能化水平。

技能复用与效率提升

Skills 功能的核心优势在于技能的一键复用,即用户保存的技能可以直接调用,无需重复设置。例如,在 Gemini 聊天框中输入斜杠(/)或点击加号按钮,即可选择已保存的技能并执行。

这种模式不仅适用于简单的网页操作,还可以通过结构化命令构建复杂的工作流。比如:

  • 获取特定元素的文本或输入值:
    agent-browser get text @e1
    agent-browser get value @e1
  • 保存页面为 PDF 或截图:
    agent-browser pdf output.pdf
    agent-browser screenshot path.png

这些操作让浏览器在执行任务时更加灵活,用户只需设置一次,后续即可一键完成,实现真正的自动化操作。

影响与未来展望

Chrome 推出 Skills 功能标志着浏览器正在从工具向智能助手转变。这一变化不仅提升了用户的操作效率,还为 AI 与浏览器的深度融合提供了可能。通过 OpenClaw 等工具,用户可以进一步拓展 Skills 的应用场景,如自动化测试、网页爬取和任务调度。

未来,随着 AI 技术的发展,浏览器的技能复用功能将变得更加智能。用户有望通过语音指令或自然语言与浏览器互动,甚至实现自动化的跨平台任务执行。Chrome 的 Skills 功能正在引领浏览器智能化的新时代。

不知道用什么工具?点我直接推荐
一句话描述需求,快速找到更合适的 AI 工具
立即试试