“AI 养马”出桌面端了:Hermes Desktop 公测发布
工具税之痛:一半 tokens 喂给了“马厩”
“AI 养马”并非戏言——Hermes Agent 作为 Nous Research 发布的开源智能体框架,因命名和高效工具调用能力成为社区热词。然而根据 Anthropic 的实测,在典型多服务器 MCP 部署中,每回合提示符高达 45000 tokens,其中约 22000 tokens(近 50%)仅用于描述工具架构,被戏称为“MCP 工具税”。更夸张的场景下,工具定义可独占 134000 tokens,严重挤占推理空间。这就好比养马时,马夫花一半精力背诵马具清单,而非实际喂马。
偷学搜索引擎:Hermes Agent 用“按需加载”破解上下文拥堵
5 月 29 日,科技媒体曝光 Hermes Agent 的新杀招——Tool Search。它不再一股脑塞入所有工具 Schema,而是采用渐进式披露层,将庞杂的工具目录替换为三个精简的“桥接工具”:tool_search(query, limit?) 搜索工具、tool_describe(name) 加载单个工具的完整 Schema、tool_call(name, arguments) 调用工具。模型像用搜索引擎一样,先搜“创建 GitHub issue”,再精确加载所需工具定义。这相当于将整座马具仓库变成自助取货机,马夫只拿今天要用的缰绳和鞍座。
实战提效:准确率怒涨 25 个百分点,误选率断崖式下跌
启用 Tool Search 后,Anthropic 的 MCP 评测数据惊艳:Claude Opus 4 的准确率从 49% 跃升至 74%,Claude Opus 4.5 从 79.5% 提升至 88.1%。误选概率大幅下降的关键在于——无关工具不再出现在模型视野中,AI 不再被几十个看似相关的工具名称晃花眼。结合 Nous Research 之前为 Hermes Agent 加入的自主迭代能力,桌面端的公测版本将这套“工具检索 + 按需加载”机制固化为默认行为,让开发者无需手动优化 MCP 配置即可获得更省 tokens、更精准的智能体体验。