大厂的Agent之争在沿着四条主线演变
字节扣子空间打响C端通用Agent第一枪
2025年4月,字节跳动旗下火山引擎推出首款面向C端的通用Agent平台“扣子空间”,定位为“一个通用的实习生配合各领域的专家”。这款产品通过多模态交互、任务规划和工具调用,帮助用户完成复杂任务,被视为字节在Agent领域的战略落子。与市面上其他产品相比,扣子空间强调“深度思考”与“工具调用”的结合,用户输入自然语言任务后,系统会利用豆包大模型拆解子步骤并动态调用工具。
- 体验亮点:在文字梳理任务上表现突出,如生成腾冲旅游攻略、秦灭六国展示网页等。
- 当前短板:将文字转化为网页时效果打折,图片信息易丢失;第三方扩展数量有限,部分功能(如高德地图路线生成)成功率低。
扣子空间的推出,标志着字节跳动从2023年聚焦基础大模型、2024年探索多模态,到2025年全面转向Agent生态的战略升级。
百度心响App抢占移动端Agent入口
百度在2025年4月25日发布心响APP,定位为首个移动端通用超级智能体。与扣子空间的桌面与云端定位不同,心响APP主打移动场景,任务更轻量化和生活化。推荐任务中既包含旅游攻略、数据分析等通用Agent常见功能,也包含数学解题、AI相亲、例行任务等类似聊天机器人的轻交互。

- 移动端优势:用户可随时随地通过自然语言发起任务,与手机摄像头、位置等传感器结合,实现“拍照问”等场景。
- 功能特征:整体体验可视为“文小言的Agent进化版”,在任务理解与执行上更强调“轻、快、准”。
百度延续了互联网时代用户流量逻辑,试图通过移动端Agent产品抢占用户入口,与字节的扣子空间形成差异化竞争。
多模态能力成为模型层竞争新高地
“大模型落地C端场景的核心,就是让大模型的能力越来越接近人。”多模态能力是降低用户沟通门槛的关键,也是Agent能够“看懂”屏幕界面、实现自主操作的前提。近期,各大厂在多模态大模型上密集发力:
- 字节跳动:豆包1.5深度思考模型结合视觉理解,可看图分析地貌、生成项目流程图;豆包1.6统一定价,深度思考与基础模型同价,成本降至豆包1.5的三分之一。
- 百度:文心4.5 Turbo展示了对马拉多纳“上帝之手”照片的理解,以及水槽实验视频中不同颜色物体的识别。
- 阿里巴巴:夸克推出“拍照问夸克”功能,基于通义推理及多模态大模型+后训练,用户拍照即可获取文物科普、食物卡路里、景点攻略等信息。
- OpenAI:o3、o4-mini首次实现“用图像思考”,具备看图表和画图能力。
- 谷歌:Gemini 2.5 Flash混合推理模型能精准分析股票走势图,并根据素材生成游戏场景。
多模态能力的提升不仅直接改善Agent的用户体验,还影响着下一代硬件形态——AI眼镜的进展。一位AI硬件创业者表示,目前不选择AI眼镜方向,正是因为多模态大模型还不成熟,但未来拍照问夸克这类交互可能从手机迁移到眼镜。
MCP协议引爆Agent生态互联互通
在Agent与外部工具、数据源的连接上,MCP(Model Context Protocol,模型上下文协议)的普及正在重塑竞争格局。MCP由Anthropic提出,统一了LLM与外部工具的通信方式,解决了过去接口各异、定制成本高、生态割裂的痛点。
- 360纳米AI:率先上线“MCP万能工具箱”,号称接入近百个优质第三方工具,直接以MCP协议作为核心卖点。
- 字节扣子空间:支持添加扩展(如墨迹天气、高德地图),但扩展数量较少且功能深度有限。
- 行业影响:MCP与A2A(Agent2Agent)协作协议的推出,让第三方数据、工具有了统一接入接口,Agent之间也能相互协作,推动了Agent从“孤岛”走向“互联”。
正如东吴证券研报指出,MCP的普及有助于降低集成门槛,催生更繁荣的Agent生态系统,最终赋能更强大的通用Agent应用。
火山引擎以降本增效推动Agent规模化
“Agent每次执行任务都会消耗大量tokens,模型使用成本也要降下来,才能推动Agent的规模化应用。”火山引擎总裁谭待在采访中强调。火山引擎为此采取“技术+商业”双轮创新:
- 豆包1.6定价:按输入长度区间定价,在企业使用量最大的0-32K输入区间,输入价格0.8元/百万tokens,输出8元/百万tokens,综合成本仅为豆包1.5深度思考模型或DeepSeek R1的三分之一。
- Seedance1.0 pro:视频生成模型,每千tokens仅0.015元,每生成一条5秒1080P视频只需3.67元,为行业最低。
- 商业化路径:火山引擎定位“AI云”,聚焦汽车、金融、消费电子等头部行业,同时通过低成本与低代码工具吸引初创企业,普惠中小客户。
成本的快速下降正在打破“AI离企业远”的魔咒。然而,科技巨头能否真正让客户愿意为“生产级Agent”买单,仍面临技术成熟度、商业模式不确定性等挑战。正如市场研究机构Research and Market预计,AI智能体市场规模将从2024年的51亿美元增长到2030年的471亿美元,复合年增长率44.8%。在这场混战中,谁能率先实现“低成本+高可用”的Agent,谁就可能掌握下一轮AI话语权。