Token贵只因你喂给模型的垃圾太多了丨@亚马逊王晓野AIGC2026
87%宣称部署AI,仅10%真正获益——企业级Agent落地鸿沟在哪
Gartner分析显示,2028至2030年超过15%的企业日常决策将由Agent或AI自主完成。麦肯锡报告指出的数字更值得警醒:一年前78%企业宣称大规模部署AI,如今已蹿升至87%,但其中真正从中获得价值的比例只有10%左右——前后数字的巨大反差,揭示出从Demo到生产的“最后一公里”异常艰险。
个人在Mac mini上跑一个龙虾Agent,随时可以拔电源重启;但企业级场景里要协调几千个Agent安全、可信、不中断地稳定运行,完全属于两个维度的工程复杂度。同时业务人员(如营销、HR)能否真正把Agent用起来,也依然存在门槛。这些鸿沟包括:数据知识如何精准注入Agent、性价比如何达到“随便用”的程度、长期记忆如何管理不出现矛盾等。亚马逊云科技认为,AI Agent在企业层面的渗透率虽高,但真正走到生产层面、释放价值的比例仍然有限。
Token贵不是单价高,而是你喂了太多垃圾进去
很多企业抱怨Token消耗大、成本高。亚马逊云科技王晓野一针见血地指出:真正导致Token贵的,往往不是单价本身,而是调用模型时喂给了模型太多没用的信息。比如把几千个skills一股脑扔给模型让它自己选,或者在抽取和提取记忆时没有优化好喂给模型的信息,这些做法都会让Token使用量爆炸。
事实上,数据和知识这一层需要更新思路:传统数据平台是服务人的,而今天的企业平台需要转向“数据平台如何服务好AI Agent”。企业知识的版权保护、权限隔离,以及长期记忆的管理都非常重要——记忆并非存得越多越好,错误知识、老旧信息、自相矛盾的知识都会影响Agent最终判断。同时全链路可观测性(能否观察到模型如何被调用、是否产生幻觉)也是AI-ready数据平台必须具备的新能力。
从Harness平台到Working Agent: 亚马逊云科技给出五大能力路线图
亚马逊云科技认为,企业推动Agent从Demo走向生产需要关注五大能力:模式选择与性价比(如自研Trainium芯片、Bedrock平台)、企业自有知识与数据隐私、长期记忆管理、全链路可观测性,以及基础设施的可靠、性能与持久性。把这些生产、控制、管控要求统称为Harness——一个让企业无需在底层平台花费太多功夫,专注于业务价值的开放框架。它可以接入LangChain、CrewAI等开源框架,并提供自动横向扩展、记忆管理、代码解释器、浏览器操控等组件。
最新推出的Quick工作智能体,则瞄准了下一个爆发方向。员工希望Agent帮自己做所有事,企业则希望有管控和安全边界。Quick可以主动连接CRM、聊天工具、邮件等平台,早晨自动汇聚待处理任务,并主动建议约会议或执行操作。此外,亚马逊云科技还联合OpenAI推出了Managed Agent,将前沿模型与最佳实践Harness结合底层安全体系打包给企业使用。这套五层能力的核心目标就是:让更好的模型,通过可信的数据,真正把生产级平台带给用户。