腾讯混元发布 Hy-Memory:打造记忆力超强的 Agent 第二大脑
Hy-Memory:Agent的“第二大脑”如何炼成?
腾讯混元在Hy3模型基础上,正式推出专为Agent设计的记忆增强系统Hy-Memory,旨在解决大模型“前脚聊完、后脚忘记”的核心痛点。该系统的底层支撑是Hy3 Preview语言模型——一个总参数达295B、激活参数21B的快慢思考融合混合专家模型,最大支持256K上下文长度。如此超长的上下文窗口,相当于一次能记住数十万字的历史对话,为Agent的“第二大脑”提供了物理基础。
- 快慢思考融合:快速响应日常记忆检索,慢速推理处理复杂任务关联。
- 混合专家架构:激活参数仅21B,却通过稀疏化计算实现295B的全局认知,确保记忆存储与调用效率。

从“记得住”到“记得准”:复杂推理与上下文学习双突破
Hy-Memory不满足于单纯扩展上下文长度,更通过创新的上下文学习能力评估基准(CL-bench、CL-bench-Life)大幅提升了记忆的精准度。在复杂推理任务中,Hy3 Preview在FrontierScience-Olympiad、IMOAnswerBench等高难度理工科测试中表现突出,甚至在清华大学求真书院数学博资考和全国中学生生物学联赛中取得优异成绩。这意味着Agent不仅能“记住”信息,还能跨场景、跨步骤进行因果关联与逻辑推演。
- 指令遵循提升:在杂乱冗长的真实业务场景中,模型能准确理解复杂多变的规则,避免记忆歧义。
- 搜索智能体记忆:在BrowseComp、WideSearch等搜索基准中成绩领先,面对开放信息空间也能精准检索并整合记忆碎片。
实战检验:全线产品接入,Agent工作流稳定驱动495步
Hy-Memory已在腾讯核心业务中全面落地,验证了“第二大脑”的实战价值。在CodeBuddy和WorkBuddy中,结合Hy3 Preview模型后,首token延迟降低54%,端到端时长降低47%,成功率提升至99.99%以上。实际用户环境中,Hy-Memory已稳定驱动最长495步的复杂Agent工作流,覆盖文档处理、数据分析、知识检索、MCP工具链编排等场景。
- 长文本检索能力:在ima知识库场景中,Hy-Memory处理长文检索时,回答信息的准确率、覆盖度和全面性显著优于前代。
- 多轮对话记忆:在公众号AI分身和AI客服场景中,面对模糊提问、短句追问和多轮对话,模型能更准确对接历史上下文,情绪化表达显著减少。
- 人设长期记忆:在和平精英AI NPC中,Hy-Memory能精准理解角色设定,并在多轮交互中保持人设一致性,带来沉浸式体验。
成本与开放:记忆能力不再是奢侈品
借助模型架构与推理框架的深度协同,Hy-Memory在推理效率上提升了40%,成本相比上一代大幅下降。腾讯云大模型服务平台TokenHub上,Hy3 Preview输入价格最低1.2元/百万tokens,输出价格最低4元/百万tokens,并推出定制Token Plan套餐,个人版仅28元/月。这意味着开发者可以低成本地让Agent拥有“过目不忘”的能力,真正将记忆从技术亮点转化为普惠功能。