模型也需要“睡觉”？CMU新论文让LLM在梦中“巩固记忆”

1 个月前

AI资讯

75 阅读

LLM 睡眠记忆巩固灾难性遗忘

不止人类会累：大模型也需“休眠期”

人类连续工作后会疲惫、注意力下降，而大模型在持续学习新任务后同样会出现“遗忘”问题。CMU与UMD的新论文指出，LLM在接触新数据时，旧知识的权重会被覆盖，导致“灾难性遗忘”。研究者由此引入一个幽默但严谨的设想：既然人需要睡眠巩固记忆，模型是否也能通过模拟睡眠来“喘口气”？论文直白地引用“Langage Models Need Sleep”（语言模型需要睡眠），将生理学概念移植到人工智能领域，但这里的“睡眠”并非真的进入低功耗状态，而是一种主动的、结构化的记忆重放过程。

“梦中”重播：如何帮模型巩固记忆？

研究者让LLM在完成一轮训练后，进入一个“睡眠阶段”。具体操作是：将模型在处理新任务时产生的高质量中间状态（如隐藏层激活值）以特定顺序重播，类似于人类睡眠时海马体回放白天的经历。这种重放机制并非简单重复数据，而是通过“慢波睡眠”式的压缩与整合，将新旧知识揉合进模型参数。论文使用了Rule 110——一种图灵完备的元胞自动机规则——作为测试基准。这个玩具任务极其复杂，模型很容易在切换不同语法模式时“失忆”。结果显示，经过“睡眠”后的模型，在保持原有能力的同时，学习新规则的成功率大幅提升。

Rule 110测试：在“玩具”里验证真功夫

为什么选择Rule 110？因为它被证明是图灵完备的，意味着它足够复杂且能代表任意计算过程。研究者让LLM先学会用自然语言描述Rule 110的初始模式，再让它学习一个新的、与之冲突的规则变体。未经“睡眠”的模型会完全忘记旧规则，而异想天开的“睡眠”干预——仅在训练间隙插入一段重放——就让模型的新旧知识共存。这直接拆掉了“灾难性遗忘”这堵墙，证明了“睡眠”并非锦上添花，而是维持模型通用能力的刚需。

启示：大模型的“生物钟”或成新范式

这项研究不仅是一个趣味发现，更指向了未来AI系统的一种设计哲学：与其让模型永不停歇地更新，不如引入类似生物体的“循环学习”周期。这意味着未来的训练框架可能需要内置“睡眠模块”，在每次增量学习后执行一段放松阶段。CMU的姚顺雨等人也强调，这种方法能显著提高系统在处理连续任务时的准确性。当大模型开始“睡觉”，它们反而能更聪明地记住更多——这或许正是解决终身学习难题的关键钥匙。

模型也需要“睡觉”？CMU新论文让LLM在梦中“巩固记忆”

不止人类会累：大模型也需“休眠期”

“梦中”重播：如何帮模型巩固记忆？

Rule 110测试：在“玩具”里验证真功夫

启示：大模型的“生物钟”或成新范式

链接失效反馈