[强化学习 - AI 智域导航

首页

登录

当前标签：[强化学习

入职Meta的吴翼，清华叉院官网已撤其教职信息

入职Meta的吴翼，清华叉院官网已撤其教职信息

清华叉院官网已撤下吴翼的教职信息，疑似因他已入职Meta。

RL特训出「押题大师」？破解模型微调中的多样性危机与灾难性遗忘

RL特训出「押题大师」？破解模型微调中的多样性危机与灾难性遗忘

基础模型在RL微调过程中面临解题多样性下降与灾难性遗忘的双重挑战。