首页
登录
当前标签:灾难性遗忘]
RL特训出「押题大师」?破解模型微调中的多样性危机与灾难性遗忘
基础模型在RL微调过程中面临解题多样性下降与灾难性遗忘的双重挑战。