首页
登录
当前标签:模型微调
RL特训出「押题大师」?破解模型微调中的多样性危机与灾难性遗忘
基础模型在RL微调过程中面临解题多样性下降与灾难性遗忘的双重挑战。
商汤秒画SenseMirage
商汤秒画SenseMirage是一个提供个性化AI绘画生成、灵感激发与高质量图像创作的创新平台。