首页
登录
当前标签:语言模型测评
MMLU
大规模多任务语言理解测评平台,用于评估语言模型在多个学科领域的综合能力。