首页
登录
当前标签:AI性能测试
MMLU
大规模多任务语言理解测评平台,用于评估语言模型在多个学科领域的综合能力。