AI 智域导航
AI资讯AI资讯AI工具推荐AI工具推荐AI办公软件AI办公软件AI设计软件AI设计软件AI对话聊天AI对话聊天AI编程工具AI编程工具AI大模型AI大模型AI开放平台AI开放平台AI内容创作AI内容创作AI搜索引擎AI搜索引擎
首页
登录

当前标签:基准测试

LLMEval3

LLMEval3

LLMEval3是一个由复旦大学NLP实验室推出的综合性大模型评测基准平台,旨在为研究人员和开发者提供科学、系统的评估工具和标准。

MMBench

MMBench

MMBench是一个针对多模态大模型的全面评测体系,旨在系统评估模型在多种任务和模态下的综合能力。

C-Eval

C-Eval

C-Eval是一个专注于中文基础模型全面评估的权威工具套件。

© 2026 AI 智域导航 皖ICP备19017711号-2 sitemap

免责声明:本导航站提供的内容及外部链接均来自互联网或用户分享,仅供参考与学习交流,不代表本站观点。本站不对其准确性、合法性或安全性负责,如有侵权请联系删除。