当前分类:AI大模型
MMBench
MMBench是一个针对多模态大模型的全面评测体系,旨在系统评估模型在多种任务和模态下的综合能力。
CMMLU
CMMLU是一个专为大语言模型设计的综合性中文评估基准,涵盖多个维度的测试任务,帮助开发者和研究人员全面了解模型的中文能力表现。
AGI-Eval
AGI-Eval是一个专注于AI大模型评测的在线社区,提供全面、客观、科学的模型评估服务。
SuperCLUE
中文通用大模型综合性测评基准
FlagEval
FlagEval是智源研究院推出的“天秤”大模型评测平台,致力于提供全面、公正、可复现的大模型评估服务。
C-Eval
C-Eval是一个专注于中文基础模型全面评估的权威工具套件。
Open LLM Leaderboard
开源大模型排行榜,提供透明、公平的性能评估与对比。
MMLU
大规模多任务语言理解测评平台,用于评估语言模型在多个学科领域的综合能力。
序列猴子
序列猴子是出门问问推出的一款超大规模语言模型,专注于提供高质量的语言理解和生成能力。
Cohere
Cohere是一款专注于构建AI产品的大语言模型平台,提供强大的自然语言处理能力与开发工具。
MiracleVision奇想智能
MiracleVision奇想智能是由美图推出的AI视觉创作平台,专注于图像生成、设计优化与视频创作。
悟道
智源“悟道”是中国首个且规模最大的人工智能超大规模模型,由北京智源人工智能研究院牵头研发。
Gemma
Gemma 是由谷歌推出的新一代轻量级开放模型,专为高效、灵活的AI应用开发而设计。
Llama 3
Llama 3是由Meta推出的最新一代开源大型语言模型,具有强大的语言理解和生成能力。
OpenBMB
OpenBMB是一个由清华团队支持发起的大规模预训练语言模型库与工具平台,致力于提供高效、灵活、可扩展的大模型解决方案。
AutoGPT
AutoGPT是一款基于GPT-4的实验性开源项目,实现AI自主运行与任务执行,已在GitHub获得超10万星标。
豆包大模型
豆包大模型是字节跳动推出的一系列人工智能大模型,涵盖视频生成、语音视觉、通用语言模型等多个领域。
Ollama
Ollama是一个支持在本地环境中运行Llama及其他大语言模型的平台,简化了模型部署与使用的流程。
讯飞星辰MaaS
讯飞星辰MaaS是一个集AI大模型体验、调用、部署与精调于一体的一站式平台,提供高性价比的AI模型服务和定制化解决方案。
AMiner
AMiner是一个由智谱AI推出的大模型学术平台,致力于为研究人员和开发者提供前沿的学术资源与工具。
DMXAPI
DMXAPI 是一个通过单一 API 密钥即可调用全球主流大模型的服务平台。
英博云AI算力
英博云AI算力是英博数科打造的一站式GPU智算服务云平台,致力于为人工智能、深度学习、科学计算等领域提供高效稳定的算力支持。
阿里云百炼
阿里云百炼是一站式大模型开发与应用构建平台,助力开发者高效构建AI应用。
百灵大模型
百灵大模型是蚂蚁集团推出的Ling-1T大模型对话体验平台,面向用户提供高质量的AI对话服务。
DeepSeek
DeepSeek是一款由幻方量化推出的人工智能智能助手和开源大语言模型,致力于提供高效、智能的自然语言处理能力。
Claude
Claude是一款由Anthropic公司开发的对话式AI智能助手,具备强大的自然语言理解和交互能力。
Lunit
Lunit是一家专注于利用人工智能技术推动癌症早期筛查的医疗科技公司。
医真AI+
医真AI+是一家专注于医疗大数据底层技术研发与应用的创新平台,为医疗机构提供智能化、一体化解决方案。
MedGPT
MedGPT是一款由医联在2023年推出的国内首款大模型驱动的AI医生诊断工具。
Meshy
Meshy是一款利用AI技术快速生成高质量3D模型的创新工具,适合各类用户进行高效的内容创作。