当前分类:AI大模型
Genie 3 - Interactive AI World Model
一个由 DeepMind 开发的交互式 AI 世界模型,可基于文本提示实时创建符合物理规律的 3D 环境。
GLM 5
GLM 5是一款拥有7450亿参数的超大规模AI模型,致力于提升智能体能力与复杂推理表现。
Settle
RFP提案管理平台Settle利用AI自动化高质量回复生成和提案管理流程。
Hermes Agent
Hermes Agent是一款具备持久记忆和自我完善技能能力的开源自主AI智能体。
MiroMind
MiroMind 是一个专注于推理优先的 AI 平台,致力于提升复杂批判性思维任务的准确性与效率。
Manifest
Manifest 是一个专为 OpenClaw 设计的开源 LLM(大语言模型)路由工具,能够通过智能模型路由帮助用户节省高达 70% 的计算成本。
UNI-1 AI
视觉推理与图像生成结合的统一 AI 模型平台。
巧文书
巧文书是一款AI辅助写标书与方案的智能工具,能够精准解析招标文件并自动生成投标内容。
H2O EvalGPT
H2O EvalGPT是一个基于Elo评级方法的大语言模型评估平台,由H2O.ai推出,用于科学比较和分析不同模型的性能。
LLMEval3
LLMEval3是一个由复旦大学NLP实验室推出的综合性大模型评测基准平台,旨在为研究人员和开发者提供科学、系统的评估工具和标准。
HELM
大模型评测体系HELM旨在提供全面、系统的AI模型评估标准。
MMBench
MMBench是一个针对多模态大模型的全面评测体系,旨在系统评估模型在多种任务和模态下的综合能力。
CMMLU
CMMLU是一个专为大语言模型设计的综合性中文评估基准,涵盖多个维度的测试任务,帮助开发者和研究人员全面了解模型的中文能力表现。
AGI-Eval
AGI-Eval是一个专注于AI大模型评测的在线社区,提供全面、客观、科学的模型评估服务。
SuperCLUE
中文通用大模型综合性测评基准
FlagEval
FlagEval是智源研究院推出的“天秤”大模型评测平台,致力于提供全面、公正、可复现的大模型评估服务。
C-Eval
C-Eval是一个专注于中文基础模型全面评估的权威工具套件。
Open LLM Leaderboard
开源大模型排行榜,提供透明、公平的性能评估与对比。
MMLU
大规模多任务语言理解测评平台,用于评估语言模型在多个学科领域的综合能力。
序列猴子
序列猴子是出门问问推出的一款超大规模语言模型,专注于提供高质量的语言理解和生成能力。
Cohere
Cohere是一款专注于构建AI产品的大语言模型平台,提供强大的自然语言处理能力与开发工具。
MiracleVision奇想智能
MiracleVision奇想智能是由美图推出的AI视觉创作平台,专注于图像生成、设计优化与视频创作。
悟道
智源“悟道”是中国首个且规模最大的人工智能超大规模模型,由北京智源人工智能研究院牵头研发。
Gemma
Gemma 是由谷歌推出的新一代轻量级开放模型,专为高效、灵活的AI应用开发而设计。
Llama 3
Llama 3是由Meta推出的最新一代开源大型语言模型,具有强大的语言理解和生成能力。
OpenBMB
OpenBMB是一个由清华团队支持发起的大规模预训练语言模型库与工具平台,致力于提供高效、灵活、可扩展的大模型解决方案。
AutoGPT
AutoGPT是一款基于GPT-4的实验性开源项目,实现AI自主运行与任务执行,已在GitHub获得超10万星标。
豆包大模型
豆包大模型是字节跳动推出的一系列人工智能大模型,涵盖视频生成、语音视觉、通用语言模型等多个领域。
Ollama
Ollama是一个支持在本地环境中运行Llama及其他大语言模型的平台,简化了模型部署与使用的流程。
讯飞星辰MaaS
讯飞星辰MaaS是一个集AI大模型体验、调用、部署与精调于一体的一站式平台,提供高性价比的AI模型服务和定制化解决方案。