国产大模型第一梯队迎新势力:云知声发了个原生Agent大模型,再次捅破行业天花板

U2登场:国产大模型第一梯队迎来新面孔

港股AI公司云知声计划于6月正式发布新一代通用基座大模型U2。这款被内部视为“决定命运”的关键产品,正试图打破当前国产大模型第一梯队相对固化的格局。根据36氪报道,U2在知识推理、长文本理解、复杂指令遵循、软件工程以及Agent工具调用等关键评测中,已展现出对标全球一流模型的实力。综合市场现有排名,通义千问、DeepSeek、豆包、Kimi、文心一言等虽占据领先地位,但U2的介入,无疑让这场Top10的争夺战增添了新的变量。

国产大模型第一梯队迎新势力:云知声发了个原生Agent大模型,再次捅破行业天花板

不止拼参数:U2力推“智能密度×Token价值”新法则

过去几年,大模型行业陷入“参数越大越好”的竞赛怪圈,随之而来的是高昂的训练、推理成本及部署门槛。云知声在U2上提出了全新价值公式:“AI商业价值 = 智能密度 × Token价值”。U2的核心逻辑并非单纯追求庞大参数量,而是在性能达到全球第一梯队后,追求单位参数承载的知识、推理能力与任务解决效率的最大化。在IFBench指令遵循评测、GPQA硬核推理以及长上下文任务中,U2均表现出色,其综合能力追求的是“强而小、强而省、强而能落地”,旨在弥合模型能力与真实商业需求之间的鸿沟。

更懂执行:原生Agent能力让模型从“聊天”走向“干活”

与许多侧重对话生成的大模型不同,U2的显著标签是其原生Agent能力。云知声在训练过程中,重点强化了U2的长程任务规划、工具使用、过程纠错及结果校验能力。这意味着U2不再是只会匹配回答的聊天机器人,它能够调用工具、处理复杂约束、跨步骤执行并对最终任务结果负责。这种面向智能体时代的底座设计,让U2既服务于复杂的企业级场景,也为C端应用和开发者生态打开了关键入口。行业普遍认为,下一阶段大模型的竞争焦点将从“回答质量”转向“任务完成率”,U2显然在为此做准备。

成本杀手:单位Token成本降至普通模型十分之一

大模型下半场,谁能将足够强的能力以更低成本、更稳定地交付,谁就能占据市场主动。云知声在U2上展示了极具竞争力的成本优势:在同等性能目标下,U2的单位Token成本可降至普通稠密模型的约十分之一。这一数字不仅是技术效率的体现,更是推动U2走向规模化商业应用的筹码。对于企业客户而言,这意味着更强的模型能力不再与高昂的费用画等号,人工智能的商业化落地将进入一个更务实、更可及的新阶段。