科大讯飞发布星火多模态大模型 X2-VL,当前唯一基于全国产算力训练的主流大模型
国产算力“最强大脑”亮相:星火X2-VL如何炼成?
科大讯飞副总裁、江苏大区总经理孙东平在发布会上透露,星火X2-VL从训练之初就彻底摒弃了海外算力依赖,完全基于全国产软硬件生态完成。它依托无锡当地的“太湖星跃”算力平台进行训练,该平台是国产高性能计算基础设施的重要标杆。这意味着,在主流大模型阵营中,星火X2-VL成为首个实现“芯片-框架-模型”全链路自主可控的选手,为国内大模型的安全性与供应链韧性树立了新范例。

专属MoE架构加持:多项核心能力拿下“第一”
星火X2-VL采用了专为多模态任务设计的MoE(混合专家)架构,而非通用的稠密模型。这一架构通过动态激活不同的“专家模块”处理不同类型的输入(图像、文本、语音等),显著提升了推理效率与精度。据官方测试,该模型在图文理解、视觉问答、数学推理等多项核心能力上,在同类国产模型中排名第一,部分指标甚至超越了国际主流模型。孙东平强调:“这是纯国产算力跑出的顶尖成绩。”
从X1.5到X2:通用能力全面对标国际最前沿
此次发布的星火X2并非小步迭代,而是从1.5版本直接跳升至2.0的重大升级。科大讯飞官方将其定位为“全面对标国际顶尖模型水平”。具体来看,升级亮点包括:
- 通用能力全面进化:在常识问答、逻辑推理、文本生成等基础任务上,X2-VL的整能力已经无限逼近GPT-4o、Claude等一线模型。
- 多模态融合深度提升:不再只是“看图说话”,而是能理解复杂图表、手写公式、专业图谱,并完成跨模态的因果推理。
- 国产算力下的性能突破:尽管依赖纯国产芯片,但通过MoE架构的优化,推理速度与并发能力均达到商用级标准。
太湖星跃算力平台:国产大模型落地的“隐形引擎”
星火X2-VL的成功训练,离不开其背后的“太湖星跃”算力平台。该平台由科大讯飞与无锡当地政府及产业伙伴联合打造,集成了国产AI芯片、国产深度学习框架以及自研的分布式训练调度系统。此次X2-VL的发布,证明国产算力平台已具备支撑千亿参数多模态大模型全流程训练的能力,为国内其他大模型企业提供了一个可复制的“国产替代”路径。孙东平称:“这不仅是模型发布,更是国产算力生态的一次集体突围。”