AI 制造 AI:面壁智能开源全球首个完全由 AI 编写的生产级训练框架 ForgeTrain
AI亲手“生”下预训练框架
ForgeTrain 不仅仅是又一个开源框架,它的诞生方式彻底颠覆了行业认知——整个框架的代码完全由AI自动生成,人类只做监督和验证。这标志着“AI制造AI”从概念演示进入了可评测、可复现的生产级阶段。为了让AI能够自己“编好代码”,面壁智能设计了一个名为 Harness 的自动化考场:AI被丢进这个环境里,不断生成预训练代码、运行测试、根据反馈修正错误,全程无需人工干预。最终产出的ForgeTrain在训练速度上甚至压过英伟达的 Megatron 约10%,并用它成功训练出端侧模型 MiniCPM5-1B。正如官方所说:“如果你把MiniCPM5-1B看做AI制造AI的产品,那ForgeTrain就是那座完全由AI打造的工厂。”

小模型刷新AI智能密度:1B参数超越2B级
MiniCPM5-1B 仅 1B 参数,却在国际知名榜单 AA-Index 上超越了所有 2B 参数以下的模型,包括此前发布的 Qwen3.5-2B——参数量减半,效果更优。它的智能密度正在以约每3.5个月翻一番的速度跃升,让“更小的模型承载更高的智能”不再是空话。在具体评测中,MiniCPM5-1B 的 FP16 精度体积约 2GB,适合 GPU 和高端 PC;INT4 量化后仅 0.5GB,可直接部署在手机、平板甚至车机上。它还在综合知识、数学推理、代码生成、工具调用等方向均取得同尺寸领先水平。为了让模型真正“用起来”,面壁为其配备了完整的工具链:推理侧支持 SGLang、vLLM、llama.cpp、Ollama 等,微调侧支持 LLaMA-Factory、ms-swift 等,降低了端侧落地的门槛。
不再“均码”时代:AI为每款模型量身打造代码
过去的大模型训练框架(如英伟达 Megatron、Meta Fairseq)都追求通用性,像一件“均码衣服”——谁都能穿,但谁都穿不合身。Forge Engineering 的思路则截然不同:既然AI写代码的成本正在急剧下降,为什么还要强求通用?完全可以针对不同的模型结构、硬件平台和训练任务,现场锻造一套专用代码。ForgeTrain 正是这一理念的落地:它让AI为每个具体场景生成最精简、最高效的训练逻辑,不再受制于臃肿的通用框架。这种「专用锻造」模式,意味着未来软件可能不再是一套大而全的框架,而是根据需求动态生成的、专为当前任务优化的代码片段。
国产芯片的“加速器”:AI填平软件生态鸿沟
英伟达拥有数以百万计的开发者花了十五年时间踩坑、优化 CUDA 生态,这是国产芯片(如华为昇腾)在软件生态上的最大短板。但ForgeTrain的出现提供了另一种可能:如果人力不够,就让AI来凑。通过AI自动生成适配新模型、新硬件的专属预训练框架,国产芯片将有机会以极低成本快速补齐底层软件生态的差距。未来AI科学家的角色将从 Human in the loop(手动写代码)转变为 Human on the loop(设计目标和验收标准),把重复的算子优化、通信调参工作全部交给不知疲倦的AI。这一转变不仅降低了大模型研发的人力门槛,更让国产算力生态看到了“弯道超车”的实质性路径——不是靠堆人,而是靠AI的自动化生产力。