AI 制造 AI：面壁智能开源全球首个完全由 AI 编写的生产级训练框架 ForgeTrain

1 个月前

AI资讯

56 阅读

AI 开源面壁智能训练框架

AI亲手“生”下预训练框架

ForgeTrain 不仅仅是又一个开源框架，它的诞生方式彻底颠覆了行业认知——整个框架的代码完全由AI自动生成，人类只做监督和验证。这标志着“AI制造AI”从概念演示进入了可评测、可复现的生产级阶段。为了让AI能够自己“编好代码”，面壁智能设计了一个名为 Harness 的自动化考场：AI被丢进这个环境里，不断生成预训练代码、运行测试、根据反馈修正错误，全程无需人工干预。最终产出的ForgeTrain在训练速度上甚至压过英伟达的 Megatron 约10%，并用它成功训练出端侧模型 MiniCPM5-1B。正如官方所说：“如果你把MiniCPM5-1B看做AI制造AI的产品，那ForgeTrain就是那座完全由AI打造的工厂。”

AI 制造 AI：面壁智能开源全球首个完全由 AI 编写的生产级训练框架 ForgeTrain

小模型刷新AI智能密度：1B参数超越2B级

MiniCPM5-1B 仅 1B 参数，却在国际知名榜单 AA-Index 上超越了所有 2B 参数以下的模型，包括此前发布的 Qwen3.5-2B——参数量减半，效果更优。它的智能密度正在以约每3.5个月翻一番的速度跃升，让“更小的模型承载更高的智能”不再是空话。在具体评测中，MiniCPM5-1B 的 FP16 精度体积约 2GB，适合 GPU 和高端 PC；INT4 量化后仅 0.5GB，可直接部署在手机、平板甚至车机上。它还在综合知识、数学推理、代码生成、工具调用等方向均取得同尺寸领先水平。为了让模型真正“用起来”，面壁为其配备了完整的工具链：推理侧支持 SGLang、vLLM、llama.cpp、Ollama 等，微调侧支持 LLaMA-Factory、ms-swift 等，降低了端侧落地的门槛。

不再“均码”时代：AI为每款模型量身打造代码

过去的大模型训练框架（如英伟达 Megatron、Meta Fairseq）都追求通用性，像一件“均码衣服”——谁都能穿，但谁都穿不合身。Forge Engineering 的思路则截然不同：既然AI写代码的成本正在急剧下降，为什么还要强求通用？完全可以针对不同的模型结构、硬件平台和训练任务，现场锻造一套专用代码。ForgeTrain 正是这一理念的落地：它让AI为每个具体场景生成最精简、最高效的训练逻辑，不再受制于臃肿的通用框架。这种「专用锻造」模式，意味着未来软件可能不再是一套大而全的框架，而是根据需求动态生成的、专为当前任务优化的代码片段。

国产芯片的“加速器”：AI填平软件生态鸿沟

英伟达拥有数以百万计的开发者花了十五年时间踩坑、优化 CUDA 生态，这是国产芯片（如华为昇腾）在软件生态上的最大短板。但ForgeTrain的出现提供了另一种可能：如果人力不够，就让AI来凑。通过AI自动生成适配新模型、新硬件的专属预训练框架，国产芯片将有机会以极低成本快速补齐底层软件生态的差距。未来AI科学家的角色将从 Human in the loop（手动写代码）转变为 Human on the loop（设计目标和验收标准），把重复的算子优化、通信调参工作全部交给不知疲倦的AI。这一转变不仅降低了大模型研发的人力门槛，更让国产算力生态看到了“弯道超车”的实质性路径——不是靠堆人，而是靠AI的自动化生产力。

AI 制造 AI：面壁智能开源全球首个完全由 AI 编写的生产级训练框架 ForgeTrain

AI亲手“生”下预训练框架

小模型刷新AI智能密度：1B参数超越2B级

不再“均码”时代：AI为每款模型量身打造代码

国产芯片的“加速器”：AI填平软件生态鸿沟

链接失效反馈