统治AI十年的Transformer,要被亲爹亲手砸碎?

Transformer之父下场辩护,挑战者连轰五大死穴

在一场长达80分钟的激辩中,Transformer架构的联合发明人被迫直面三位挑战者的猛烈围攻。挑战者们毫不留情,一口气指出了Transformer的五大核心缺陷:无法解决的二次方计算复杂度、根本性的推理效率瓶颈、难以应对超长序列的硬伤、对硬件友好度的逐渐丧失,以及背后巨大的能源消耗。面对这些“死穴”,发明人虽极力辩护,却难以否认这些问题的存在。这场辩论被业内视为AI架构十年来最硬的一次“正面交锋”。

统治AI十年的Transformer,要被亲爹亲手砸碎?

计算成本失控:大模型API价格“雪崩”式降价背后

正当Transformer的拥趸们还在争论其理论优越性时,市场已经给出了残酷的信号。近期,包括小米在内的大模型厂商突然宣布大模型API永久降价,最高降幅达到惊人的99%。这种“自杀式”降价背后,是Transformer在推理阶段高昂的计算成本已成行业沉重负担。当模型参数从千亿迈向万亿甚至更大规模时,Transformer的二次方计算复杂度让每次API调用都像在烧钱——降价不是厂商大方,而是再不寻找替代架构,整个行业都会被成本压垮。

新架构虎视眈眈:从“避不开”到“想摆脱”

面对Transformer的“贵”与“慢”,一批全新架构正在快速崛起。除了备受关注的Mamba、RWKV等状态空间模型(SSM)外,Anthropic等公司也在疯狂探索非Transformer思路。这些新架构在长序列处理上展现出线性复杂度,推理速度成倍提升,且对硬件利用率更友好。过去十年,任何AI研究者都无法绕过Transformer;但现在,从学界到工业界,越来越多的人开始思考:我们是否真的需要完全依赖它?一场“去Transformer化”的暗流正在涌动。

监管与伦理施压:教皇与Anthropic联手警告“AI不能统治人类”

技术之外,伦理与监管的利剑也已经悬起。教皇与Anthropic联合发出警告:AI不能统治人类。这台基于Transformer构建的“庞大机器”在能力上已经逼近甚至局部超越人类,但其根本的不可解释性和能耗问题持续引发担忧。五角大楼、SpaceX(其估值飙升至1.75万亿美元锚定的正是AI业务)等重量级玩家纷纷入场,但同时对现有架构的质疑声也越来越大——如果Transformer无法被证明是安全、可控且可持续发展的,其“亲爹”亲手砸碎它的那一天,可能会比所有人预想的来得更早。