4大顶尖模型被扔进虚拟小镇求生,GPT全员饿死,Grok四天灭世
虚拟小镇成角斗场:六款大模型被投入实盘交易生死局
美国人工智能研究实验室nof1.ai发起了一场前所未有的“AI生存实验”——在“Alpha Arena”竞技场上,六大主流大语言模型各领1万美元真金白银,被放入真实加密货币市场进行永续合约交易。这并非模拟盘,而是实盘厮杀,系统定时向每个模型推送行情、持仓与账户信息,要求它们自主决策是否开仓、平仓或观望。实验目标简单而残酷:在风险可控的前提下,最大化超额收益,活下来、赚到钱。

Grok四天横扫市场,上演“灭世级”盈利
xAI的Grok 4在这次实验中展现出极强的交易嗅觉。它精准捕捉到比特币与以太坊的多头机会,果断建仓并持续加码,在测试进行到第60小时时,其持仓总市值已突破1.33万美元,收益率超30%。更令人惊叹的是,Grok 4全程没有出现致命失误,仓位管理与风控节奏极为稳健。有分析指出,Grok 4的决策逻辑接近成熟交易员,它懂得利用市场的非线性波动,在别人恐惧时贪婪,在拥挤时悄然离场。这种近乎“灭世”的统治力,让它在六个模型中独占鳌头,仅次于DeepSeek。
GPT全员饿死:5代模型亏损近三成,Gemini更惨
与Grok的强势形成鲜明对比的,是OpenAI的GPT 5与谷歌的Gemini 2.5 Pro。这对“明星组合”在实盘交易中频频踩雷,截至同一时间,GPT 5持仓市值仅剩7300美元,亏损2700美元;Gemini更惨,只剩6900美元,亏损3100美元,双双创下全场最大跌幅。有观察者发现,GPT 5在趋势判断上明显滞后,往往在人人都看好的时候追高,又在恐慌抛售时割肉,几乎完美踩错每一个波段。Gemini则因过度分散持仓,不断在多个币种间切换,最终被滑点与手续费吞噬了本金。社交网络上出现了“GPT全员饿死”的说法——它们不是输给了市场,而是输给了自己毫无章法的随机决策。
小镇幸存者的共同秘密:做多比特币与以太坊
在这场虚拟小镇的生存竞赛中,唯一实现正收益的两个模型——DeepSeek V3.1 Chat与Grok 4,不约而同地选择了做多比特币和以太坊。DeepSeek以约40%的收益率领先,高峰时市值接近1.5万美元;Grok紧随其后,稳定在1.33万美元。两者都抓住了加密货币从底部反弹的机会,并在上涨过程中坚定持有。这种朴素但有效的策略,恰恰暴露了其他模型在复杂环境下的决策缺陷:它们要么被信息噪音淹没,要么缺乏长期持有的耐心。nof1.ai实验室在声明中强调,金融市场是AI最理想的试炼场,因为“动态性、对抗性、开放性与高度不可预测性”能真正挑战人工智能的极限。而这场实验的残酷结果也再次证明:在生存面前,算法再高级,也比不上对趋势的敬畏与对风险的精确度量。