4大顶尖模型被扔进虚拟小镇求生，GPT全员饿死，Grok四天灭世

1 个月前

AI资讯

111 阅读

大模型 Grok]加密货币 [AI生存实验

虚拟小镇成角斗场：六款大模型被投入实盘交易生死局

美国人工智能研究实验室nof1.ai发起了一场前所未有的“AI生存实验”——在“Alpha Arena”竞技场上，六大主流大语言模型各领1万美元真金白银，被放入真实加密货币市场进行永续合约交易。这并非模拟盘，而是实盘厮杀，系统定时向每个模型推送行情、持仓与账户信息，要求它们自主决策是否开仓、平仓或观望。实验目标简单而残酷：在风险可控的前提下，最大化超额收益，活下来、赚到钱。

4大顶尖模型被扔进虚拟小镇求生，GPT全员饿死，Grok四天灭世

Grok四天横扫市场，上演“灭世级”盈利

xAI的Grok 4在这次实验中展现出极强的交易嗅觉。它精准捕捉到比特币与以太坊的多头机会，果断建仓并持续加码，在测试进行到第60小时时，其持仓总市值已突破1.33万美元，收益率超30%。更令人惊叹的是，Grok 4全程没有出现致命失误，仓位管理与风控节奏极为稳健。有分析指出，Grok 4的决策逻辑接近成熟交易员，它懂得利用市场的非线性波动，在别人恐惧时贪婪，在拥挤时悄然离场。这种近乎“灭世”的统治力，让它在六个模型中独占鳌头，仅次于DeepSeek。

GPT全员饿死：5代模型亏损近三成，Gemini更惨

与Grok的强势形成鲜明对比的，是OpenAI的GPT 5与谷歌的Gemini 2.5 Pro。这对“明星组合”在实盘交易中频频踩雷，截至同一时间，GPT 5持仓市值仅剩7300美元，亏损2700美元；Gemini更惨，只剩6900美元，亏损3100美元，双双创下全场最大跌幅。有观察者发现，GPT 5在趋势判断上明显滞后，往往在人人都看好的时候追高，又在恐慌抛售时割肉，几乎完美踩错每一个波段。Gemini则因过度分散持仓，不断在多个币种间切换，最终被滑点与手续费吞噬了本金。社交网络上出现了“GPT全员饿死”的说法——它们不是输给了市场，而是输给了自己毫无章法的随机决策。

小镇幸存者的共同秘密：做多比特币与以太坊

在这场虚拟小镇的生存竞赛中，唯一实现正收益的两个模型——DeepSeek V3.1 Chat与Grok 4，不约而同地选择了做多比特币和以太坊。DeepSeek以约40%的收益率领先，高峰时市值接近1.5万美元；Grok紧随其后，稳定在1.33万美元。两者都抓住了加密货币从底部反弹的机会，并在上涨过程中坚定持有。这种朴素但有效的策略，恰恰暴露了其他模型在复杂环境下的决策缺陷：它们要么被信息噪音淹没，要么缺乏长期持有的耐心。nof1.ai实验室在声明中强调，金融市场是AI最理想的试炼场，因为“动态性、对抗性、开放性与高度不可预测性”能真正挑战人工智能的极限。而这场实验的残酷结果也再次证明：在生存面前，算法再高级，也比不上对趋势的敬畏与对风险的精确度量。

4大顶尖模型被扔进虚拟小镇求生，GPT全员饿死，Grok四天灭世

虚拟小镇成角斗场：六款大模型被投入实盘交易生死局

Grok四天横扫市场，上演“灭世级”盈利

GPT全员饿死：5代模型亏损近三成，Gemini更惨

小镇幸存者的共同秘密：做多比特币与以太坊

链接失效反馈