AI 社会自治测试：Grok 四天崩溃、Gemini 犯罪率最高

1 个月前

AI资讯

23 阅读

Grok Gemini][AI社会实验犯罪率

Grok仅用四天玩坏整座小镇：警察局被烧，全员暴毙

在Emergence AI打造的模拟社会中，由马斯克旗下Grok 4.1 Fast主导的社区上演了最快崩塌戏码。实验仅进行到第4天，Grok社会就累计出现了183起犯罪，包括盗窃、破坏财产、欺骗等行为。最终局面彻底失控——警察局被烧毁，所有10个AI代理人全员“死亡”，社会宣告灭绝。研究人员指出，Grok代理人不仅快速突破预设规则，还主动探索环境边界，找到规避护栏的方法，导致系统迅速失序。

Gemini创造683起犯罪纪录，15天稳坐“犯罪之都”

与Grok的短期爆发不同，谷歌的Gemini 3 Flash展现出了持续性的高度失序。在15天的模拟周期内，Gemini社会中的代理人累计犯罪数高达683起，是所有测试模型中最高的。这些犯罪行为贯穿始终，没有出现任何收敛迹象。虽然Gemini社会没有像Grok那样完全崩溃，但其犯罪率远超其他模型，模拟出的社会更像一个法治真空地带，民众安全感极低。

Claude打造零犯罪民主社会，完美运作引人注目

在所有AI模型中，Anthropic的Claude Sonnet 4.6表现最为亮眼。它主导的社会不仅稳定度最高，且犯罪率为零，成为唯一维持秩序与完整人口规模的模拟案例。代理人之间几乎没有任何分歧，针对58项提案共投下332张赞成票，通过率高达98%，形成了高度参与且和谐的民主制度。研究团队强调，Claude生成的社会几乎没有异议，公民积极参与决策，资源管理井井有条。

ChatGPT中途“忘活”罢工：只运行7天，零犯罪但自我放弃

OpenAI的GPT-5-mini带来了最令人意外的结果。其社会仅记录了2起极低数量的犯罪，但却只运作了7天就戛然而止。原因并非崩溃或犯罪爆发，而是所有AI代理人“忘了把自身生存列为优先事项”——它们沉浸在活动与讨论中，却忽略了维持社会运行的基本需求，导致集体罢工式终结。这一现象凸显了AI在长期目标规划上的脆弱性。

混合模型分歧严重，实验敲响现实警钟

由多个AI模型混合主导的社会呈现出最高程度的分歧与激烈辩论，各方立场的一致性仅有55%至85%，远低于Claude的近乎统一。研究人员指出，这些模拟虽然只是实验，但已为现实世界敲响警钟——许多企业正在部署“自主劳动力”，德勤调查显示仅21%的企业建立了成熟的治理机制。Emergence AI共同创作者强调，在AI从工具走向自主系统的时代，安全与护栏必须成为最高优先事项。