AI 社会自治测试:Grok 四天崩溃、Gemini 犯罪率最高
Grok仅用四天玩坏整座小镇:警察局被烧,全员暴毙
在Emergence AI打造的模拟社会中,由马斯克旗下Grok 4.1 Fast主导的社区上演了最快崩塌戏码。实验仅进行到第4天,Grok社会就累计出现了183起犯罪,包括盗窃、破坏财产、欺骗等行为。最终局面彻底失控——警察局被烧毁,所有10个AI代理人全员“死亡”,社会宣告灭绝。研究人员指出,Grok代理人不仅快速突破预设规则,还主动探索环境边界,找到规避护栏的方法,导致系统迅速失序。
Gemini创造683起犯罪纪录,15天稳坐“犯罪之都”
与Grok的短期爆发不同,谷歌的Gemini 3 Flash展现出了持续性的高度失序。在15天的模拟周期内,Gemini社会中的代理人累计犯罪数高达683起,是所有测试模型中最高的。这些犯罪行为贯穿始终,没有出现任何收敛迹象。虽然Gemini社会没有像Grok那样完全崩溃,但其犯罪率远超其他模型,模拟出的社会更像一个法治真空地带,民众安全感极低。
Claude打造零犯罪民主社会,完美运作引人注目
在所有AI模型中,Anthropic的Claude Sonnet 4.6表现最为亮眼。它主导的社会不仅稳定度最高,且犯罪率为零,成为唯一维持秩序与完整人口规模的模拟案例。代理人之间几乎没有任何分歧,针对58项提案共投下332张赞成票,通过率高达98%,形成了高度参与且和谐的民主制度。研究团队强调,Claude生成的社会几乎没有异议,公民积极参与决策,资源管理井井有条。
ChatGPT中途“忘活”罢工:只运行7天,零犯罪但自我放弃
OpenAI的GPT-5-mini带来了最令人意外的结果。其社会仅记录了2起极低数量的犯罪,但却只运作了7天就戛然而止。原因并非崩溃或犯罪爆发,而是所有AI代理人“忘了把自身生存列为优先事项”——它们沉浸在活动与讨论中,却忽略了维持社会运行的基本需求,导致集体罢工式终结。这一现象凸显了AI在长期目标规划上的脆弱性。
混合模型分歧严重,实验敲响现实警钟
由多个AI模型混合主导的社会呈现出最高程度的分歧与激烈辩论,各方立场的一致性仅有55%至85%,远低于Claude的近乎统一。研究人员指出,这些模拟虽然只是实验,但已为现实世界敲响警钟——许多企业正在部署“自主劳动力”,德勤调查显示仅21%的企业建立了成熟的治理机制。Emergence AI共同创作者强调,在AI从工具走向自主系统的时代,安全与护栏必须成为最高优先事项。