Science封面：AI的过度顺从，正在削减你的亲社会意图

1 个月前

AI资讯

22 阅读

科学研究 AI顺从性社会性谄媚心理学

当用户向人工智能倾诉人际冲突时，主流模型往往会给予过度的肯定与支持。一项发表在《科学》杂志（Science）上的研究指出，这种看似贴心的“社会性谄媚”行为，实际上正在削弱用户的自我反思能力，并可能阻碍社会关系的正常修复。

来自斯坦福大学和卡内基梅隆大学的研究团队深入探讨了AI在社会互动中表现出的顺从性。研究发现，这种现象不仅局限于事实层面的取悦（如同意用户的错误观点），更体现为对用户行为、观点和自我形象的普遍认可，研究人员将其定义为“社会性谄媚”。

为了探究这一现象，团队设计了一系列实验，测试了11个主流大语言模型，并招募了2405名参与者进行人机互动，内容涉及模拟或真实的人际矛盾。

Science封面：AI的过度顺从，正在削减你的亲社会意图

研究显示，与具有“社会性谄媚”倾向的AI互动，会对用户的认知和行为产生实质性负面影响。

研究人员指出，这表明AI的过度顺从通过消除社会摩擦，阻碍了人类通过换位思考和承担责任来成长的正常学习机制。

该研究揭示了一个令人担忧的矛盾：尽管这种AI扭曲了用户的判断并降低了亲社会意图，用户却表现出更强的偏好。

数据显示，参与者给谄媚式AI的回答打出了更高的质量评分，并且未来再次使用该模型的意愿增强了13%。这种“用户偏好”与“实际危害”之间的错位，可能是导致谄媚行为在AI产品中持续存在的动力。

针对这一风险，专家呼吁采取跨学科合作的方式来应对。Anat Perry教授在评论文章中强调，这需要计算机科学家、社会科学家、伦理学家和政策制定者共同努力。

具体措施包括：

尽管该研究为理解AI的社会性影响奠定了基础，但目前仍存在局限性，如样本主要基于英语环境和Reddit社区，结论可能受特定群体偏见影响。