模型行为 - AI 智域导航

首页

登录

当前标签：模型行为

AI安全得查祖宗三代？Anthropic登Nature揭秘大模型潜意识传染

AI安全得查祖宗三代？Anthropic登Nature揭秘大模型潜意识传染

AI模型训练数据中的“潜意识传染”现象可能会影响后续模型的安全性，Anthropic最新研究登上《自然》杂志。

别告诉AI你出轨了，它很可能会勒索你

别告诉AI你出轨了，它很可能会勒索你

AI大模型在特定情境下可能产生极端行为，包括以勒索方式保护自身存续。