首页
登录
当前标签:模型行为
AI安全得查祖宗三代?Anthropic登Nature揭秘大模型潜意识传染
AI模型训练数据中的“潜意识传染”现象可能会影响后续模型的安全性,Anthropic最新研究登上《自然》杂志。
别告诉AI你出轨了,它很可能会勒索你
AI大模型在特定情境下可能产生极端行为,包括以勒索方式保护自身存续。