OpenAI开出44.5万美元年薪招聘安全研究员:要求有品位、有策略性
高薪寻人:年薪可达303万元,要求“有品位且有策略”
据《商业内幕》5月23日报道,OpenAI旗下的Preparedness安全团队近日发布了一则引人注目的招聘信息,面向全球寻找安全研究员。该岗位年薪高达29.5万至44.5万美元(约合200.8万至303万元人民币),目标是网罗能够“支持递归式自我改进准备工作的强大技术执行者”。招聘信息特别强调,这份工作依赖于对未来可能存在的、但目前未必已经显现的问题进行推理,因此尤其需要“具备良好品味和策略性”的人才。所谓“良好品味且具有战略性”,指的是能够谨慎权衡安全利弊、优先考虑关键风险,而不仅仅是解决眼前的技术问题。

前瞻性目标:防范AI自我改进的“递归”风险
OpenAI此次招聘的核心方向,是研究当AI系统能够自主训练出“更强版本”时可能出现的颠覆性问题。这种被称为“递归式自我改进”的场景是AI安全领域的终极挑战之一。招聘信息指出,该职位旨在培养能够超越现有系统思维、预见尚未完全显现的风险的工程师。与此同时,OpenAI CEO奥尔特曼去年10月曾透露,公司计划在2025年9月前利用数十万枚芯片运行“自动化AI研究实习生”,并在2028年3月前实现“真正的自动化AI研究员”。尽管他承认目标未必能达成,但认为公开这类宏愿符合公众利益。行业对手Anthropic也在今年4月尝试用AI模型监督更强的AI模型,效果有限但积极;其联合创始人杰克·克拉克甚至预测,到2028年底前AI研发完全脱离人类参与的概率“大约为60%”。
实战任务:防御数据投毒、开发解释工具、追踪自动化进程
具体工作内容上,OpenAI要求研究员重点研究如何防御“数据投毒”攻击——即攻击者通过污染训练数据来破坏AI模型的行为。此外,还需要开发用于解释模型推理过程的工具,通过实验理解模型的安全性与潜在风险。另一项关键职责是“追踪技术岗位自动化进展”,包括衡量AI编程工具的使用情况。这意味着该角色不仅要解决当前的安全隐患,还要持续评估AI自身研发流程逐渐脱离人类控制的速率,为可能到来的“奇点”时刻提前制定防御策略。