首页
登录
当前标签:经典论文
经典之作PPO算法:曾被NeurIPS拒了
PPO算法作为强化学习的里程碑,其论文也曾被NeurIPS拒收,但类似的遭遇在AI领域并不罕见,例如知识蒸馏和深度监督网络等经典之作均曾被顶级会议拒之门外。