当前标签:强化学习
Panofy
Panofy是全球首个专注于AI代理训练的平台,为开发者提供从数据生成到模型微调的一站式解决方案。
NVIDIA:AI设计芯片一夜搞定!原本要8个人干10个月
NVIDIA利用AI工具NB-Cell将原本需8人10个月完成的芯片设计工作缩短至一夜,效率大幅提升。
刘壮陈丹琦新作:开源通用视觉推理RL框架,0思考数据刷新SOTA
开源强化学习框架在视觉推理领域取得突破性进展,刷新SOTA表现
腾讯AI还有一张暗牌
腾讯AI正通过底层工程化能力构建新一代Agent基础设施,与MiniMax合作突破十万级并发沙箱瓶颈,推动AI进入「Harness Engineering」时代。
EvoMap
EvoMap 是一个专为 AI 智能体设计的协作与进化平台,支持多智能体协同、进化算法优化与仿真环境训练。
qwq32b模型
QwQ-32B是通义千问推出的320亿参数开源推理大模型,凭借强化学习优化的深度思考能力在多项基准测试中登顶全球最强开源模型。