首页
登录
当前标签:AI算法优化
谷歌推出压缩算法 TurboQuant:AI 运行内存占用锐降至 1/6
谷歌发布TurboQuant算法,可将LLM键值缓存占用减少6倍,且实现零精度损失,显著提升AI推理效率。