谷歌发布的TurboQuant算法能在不影响精度的情况下大幅压缩内存占用,引发市场对内存需求降温的预期和华尔街的激烈辩论。
谷歌一篇新论文通过KV cache压缩技术大幅降低内存需求,引发市场对高带宽内存(HBM)和DRAM未来需求的担忧,导致存储芯片股重挫。