首页
登录
当前标签:推理效率]
北大团队改造DeepSeek注意力,速度快四倍还不丢精度
北大团队提出分层索引稀疏注意力机制HISA,在超长文本处理中实现2-4倍速度提升,且保持模型精度。