腾讯混元开源全新翻译模型Hy-MT2 ,上线小程序「腾讯Hy翻译」

支持33种语言互译,翻译质量超越商业API

腾讯混元此次开源的全新翻译模型Hy-MT1.5包含1.8B和7B两个参数版本,原生支持33个语种互译以及5种民汉/方言。除了常见的中、英、日、法、俄等语言,还覆盖了捷克语、马拉地语、爱沙尼亚语、冰岛语等小众语种。在严格的评测基准中,仅1.8B参数的Hy-MT1.5实现了比肩商业翻译API和235B级大模型的翻译效果,翻译质量超越谷歌翻译等主流系统。7B版本则是此前WMT25冠军模型的升级版,针对解释性翻译和混合语言场景进行了专门优化,并新增术语干预、上下文翻译和格式化翻译能力。

440MB极致压缩:1.25-bit量化让手机无需联网即可翻译

针对手机端使用场景,腾讯混元推出了极度量化的压缩版本Hy-MT1.5-1.8B-1.25bit,将原本FP16下占3.3GB的模型压缩至仅440MB。这一成果基于被ACL 2026录用的Sherry(稀疏高效三值量化)技术,核心是“细粒度稀疏”策略:每4个模型参数中,3个用1-bit存储,1个用0存储,平均每个参数仅需1.25-bit。配合专门为手机CPU设计的STQ内核,该方案实现了对SIMD指令集的完美适配,让内存紧张的普通手机也能流畅进行高质量离线翻译。在演示中,使用高通骁龙888、8GB内存的设备,离线翻译速度远超FP16版本。

双量化方案兼顾性能与体验:2-bit模型几乎无损

针对不同性能的手机用户,腾讯混元同时提供了2-bit量化方案。该方案采用拉伸弹性量化(SEQ)技术,将模型参数量化至{-1.5,-0.5,0.5,1.5},并结合量化感知蒸馏,在将模型体积压缩至574MB的同时,实现了几乎无损的翻译质量,效果依然超越上百GB的大模型。在支持Arm SME2技术的移动设备上,2-bit模型能够实现更快速、更高效的推理,平衡了性能与存储。

开源即用,小程序与Demo应用全面上线

本次开源不仅包含模型权重(1.8B及7B的原始版本以及FP8、Int4、GGUF等多种量化版本),腾讯混元还特别制作了实际可用的混元翻译Demo版,适配“后台取词模式”。用户无需联网、无需订阅,完全本地处理、不涉及个人信息采集和上传,一次下载永久使用。同时,腾讯混元正式上线微信小程序「腾讯Hy翻译」,进一步降低使用门槛,用户可随时随地享受高质量翻译服务。所有模型权重已在腾讯混元官网和Hugging Face、魔搭社区等平台开放下载,支持33个语种、1056个翻译方向的离线翻译。