腾讯混元全新翻译模型 Hy-MT2 开源:可在手机端本地部署,最小仅 440MB

五一出国自驾,遇到警察临检却突然没信号,手机翻译软件转圈圈——这种尴尬场景或许将成为历史。4月29日,腾讯混元推出极致量化压缩版本翻译模型Hy-MT1.5-1.8B-1.25bit,把支持33种语言的翻译大模型压缩至440MB,无需联网、下载即用,直接在手机本地运行,翻译效果甚至优于谷歌翻译。

33种语言、1056个翻译方向,1.8B参数比肩百亿级模型

Hy-MT1.5是腾讯混元团队打造的专业翻译大模型,原生支持33种语言、5种方言/民汉及1056个翻译方向。从常见的中英互译,到法语、日语、阿拉伯语、俄语,甚至藏语、蒙古语等少数民族语言,它都能游刃有余地处理。

腾讯混元全新翻译模型 Hy-MT2 开源:可在手机端本地部署,最小仅 440MB

仅以1.8B参数量,Hy-MT1.5实现了比肩商业翻译API和235B级大模型的翻译效果。在严格的评测基准中,其翻译质量不仅超越了谷歌翻译等主流系统,更证明了在高效优化下,轻量级模型能够迸发出令人印象深刻的翻译能力。但原始的1.8B模型即使在FP16精度下,依然占用3.3GB内存,对于手机而言依然太大、太慢,因此需要量化压缩。

两种极致量化方案:2-bit保质量,1.25-bit压至440MB

量化压缩就像把高清照片压缩成缩略图,文件小了但内容依然可辨。针对不同手机用户,腾讯特别推出了2-bit与1.25-bit两种极致量化方案。

  • 2-bit模型:性能与质量的平衡(适用中高端机型)
    采用业内顶尖的拉伸弹性量化(SEQ),将模型参数量化至{-1.5,-0.5,0.5,1.5},结合量化感知蒸馏,在将模型体积压缩至574MB的同时实现几乎无损的翻译质量,效果超越上百GB的大模型。在支持Arm SME2技术的移动设备上,能实现更快速、更高效的推理。

  • 1.25-bit模型:Sherry极致压缩(适用全系机型)
    基于已被NLP顶级学术会议ACL 2026收录的Sherry(稀疏高效三值量化) 技术,核心逻辑是“细粒度稀疏”:每4个模型参数中,3个最重要的用1-bit储存,1个用0储存,平均每个参数仅需1.25-bit。配合腾讯专门为手机CPU设计的STQ内核,完美适配SIMD指令集。最终,3.3GB的原始模型被进一步压缩至440MB,轻松常驻后台,让内存紧张的普通手机也能顺滑进行高质量离线翻译。

开源即用:Demo版支持后台取词,完全本地隐私安全

本次开源不仅包含模型权重,官方还特别制作了一个实际可用的腾讯混元翻译Demo版,特别适配了“后台取词模式”。无论是在本地查看邮件还是浏览网页,混元翻译都能随叫随到。无需网络,无需订阅,完全本地处理、不涉及个人信息的采集和上传,一次下载永久使用!

所有模型权重和Demo应用已同步开源至Hugging Face与魔搭社区,开发者可直接下载使用: