腾讯混元全新翻译模型 Hy-MT2 开源：可在手机端本地部署，最小仅 440MB

2 个月前

AI资讯

54 阅读

开源 [腾讯混元翻译模型本地部署]

五一出国自驾，遇到警察临检却突然没信号，手机翻译软件转圈圈——这种尴尬场景或许将成为历史。4月29日，腾讯混元推出极致量化压缩版本翻译模型Hy-MT1.5-1.8B-1.25bit，把支持33种语言的翻译大模型压缩至440MB，无需联网、下载即用，直接在手机本地运行，翻译效果甚至优于谷歌翻译。

33种语言、1056个翻译方向，1.8B参数比肩百亿级模型

Hy-MT1.5是腾讯混元团队打造的专业翻译大模型，原生支持33种语言、5种方言/民汉及1056个翻译方向。从常见的中英互译，到法语、日语、阿拉伯语、俄语，甚至藏语、蒙古语等少数民族语言，它都能游刃有余地处理。

腾讯混元全新翻译模型 Hy-MT2 开源：可在手机端本地部署，最小仅 440MB

仅以1.8B参数量，Hy-MT1.5实现了比肩商业翻译API和235B级大模型的翻译效果。在严格的评测基准中，其翻译质量不仅超越了谷歌翻译等主流系统，更证明了在高效优化下，轻量级模型能够迸发出令人印象深刻的翻译能力。但原始的1.8B模型即使在FP16精度下，依然占用3.3GB内存，对于手机而言依然太大、太慢，因此需要量化压缩。

两种极致量化方案：2-bit保质量，1.25-bit压至440MB

量化压缩就像把高清照片压缩成缩略图，文件小了但内容依然可辨。针对不同手机用户，腾讯特别推出了2-bit与1.25-bit两种极致量化方案。

2-bit模型：性能与质量的平衡（适用中高端机型）
采用业内顶尖的拉伸弹性量化（SEQ），将模型参数量化至{-1.5，-0.5，0.5，1.5}，结合量化感知蒸馏，在将模型体积压缩至574MB的同时实现几乎无损的翻译质量，效果超越上百GB的大模型。在支持Arm SME2技术的移动设备上，能实现更快速、更高效的推理。
1.25-bit模型：Sherry极致压缩（适用全系机型）
基于已被NLP顶级学术会议ACL 2026收录的Sherry（稀疏高效三值量化） 技术，核心逻辑是“细粒度稀疏”：每4个模型参数中，3个最重要的用1-bit储存，1个用0储存，平均每个参数仅需1.25-bit。配合腾讯专门为手机CPU设计的STQ内核，完美适配SIMD指令集。最终，3.3GB的原始模型被进一步压缩至440MB，轻松常驻后台，让内存紧张的普通手机也能顺滑进行高质量离线翻译。

开源即用：Demo版支持后台取词，完全本地隐私安全

本次开源不仅包含模型权重，官方还特别制作了一个实际可用的腾讯混元翻译Demo版，特别适配了“后台取词模式”。无论是在本地查看邮件还是浏览网页，混元翻译都能随叫随到。无需网络，无需订阅，完全本地处理、不涉及个人信息的采集和上传，一次下载永久使用！

所有模型权重和Demo应用已同步开源至Hugging Face与魔搭社区，开发者可直接下载使用：

1.25-bit模型Demo（APK）：Hugging Face / 魔搭社区
2-bit模型权重与GGUF文件：海内外镜像同步开放
Sherry论文：arXiv 2601.07892
技术报告：Hy-MT1.5 / AngelSlim

腾讯混元全新翻译模型 Hy-MT2 开源：可在手机端本地部署，最小仅 440MB

33种语言、1056个翻译方向，1.8B参数比肩百亿级模型

两种极致量化方案：2-bit保质量，1.25-bit压至440MB

开源即用：Demo版支持后台取词，完全本地隐私安全

链接失效反馈