4月29日,騰訊混元團隊宣佈正式開源其極限量化壓縮版的翻譯模型——Hy-MT1.5-1.8B-1.25bit。這款模型最大的亮點在於,它將支持33種語言的翻譯能力精準壓縮到了440MB左右,這意味着即便是存儲空間緊湊的移動設備,也能在完全不聯網的狀態下實現高質量的實時翻譯。

image.png

極致壓縮:手機內存的“減負”革命

這一成果源於騰訊此前發佈的專業翻譯大模型Hy-mt1.5。原始的1.8B模型在常規精度下需要佔用約3.3GB的內存,這對於手機端運行而言無疑是沉重的負擔。爲了解決這一痛點,研發團隊採用了極致的量化壓縮技術,將參數表達由16位(16-bit)降至最低1.25位。

通俗來講,這一過程類似於在不損失關鍵細節的前提下,將一張4K高清大圖壓縮成體積極小的微縮圖。針對不同性能的設備,騰訊此次同步推出了2-bit和1.25-bit兩種量化方案,確保模型在“瘦身”後依然能夠保持卓越的語義理解能力。

性能實測:斷網狀態下的翻譯質量超越主流競品

雖然體積大幅縮小,但在性能表現上並未縮水。根據官方公佈的評測數據,這款1.8B參數級的輕量模型在多個基準測試中,翻譯質量已經能夠比肩甚至超越谷歌翻譯等主流商業系統,甚至在某些維度上可以與千億級(235B)的大型模型抗衡。

image.png

目前,該模型已原生支持包括中、英、日、法、俄、阿拉伯語在內的33種語言,並涵蓋了藏語、蒙古語等少數民族語言。此外,它還支持5種方言及民漢互譯,總計翻譯方向高達1056個,極大地拓寬了離線翻譯的應用邊界。

深度集成:隱私安全與便捷體驗並重

除了單純的權重開源,該技術已在實際場景中展現出極高的實用價值。在最新適配的演示版本中,該模型支持“後臺取詞模式”,無論用戶是在離線閱讀郵件還是瀏覽本地網頁,翻譯功能都能即喚即用。

值得關注的是,由於翻譯過程完全在本地設備運行,不涉及任何個人隱私信息的上傳或雲端採集,這爲對數據安全有極高要求的用戶提供了可靠保障。目前,該翻譯能力已在騰訊內部的會議系統、辦公軟件及瀏覽器等多個核心業務場景中落地應用。

爲了方便開發者和技術愛好者體驗,相關模型已在Huggingface及魔搭社區同步上線。這標誌着高精度翻譯技術正加速從雲端走向終端,讓翻譯服務真正成爲隨身攜帶、觸手可及的基礎工具。