騰訊開源超輕量離線翻譯模型，手機端運行僅需0.4GB內存

4月29日，騰訊混元團隊宣佈正式開源其極限量化壓縮版的翻譯模型——Hy-MT1.5-1.8B-1.25bit。這款模型最大的亮點在於，它將支持33種語言的翻譯能力精準壓縮到了440MB左右，這意味着即便是存儲空間緊湊的移動設備，也能在完全不聯網的狀態下實現高質量的實時翻譯。

這一成果源於騰訊此前發佈的專業翻譯大模型Hy-mt1.5。原始的1.8B模型在常規精度下需要佔用約3.3GB的內存，這對於手機端運行而言無疑是沉重的負擔。爲了解決這一痛點，研發團隊採用了極致的量化壓縮技術，將參數表達由16位（16-bit）降至最低1.25位。

通俗來講，這一過程類似於在不損失關鍵細節的前提下，將一張4K高清大圖壓縮成體積極小的微縮圖。針對不同性能的設備，騰訊此次同步推出了2-bit和1.25-bit兩種量化方案，確保模型在“瘦身”後依然能夠保持卓越的語義理解能力。

雖然體積大幅縮小，但在性能表現上並未縮水。根據官方公佈的評測數據，這款1.8B參數級的輕量模型在多個基準測試中，翻譯質量已經能夠比肩甚至超越谷歌翻譯等主流商業系統，甚至在某些維度上可以與千億級（235B）的大型模型抗衡。

目前，該模型已原生支持包括中、英、日、法、俄、阿拉伯語在內的33種語言，並涵蓋了藏語、蒙古語等少數民族語言。此外，它還支持5種方言及民漢互譯，總計翻譯方向高達1056個，極大地拓寬了離線翻譯的應用邊界。

除了單純的權重開源，該技術已在實際場景中展現出極高的實用價值。在最新適配的演示版本中，該模型支持“後臺取詞模式”，無論用戶是在離線閱讀郵件還是瀏覽本地網頁，翻譯功能都能即喚即用。

值得關注的是，由於翻譯過程完全在本地設備運行，不涉及任何個人隱私信息的上傳或雲端採集，這爲對數據安全有極高要求的用戶提供了可靠保障。目前，該翻譯能力已在騰訊內部的會議系統、辦公軟件及瀏覽器等多個核心業務場景中落地應用。

爲了方便開發者和技術愛好者體驗，相關模型已在Huggingface及魔搭社區同步上線。這標誌着高精度翻譯技術正加速從雲端走向終端，讓翻譯服務真正成爲隨身攜帶、觸手可及的基礎工具。

調用量火爆致算力承壓，WorkBuddy 完成騰訊混元 Hy3 模型緊急擴容