正文

騰訊混元推出首個產業級2Bit端側模型:0.3B體量實現性能逆襲

發布於AI新閒資訊

時間 :Feb 10, 2026

閱讀 :1分鐘

大模型落地端側的“減脂增肌”迎來重大突破。騰訊混元今日正式發佈面向消費級硬件的極小模型 HY-1.8B-2Bit。該模型通過首個產業級2Bit 量化方案，將等效參數量精簡至 0.3B，內存佔用僅約 600MB，體積甚至小於部分常用的手機應用。

技術突破:2Bit量化的“不可能任務”

在模型部署中，量化位數越低，精度損失通常越大。爲攻克這一難題，騰訊混元團隊放棄了傳統的 PTQ（後量化）策略，轉而採用 量化感知訓練（QAT），並結合數據優化、彈性拉伸量化及策略創新。

實驗數據表明，HY-1.8B-2Bit 在數學、代碼及科學等核心指標上，表現已能與4Bit PTQ 模型版本持平。這意味着在大幅壓縮體積的同時，模型依然保持了極強的“全科能力”。

性能表現:生成速度翻倍，適配多種硬件

得益於極致的壓縮，該模型在真實端側設備上的生成速度對比原始精度模型提升了 2—3倍。具體表現如下:

MacBook M4: 在1024輸入內，首字時延實現 3~8倍 加速，生成速度保持2倍以上穩定提升。
天璣9500: 對比 Q4格式，首字時延加速 1.5~2倍，生成速度加速約 1.5倍。
全思考能力: 沿用 Hunyuan-1.8B-Instruct 的長短思維鏈能力，用戶可根據任務複雜度靈活切換。

未來佈局

目前，該模型已提供 GGUF-int2 格式權重，並在 Arm SME2 技術平臺上完成適配，可廣泛應用於手機、耳機及智能家居等對離線部署和隱私有極高要求的場景。騰訊混元表示，未來將通過強化學習與模型蒸餾，進一步縮小低比特模型與全精度模型的能力差距。

AI 版“App Store”來了？亞馬遜入局內容授權市場：出版商向大模型“收租”時代開啓

亞馬遜計劃推出AI內容市場，讓出版商直接向科技公司出售內容版權，以解決大模型訓練數據版權糾紛，推動內容授權正規化。

Feb 10, 2026

92.7k

算力不夠，友商來湊？Kimi 官宣迴應“宕機”：正在找算力，急用先去 DeepSeek

大模型算力爭奪戰現江湖義氣。月之暗面旗下Kimi因高峯時段算力不足，頻繁提示用戶切換至快速模式或升級會員，坦誠迴應算力告急問題。

Feb 10, 2026

146.0k

ChatGPT 免費版要看廣告了！OpenAI 開啓創收模式，競爭對手 Anthropic 隔空“補刀”

OpenAI爲應對高昂運營成本，開始在美國測試ChatGPT免費版及低價套餐的廣告植入，用戶需觀看贊助內容以換取免費服務。公司坦言尚未盈利，此舉旨在探索商業化路徑。

Feb 10, 2026

132.9k

登頂AI智商基準測試：Claude Opus 4.6 強勢超車 GPT-5.2

Anthropic的Claude Opus4.6在最新Artificial Analysis智能指數中登頂，憑藉在編程、代理任務和科學推理等十項測試中的卓越表現，尤其在代理工作、終端編程和物理研究課題上領先。儘管其運行成本略高於OpenAI GPT-5.2，但效率表現突出，標誌着大模型競爭格局的新變化。

Feb 9, 2026

179.9k

用層已死？美圖吳欣鴻：深耕高價值垂直場景，應用與大模型共生

美圖CEO吳欣鴻迴應“大模型吞噬應用”擔憂，認爲通用大模型與垂直應用是協同而非競爭關係。他將大模型比作“瑞士軍刀”，通用但效率有限；應用則是“專業刀具”，精準解決剛需。應用護城河在於深度挖掘垂直場景，滿足長尾需求，佔據用戶。

Feb 5, 2026

146.9k

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

騰訊混元推出首個產業級2Bit端側模型:0.3B體量實現性能逆襲

技術突破:2Bit量化的“不可能任務”

性能表現:生成速度翻倍，適配多種硬件

未來佈局

相關推薦

AI 版“App Store”來了？亞馬遜入局內容授權市場：出版商向大模型“收租”時代開啓

算力不夠，友商來湊？Kimi 官宣迴應“宕機”：正在找算力，急用先去 DeepSeek

ChatGPT 免費版要看廣告了！OpenAI 開啓創收模式，競爭對手 Anthropic 隔空“補刀”

​登頂AI智商基準測試：Claude Opus 4.6 強勢超車 GPT-5.2

用層已死？美圖吳欣鴻：深耕高價值垂直場景，應用與大模型共生

登頂AI智商基準測試：Claude Opus 4.6 強勢超車 GPT-5.2