騰訊混元大模型：斬獲“圖生文”多模態理解國內大模型第一

騰訊混元大模型在中文多模態大模型SuperCLUE-V測評基準8月榜單中表現卓越，榮獲國內大模型排名第一，位於卓越領導者象限。多模態理解，即模型需準確識別圖像元素、理解其關係，並生成自然語言描述，考驗了模型對圖像識別的精確度及對複雜現實世界的理解力。

此次測評包括了12個國內外具有代表性的多模態理解大模型，評估內容包括基礎能力和應用能力兩大方向。騰訊混元大模型在這兩方面均展現出綜合優勢，獲得71.95的高分。SuperCLUE的評估標準涵蓋理解準確性、迴應相關性和推理深度等，確保了評估的科學性和公正性。

微信截圖_20240808103707.png

評測結果顯示，國內大模型在多模態理解的基礎能力上已接近海外頂尖模型，騰訊混元大模型在應用能力上表現尤爲突出，得益於對中文語境的深刻理解及多領域的綜合能力。

騰訊混元大模型的技術底座支持AI原生應用騰訊元寶，使其具備多模態理解能力，能夠理解並分析多種類型圖片。此外，騰訊混元多模態模型已在騰訊雲上線，提供圖片生文等能力，供企業及個人開發者調用。

騰訊公司副總裁蔣傑表示，混元大模型正在向全模態技術發展，用戶將很快能在騰訊元寶App和騰訊內部業務中體驗到相關技術，並通過騰訊雲向外部應用開放。目前，騰訊混元大模型已擴展至萬億級參數規模，採用混合專家模型（MoE）結構，多模態理解能力達到國內領先水平。

騰訊Hy3 編程評測出爐：參數只有對手五分之一，代碼能力卻與DeepSeek-V4-Pro打平

SuperCLUE公佈騰訊Hy3語言模型編程專項測評，與DeepSeek-V4-Pro等對比。Hy3爲MoE架構，總參數295B、激活僅21B，支持256K上下文，號稱混元最強。結果參數遠小卻表現意外出色，從四大維度評估兼顧性能與花銷，測評針對國內程序員日常寫代碼的真實場景。

滴滴全面接入微信AI生態，開啓自然語言召喚時代

滴滴出行核心網約車服務已全面接入微信AI生態，用戶無需跳轉至滴滴APP，僅通過微信內自然語言下達出行指令即可完成叫車。這得益於騰訊混元大模型與滴滴大數據、運力調度技術的深度耦合，系統自動識別目的地並一鍵下單，打破了傳統APP使用壁壘。

字節跳動發佈全模態大模型Doubao-Seed-2.0-lite，AI能聽會看還能直接“上手”幹活

字節跳動旗下火山引擎發佈豆包大模型家族首款全模態理解模型Doubao-Seed-2.0-lite，實現視頻、圖像、音頻與文本的原生統一理解，突破單一模態限制。該模型在視覺與邏輯推理能力上表現突出，尤其在物理、醫療等高階學科複雜推理測試中性能大幅超越現有水平，標誌着多模態交互領域的關鍵進展。

騰訊混元Hy3限免活動延期至8月5日，WorkBuddy和CodeBuddy用戶繼續免費使用