騰訊混元大模型在中文多模態大模型SuperCLUE-V測評基準8月榜單中表現卓越,榮獲國內大模型排名第一,位於卓越領導者象限。多模態理解,即模型需準確識別圖像元素、理解其關係,並生成自然語言描述,考驗了模型對圖像識別的精確度及對複雜現實世界的理解力。

此次測評包括了12個國內外具有代表性的多模態理解大模型,評估內容包括基礎能力和應用能力兩大方向。騰訊混元大模型在這兩方面均展現出綜合優勢,獲得71.95的高分。SuperCLUE的評估標準涵蓋理解準確性、迴應相關性和推理深度等,確保了評估的科學性和公正性。

微信截圖_20240808103707.png

評測結果顯示,國內大模型在多模態理解的基礎能力上已接近海外頂尖模型,騰訊混元大模型在應用能力上表現尤爲突出,得益於對中文語境的深刻理解及多領域的綜合能力。

騰訊混元大模型的技術底座支持AI原生應用騰訊元寶,使其具備多模態理解能力,能夠理解並分析多種類型圖片。此外,騰訊混元多模態模型已在騰訊雲上線,提供圖片生文等能力,供企業及個人開發者調用。

騰訊公司副總裁蔣傑表示,混元大模型正在向全模態技術發展,用戶將很快能在騰訊元寶App和騰訊內部業務中體驗到相關技術,並通過騰訊雲向外部應用開放。目前,騰訊混元大模型已擴展至萬億級參數規模,採用混合專家模型(MoE)結構,多模態理解能力達到國內領先水平。