6月5日,在2026AI產業應用大會上,騰訊雲音視頻正式發佈AI原生能力底座WAND。 依託超過20年的技術積累,騰訊雲音視頻此次從底層模型、媒體能力到接入方式進行全面升級,音視頻媒體AI能力將以Agent-Native模式向行業開放,實現了從提供單點媒體處理能力向面向AI應用與Agent的原生媒體底座的戰略升級

WAND架構由模型引擎、能力層和場景方案三層構成,包含編解碼、增強、擦除、生成、理解、音頻六大自研媒體專用模型,補充了主流生成式大模型在媒體生產流程中的不足

WAND能力架構圖
在真實業務中,WAND展現出高適配與高效率優勢
此外,面對高併發、極低延遲要求的賽事直播場景,WAND通過自研模型協同調度,將識別、生成、合成、編碼整合爲全自動化流程,相較傳統方案可節省超50%的碼率,已累計支撐數千場全球頂級賽事
作爲連續11次保持中國及出海市場份額第一的領跑者,騰訊雲音視頻此舉正加速音視頻能力成爲可被Agent統一調度的生產級工具,全面賦能AI Agent時代的視聽應用創新
