阿里巴巴近日推出了一款名爲QVQ-72B的全新多模態推理模型,該模型基於Qwen2-VL-72B構建,融合了強大的語言和視覺能力,能夠處理更爲複雜的推理和分析任務,標誌着阿里巴巴在多模態AI領域取得了新的突破。



阿里巴巴近日推出了一款名爲QVQ-72B的全新多模態推理模型,該模型基於Qwen2-VL-72B構建,融合了強大的語言和視覺能力,能夠處理更爲複雜的推理和分析任務,標誌着阿里巴巴在多模態AI領域取得了新的突破。


商湯科技發佈並開源日日新SenseNova U1系列模型,基於自研NEO-unify架構,實現多模態理解、推理與生成的深度統一,標誌着從“集成式”向“原生統一”的跨越。該架構摒棄拼接式設計,去除視覺編碼器和變分自編碼器,提升了模型效率與性能。
OpenAI計劃將視頻生成器Sora整合進ChatGPT,以拓展多模態AI佈局,強化視頻創作能力,推動用戶增長。目前ChatGPT周活約9.2億,距10億目標尚有差距。Sora的接入有望吸引短視頻和視覺創作用戶,應對谷歌Veo和Meta的競爭。
中國AI產業崛起,全球調用量首超美國。OpenRouter數據顯示,2026年2月中國AI大模型周調用量超越美國,標誌應用落地取得突破。
三星宣佈將於2026年推出下一代AR眼鏡,核心亮點是從“顯示”轉向“理解”,強調多模態AI體驗,實現AI與現實環境的深度交互,提供更直觀的智能輔助。
三星確認其下一代AR眼鏡將於2026年面世,定位爲“多模態AI載體”。核心賣點在於深度沉浸的多模態AI體驗,通過結合語音、視覺等多種交互方式,提供智能輔助功能。