正文

崑崙萬維：多模態大模型已進入實驗性訓練階段

發布於AI新閒資訊

時間 :Aug 31, 2023

閱讀 :1分鐘

崑崙萬維表示其多模態大模型 “天工” 已進入實驗性訓練階段，經過持續的迭代和高負荷的運行。手機端天工 AI 助手已上線內測，用戶可進行萬字以上的文本對話交互。

崑崙萬維把 2026 定爲世界模型元年：Matrix-Game 3. 5 單卡實時生成，5B模型跑出20FPS

崑崙萬維在WAIC上宣佈2026爲世界模型元年，發佈Matrix-Game3.5等三款新品。該模型引入Patch級記憶注入，可調用畫面片段記憶，推動交互實時化。

NVIDIA推出統一音頻-文本大模型Audex，基於純文本MoE架構，採用單一Transformer，解決多模態模型音頻增強導致文本邏輯下降的難題，實現高效音頻理解與文本能力的平衡。

谷歌DeepMind的文生視頻模型Gemini Omni Flash在權威盲測排行榜Video Arena中以1404Elo分躍居第一，彰顯谷歌多模態技術實力，也印證視頻生成領域正高速迭代。

崑崙萬維發佈天工3.2版，推出Skywork Tags功能，針對頻繁切換窗口搬運數據導致效率下降的痛點。其核心邏輯是不改變團隊既有協作流程，直接將AI智能體接入Slack、飛書、釘釘、Discord、Telegram等現有辦公羣組，讓智能體無縫融入工作場景。

商湯科技正祕密研發多模態大模型“U1Pro”，面向設計場景，由首席科學家林達華牽頭。該模型隸屬“日日新”家族，目標對標OpenAI的GPT-Image2，強調長程邏輯與思考能力，預計7月啓動內測並商用。

智啟未來，您的人工智能解決方案智庫