正文

昆仑万维：多模态大模型已进入实验性训练阶段

发布于AI新闻资讯

发布时间 :2023年8月31号 16:27

阅读 :1分钟

昆仑万维表示其多模态大模型 “天工” 已进入实验性训练阶段，经过持续的迭代和高负荷的运行。手机端天工 AI 助手已上线内测，用户可进行万字以上的文本对话交互。

昆仑万维把 2026 定为世界模型元年：Matrix-Game 3. 5 单卡实时生成，5B模型跑出20FPS

昆仑万维在WAIC上宣布2026为世界模型元年，发布Matrix-Game3.5等三款新品。该模型引入Patch级记忆注入，可调用画面片段记忆，推动交互实时化。

NVIDIA推出统一音频-文本大模型Audex，基于纯文本MoE架构，采用单一Transformer，解决多模态模型音频增强导致文本逻辑下降的难题，实现高效音频理解与文本能力的平衡。

谷歌DeepMind的文生视频模型Gemini Omni Flash在权威盲测排行榜Video Arena中以1404Elo分跃居第一，彰显谷歌多模态技术实力，也印证视频生成领域正高速迭代。

昆仑万维发布天工3.2版，推出Skywork Tags功能，针对频繁切换窗口搬运数据导致效率下降的痛点。其核心逻辑是不改变团队既有协作流程，直接将AI智能体接入Slack、飞书、钉钉、Discord、Telegram等现有办公群组，让智能体无缝融入工作场景。

商汤科技正秘密研发多模态大模型“U1Pro”，面向设计场景，由首席科学家林达华牵头。该模型隶属“日日新”家族，目标对标OpenAI的GPT-Image2，强调长程逻辑与思考能力，预计7月启动内测并商用。

智启未来，您的人工智能解决方案智库