正文

拒絕“一問一答”：京東開源實時視頻交互模型 JoyAI-VL-Interaction

發布於AI新閒資訊

時間 :Jun 22, 2026

閱讀 :1分鐘

在人工智能邁向實時交互的浪潮中，京東正式開源了其核心成果——實時視頻視覺語言交互模型 JoyAI-VL-Interaction。作爲全球首個全棧開源的交互式視覺模型，該系統不僅獲得了 vLLM-Omni 的深度支持，更標誌着 AI 助手正式從傳統的“被動響應”轉向“邊看邊說”的自主觀察模式。

相比於過去需要等待用戶提問纔開始處理畫面的滯後模式，JoyAI-VL-Interaction 展現出了極高的主動性。它具備持續觀察視頻流的能力，能夠智能判斷何時應當介入交流，何時應當保持沉默，從而在互動中提供更加自然、流暢的體驗。

這種實時響應能力的提升，對於處理動態信息至關重要。傳統的視頻理解技術往往受限於“先上傳、後分析”的流程，在實時性要求極高的安防監控、直播解說或操作指導等場景中，往往難以滿足需求。JoyAI-VL-Interaction 能夠面向正在發生的視頻流進行即時處理，真正實現了畫面變化與智能響應的同步。

更具技術亮點的是其“後臺委託”機制。在面對生成代碼、複雜推理或工具調用等高難度任務時，模型可以靈活地將任務分流給後臺的 Agent 系統，而前臺模型則繼續保持對現場的實時觀察。這種“觀察與交互”並行的工作流，使得 AI 助手在執行復雜邏輯的同時，依然能維持與用戶的無縫溝通。

在兼容性與擴展性方面，該模型支持攝像頭、直播流及各類監控信號等多種視頻輸入源，並允許開發者根據業務需求，靈活替換 ASR、TTS、長期記憶模塊或外部 API 接口。

根據京東公佈的盲評測試數據，在涵蓋監控預警、實時翻譯、時間感知等58個流式場景的真人測評中，JoyAI-VL-Interaction 的表現相當出色，其總體勝率不僅大幅領先同類產品，更在複雜視覺觸發的交互中展現了顯著優勢。無論是針對科研探索，還是面向安防監控、電商導購、AI 眼鏡等產業級應用，這一開源方案都爲開發者提供了一套極具競爭力的技術基座。

騰訊Marvis馬維斯iOS版正式上線，實現全平臺覆蓋與桌面級遠控

騰訊系統級AI助手Marvis iOS版上架App Store，補全移動端拼圖。至此，安卓、Windows、macOS及iOS全端覆蓋，通過多端賬號互通強化跨設備協同。其核心優勢是打破系統壁壘，支持安卓與Mac、iOS與Windows等異構生態互聯，實現跨端無縫銜接。

Jun 25, 2026

182.6k

豆包正式上線三檔付費訂閱服務:最高500元/月，整體接入2.1系列大模型

6月24日，字節跳動旗下AI助手豆包正式上線付費訂閱服務，分爲標準版68元/月、加強版200元/月、高級版500元/月，接入豆包2.1大模型，性能顯著提升，免費用戶使用不受影響。定價較全球主流AI服務具本土優勢，標誌國內大模型應用商業化啓程。

Jun 24, 2026

191.9k

微信灰度上線原生AI助手，大模型全面激活國民級應用生態

微信全新原生AI助手“小微”開啓灰度內測，界面以左上角圖標入口呈現對話窗口。支持文字或語音指令直接操控微信原生功能、調起小程序，如代發好友消息等，是微信深度融合AI能力的低調嘗試。

Jun 22, 2026

190.2k

Meta旗下視頻編輯應用Edits推出AI創作助手與桌面版

Meta公司在洛杉磯創作者活動上預覽了短視頻編輯應用Edits的重大升級，將推出AI助手和桌面版。該應用對標字節跳動的CapCut，旨在通過全平臺覆蓋和智能創作賦能，深度綁定Instagram內容生態。AI助手可打通創作者後臺數據，分析視頻觀看量等關鍵指標，幫助優化內容策略，吸引更多新用戶。

Jun 12, 2026

190.1k

歐盟 Meta 解除對 AI 競爭者的 WhatsApp 接入限制

歐盟委員會近日採取措施，要求Meta恢復WhatsApp的通用AI助手免費權限，以保護AI市場發展並防止不可逆損害。此前，Meta自2025年12月起被調查反壟斷問題，因其限制其他AI服務商訪問WhatsApp平臺，僅允許自家AI使用。歐盟初步證據顯示Meta可能違反競爭法規，並於2026年2月發佈異議聲明，強調可能需進一步行動。

Jun 10, 2026

177.9k

智啟未來，您的人工智能解決方案智庫