魔搭社區開源了一種名爲 OneLLM 的多模態對齊統一框架。該框架利用通用編碼器和統一的投影模塊與 LLM 對齊多模態輸入。它支持圖像、音頻、視頻等多種模態數據的理解,並在視頻 - 文本、音頻 - 視頻 - 文本等任務中表現出較強的零樣本能力。OneLLM 的開源代碼已經發布在 GitHub 上,可以在該平臺上獲得相關模型權重和模型創空間。
相關推薦
幾分鐘拼出視頻AI應用!開源框架VideoPipe讓CV落地如搭積木般簡單
VideoPipe是一款開源視頻分析框架,專注於計算機視覺AI算法的快速集成與落地。其核心創新在於採用可組合的管線設計,將複雜任務模塊化,幫助開發者簡化底層編碼,聚焦業務邏輯,提升開發效率。
Dec 29, 2025
184.5k
阿里重磅開源AgentScope 1.0:智能體開發全鏈路革新
阿里巴巴雲智能集團發佈AgentScope1.0智能體開發框架,具備實時介入控制、智能上下文管理和高效工具調用能力。該框架採用模塊化設計和三層技術架構,提供從開發、部署到監控的全流程支持,顯著提升智能體應用的開發效率與生產穩定性。
Sep 3, 2025
248.3k
Youtu-Agent 智能體框架正式開源,引領 AI 發展新潮流
騰訊優圖實驗室開源Youtu-Agent框架,專爲構建、運行和評估自主AI智能體設計。該框架模塊化、高性能,支持開源模型集成,在數據分析、文件處理等任務中表現優異,有望重塑AI智能體開發格局。
Sep 2, 2025
218.2k
通義實驗室推出新一代智能體開發框架AgentScope 1.0
通義實驗室推出新一代智能體開發框架AgentScope1.0,以開發者爲中心,專注多智能體開發,解決構建、運行和管理難題。該框架提供覆蓋開發、部署和監控的全生命週期解決方案,採用三層技術架構,包括核心框架和Runtime,旨在簡化並提升智能體應用開發的安全性和效率。
Sep 2, 2025
187.2k
騰訊旗下InstantCharacter框架正式開源 可高度個性化任何角色
近日,騰訊旗下InstantCharacter框架正式開源,爲AI驅動的角色定製領域帶來突破性進展。據AIbase瞭解,該框架能夠基於單張圖像與文本提示生成高一致性的自定義角色,支持多樣化的姿勢、風格與場景生成。InstantCharacter以其在角色一致性、圖像質量及開放域靈活性上的出色平衡,迅速成爲開源社區的焦點。項目現已在GitHub與Hugging Face平臺上線,供全球開發者免費探索與應用。核心創新:三維平衡與高保真生成InstantCharacter是首個成功平衡角色一致性、圖像質量和開放域通用性的框架,其核心優
Apr 18, 2025
672.7k
