魔搭社区开源了一种名为 OneLLM 的多模态对齐统一框架。该框架利用通用编码器和统一的投影模块与 LLM 对齐多模态输入。它支持图像、音频、视频等多种模态数据的理解,并在视频 - 文本、音频 - 视频 - 文本等任务中表现出较强的零样本能力。OneLLM 的开源代码已经发布在 GitHub 上,可以在该平台上获得相关模型权重和模型创空间。
相关推荐
几分钟拼出视频AI应用!开源框架VideoPipe让CV落地如搭积木般简单
VideoPipe是一款开源视频分析框架,专注于计算机视觉AI算法的快速集成与落地。其核心创新在于采用可组合的管线设计,将复杂任务模块化,帮助开发者简化底层编码,聚焦业务逻辑,提升开发效率。
2025年12月29号 9:42
184.5k
阿里重磅开源AgentScope 1.0:智能体开发全链路革新
阿里巴巴云智能集团发布AgentScope1.0智能体开发框架,具备实时介入控制、智能上下文管理和高效工具调用能力。该框架采用模块化设计和三层技术架构,提供从开发、部署到监控的全流程支持,显著提升智能体应用的开发效率与生产稳定性。
2025年9月3号 16:36
248.3k
Youtu-Agent 智能体框架正式开源,引领 AI 发展新潮流
腾讯优图实验室开源Youtu-Agent框架,专为构建、运行和评估自主AI智能体设计。该框架模块化、高性能,支持开源模型集成,在数据分析、文件处理等任务中表现优异,有望重塑AI智能体开发格局。
2025年9月2号 14:57
218.2k
通义实验室推出新一代智能体开发框架AgentScope 1.0
通义实验室推出新一代智能体开发框架AgentScope1.0,以开发者为中心,专注多智能体开发,解决构建、运行和管理难题。该框架提供覆盖开发、部署和监控的全生命周期解决方案,采用三层技术架构,包括核心框架和Runtime,旨在简化并提升智能体应用开发的安全性和效率。
2025年9月2号 11:55
187.2k
腾讯旗下InstantCharacter框架正式开源 可高度个性化任何角色
近日,腾讯旗下InstantCharacter框架正式开源,为AI驱动的角色定制领域带来突破性进展。据AIbase了解,该框架能够基于单张图像与文本提示生成高一致性的自定义角色,支持多样化的姿势、风格与场景生成。InstantCharacter以其在角色一致性、图像质量及开放域灵活性上的出色平衡,迅速成为开源社区的焦点。项目现已在GitHub与Hugging Face平台上线,供全球开发者免费探索与应用。核心创新:三维平衡与高保真生成InstantCharacter是首个成功平衡角色一致性、图像质量和开放域通用性的框架,其核心优
2025年4月18号 11:56
656.9k
