阿里通义实验室 XR 实验室开源了文生 3D 新模型,可以通过一句文本描述生成对应的 3D 模型及纹理。开源的模型包括 Text-to-ND 和 Text-to-ND-MV 两个大模型。通义实验室 XR 实验室开源了 Text-to-ND 的基础版本以及 Multi-View 版本,满足不同细粒度的算法开发需求。还同步开源了从大模型中蒸馏出(Score Distillation Sampling)3D 模型的优化代码,串联可以完成文本直接到 3D 模型的生成。
相关推荐
马斯克宣布将开源新版 X 算法,引发外界关注
马斯克宣布下周将开源X平台新版算法,涵盖内容推荐与广告推送的核心代码。此举旨在提升透明度,回应公众对社交媒体内容分发机制的关注。此前X平台开源代码已三年未更新。
2026年1月12号 9:33
137.7k
Meta Llama 4:从开源骄傲到丑闻频出,AI帝国的崩塌
Meta 的 Llama 4 项目被曝出数据“美化”丑闻,前首席科学家杨立昆承认团队为优化基准测试结果调整了数据。这一行为引发争议,暴露了 Meta 在 AI 技术发展中的管理偏差。此前,Llama 系列因开源策略备受认可,但此次事件可能影响其声誉。
2026年1月12号 9:18
162.0k
回应监管压力:马斯克宣布X平台将于一周内开源新版推荐算法
马斯克宣布X平台将在七天内开源最新推荐算法,以回应外界对内容推送逻辑的质疑。此举旨在公开决定内容与广告展示的核心代码。自2023年接手以来,平台曾部分公开代码库,但被指严重过时,现有文件大多停留在旧版本。
2026年1月12号 9:03
127.3k
Meta 推出开源应用 Spatial Lingo,让用户在真实场景中对话虚拟角色
Meta推出开源Unity应用Spatial Lingo,利用物体识别辅助语言学习。该应用基于Meta的SDK,通过虚拟角色引导用户用目标语言识别和描述现实环境中的物体,提供新颖有趣的学习体验。
2026年1月8号 10:17
163.0k
开源版“Veo 3”来了:LTX-2正式发布,一次性生成20秒4K音画同步AI视频,本地显卡轻松跑
Lightricks开源LTX-2模型,支持生成20秒4K高清视频,实现画面、声音、口型、环境音和音乐的完美同步。模型权重、训练代码、基准测试和工具包已全部开源,托管于GitHub,社区反响热烈。
2026年1月7号 16:26
374.8k
