相关推荐
NotebookLM升级支持图像导入 板书秒变可检索知识库
谷歌推出NotebookLM图像识别功能,支持上传板书、教材或表格图片,自动完成文字识别与语义分析,用户可直接用自然语言检索图片内容。该功能全平台免费,即将增加本地处理选项保护隐私。系统采用多模态技术,能区分手写与印刷体、解析表格结构,并与现有笔记智能关联。
2025年11月17号 10:16
155.4k
用一个密钥,打开全球AI的能力边界 ——我们正在打造面向未来的“全球AI聚合网关”
过去两年AI技术快速发展,ChatGPT和多模态模型推动变革,企业和开发者积极应用AI提升生产力。但实际落地面临四大挑战:模型接口标准不统一、成本管理复杂、数据安全合规要求高、混合模型调用缺乏统一管理。这些问题制约了AI的规模化应用。
2025年10月23号 11:53
494.8k
全面开源的 LLaVA-OneVision-1.5,超越 Qwen2.5-VL 的多模态模型登场
开源社区推出LLaVA-OneVision-1.5多模态模型,实现技术突破。该模型历经两年发展,从基础图文对齐升级为能处理图像、视频的综合框架,核心提供开放高效的可复现训练架构,支持用户便捷构建高质量视觉语言模型,训练过程分三个阶段推进。
2025年10月17号 10:08
164.8k
苹果即将在2025年国际计算机视觉大会亮相
苹果公司将在2025年10月檀香山举办的国际计算机视觉大会(ICCV)上展示八篇论文,聚焦多模态模型和视频生成等前沿技术,分享其在计算机视觉领域的最新研究成果。
2025年10月14号 14:38
93.5k
马斯克挖角 NVIDIA 核心团队,xAI 加速 “世界模型” 研发
马斯克旗下xAI公司正加速开发“世界模型”,以推动通用人工智能(AGI)发展。为此,公司从英伟达挖来两位核心研究员Zeeshan Patel和Ethan He,他们在Omniverse平台有重要贡献,将为xAI带来技术专长。
2025年10月13号 14:19
135.8k
