相关推荐
微博推出 VibeThinker-1.5B,低成本 AI 模型挑战大型语言模型
微博AI部门推出开源大模型VibeThinker-1.5B,拥有15亿参数。该模型基于阿里Qwen2.5-Math-1.5B优化,在数学和代码任务表现优异。现已在Hugging Face等平台免费开放,遵循MIT许可证,支持商业使用。
2025年11月13号 9:14
189.1k
蚂蚁集团开源全球首个万亿参数大模型 Ring-1T-preview,代码生成能力超越 GPT-5
蚂蚁集团开源万亿参数推理大模型Ring-1T-preview,为全球首个开源万亿参数推理模型。预览版在自然语言推理表现突出,AIME25测试获92.6分,超越所有已知开源模型如Gemini2.5Pro,接近GPT-5的94.6分;CodeForces测试也成绩优异。
2025年9月30号 11:44
150.8k
百度推出 Qianfan-VL 模型 多尺寸模型满足不同场景需求
百度智能云千帆团队发布全新开源视觉理解模型Qianfan-VL,提供3B、8B和70B三种尺寸,满足企业多模态应用需求。模型经过深度优化,具备超强视觉理解能力,并针对OCR和教育等高频场景专项提升,实际应用表现优异。
2025年9月23号 9:33
138.7k
阿里云推出全球首个全模态 AI 模型 Qwen3-Omni,实现文本、图像、音频与视频的统一处理
阿里云发布全球首个原生端到端全模态AI模型Qwen3-Omni并开源。该模型支持文本、图像、音频、视频多模态输入,实现实时流式输出,响应迅速。通过文本预训练与多模态混合训练,Qwen3-Omni具备强大跨模态能力,在多个领域表现先进。
2025年9月23号 9:29
224.8k
DeepSeek-V3.1-Terminus 重磅发布:性能全面提升,深度推理能力显著增强
DeepSeek发布开源模型DeepSeek-V3.1-Terminus,修复了语言不一致和异常字符问题,优化了编程与搜索智能体性能。基准测试显示该模型在非智能体类任务中表现优异。
2025年9月23号 8:55
149.9k
