相關推薦
微博推出 VibeThinker-1.5B,低成本 AI 模型挑戰大型語言模型
微博AI部門推出開源大模型VibeThinker-1.5B,擁有15億參數。該模型基於阿里Qwen2.5-Math-1.5B優化,在數學和代碼任務表現優異。現已在Hugging Face等平臺免費開放,遵循MIT許可證,支持商業使用。
Nov 13, 2025
161.1k
揭開MiniMax M2的神祕面紗:爲何選擇全注意力機制?
MiniMax M2模型採用全注意力機制,放棄線性或稀疏注意力技術。開發團隊認爲,儘管後者能節省計算資源,但全注意力在工業應用中更高效,能提升模型性能。這一決策旨在優化實際部署效果,推動AI技術發展。
Nov 6, 2025
167.6k
Meta 研究人員揭開大語言模型黑箱,修復 AI 推理缺陷
Meta與愛丁堡大學合作開發CRV技術,通過分析大型語言模型內部推理電路,預測其推理正確性並修復錯誤。該方法構建模型激活計算圖,高精度檢測推理錯誤,提升AI可靠性。
Oct 31, 2025
147.9k
應對模型推理缺陷:蘋果MIND團隊加緊招聘AI人才
蘋果公司正加緊招聘推理模型領域專家,以解決其研究揭示的大型語言模型重大缺陷。招聘聚焦開發更準確高效的新型架構,重點強化推理、規劃、工具使用和基於代理的LLM能力。
Oct 23, 2025
88.0k
AI 驅動的“數字孿生”解放工作效率:初創公司 Viven 獲3500萬美元種子輪融資,解決員工“不在場”痛點
人工智能初創公司Viven利用大型語言模型和數據隱私技術,打造員工數字孿生,解決因休假或時區差異導致的關鍵信息缺失問題,避免項目停滯,降低時間成本。
Oct 16, 2025
143.3k
