相關推薦
大模型長文本迎來新突破,智譜AI正式開源旗艦模型GLM-5.2
智譜AI發佈新一代開源旗艦模型GLM-5.2,專攻長程任務,支持1M無損上下文,編程效率大幅提升。採用極寬鬆MIT協議,開發者和企業可自由下載、商用部署。
Jun 17, 2026
157.4k
顧全全確認離職字節Seed團隊,曾主導SeedFold與Seed2.0訓練體系建設
字節跳動Seed團隊核心研究員顧全全確認離職,其在社交平臺發文回顧了三年間在AI藥物發現和大語言模型預訓練領域的研究成果。她主導研發的生物分子結構預測模型SeedFold在多個公開基準測試中表現優異。此次離職正值字節AI業務加速商業化,引發外界對AI for Science創業熱潮的關注。
Jun 8, 2026
229.5k
告別單輪傻瓜問答!雲知聲發佈原生智能體大模型U2,自主攻克百步複雜工作流
生成式人工智能正從聊天工具向“超級數字員工”進化。6月8日,雲知聲發佈新一代通用大模型U2,專爲個人、開發者及企業設計。它突破傳統單輪對話侷限,聚焦高智能密度與高Token價值,提升實際交付能力。
Jun 8, 2026
179.9k
騰訊與人大高瓴聯合推出開源規劃評測框架 PlanningBench
騰訊混元團隊與中國人民大學等機構聯合開源了PlanningBench,這是一個用於評測和訓練大語言模型規劃能力的框架。它系統化地抽象了任務、約束和難度,覆蓋30多種規劃任務類型,支持數據生成與驗證,旨在評估模型的實際規劃能力。
Jun 5, 2026
349.4k
GPT 5.5 稱霸 AI 漏洞挑戰,DeepSeek 斬獲“性價比之王”
安全研究員Kasra Rahjerdi通過構建含漏洞的圖書評論應用,測試主流大語言模型的安全推理能力。他故意暴露谷歌移動端後端服務憑據,要求模型解包並識別以訪問數據庫。在每場2小時、預算10美元的嚴格條件下,評估了頂尖模型的表現。
Jun 4, 2026
265.2k
