相關推薦
顧全全確認離職字節Seed團隊,曾主導SeedFold與Seed2.0訓練體系建設
字節跳動Seed團隊核心研究員顧全全確認離職,其在社交平臺發文回顧了三年間在AI藥物發現和大語言模型預訓練領域的研究成果。她主導研發的生物分子結構預測模型SeedFold在多個公開基準測試中表現優異。此次離職正值字節AI業務加速商業化,引發外界對AI for Science創業熱潮的關注。
Jun 8, 2026
225.7k
告別單輪傻瓜問答!雲知聲發佈原生智能體大模型U2,自主攻克百步複雜工作流
生成式人工智能正從聊天工具向“超級數字員工”進化。6月8日,雲知聲發佈新一代通用大模型U2,專爲個人、開發者及企業設計。它突破傳統單輪對話侷限,聚焦高智能密度與高Token價值,提升實際交付能力。
Jun 8, 2026
175.2k
騰訊與人大高瓴聯合推出開源規劃評測框架 PlanningBench
騰訊混元團隊與中國人民大學等機構聯合開源了PlanningBench,這是一個用於評測和訓練大語言模型規劃能力的框架。它系統化地抽象了任務、約束和難度,覆蓋30多種規劃任務類型,支持數據生成與驗證,旨在評估模型的實際規劃能力。
Jun 5, 2026
333.5k
GPT 5.5 稱霸 AI 漏洞挑戰,DeepSeek 斬獲“性價比之王”
安全研究員Kasra Rahjerdi通過構建含漏洞的圖書評論應用,測試主流大語言模型的安全推理能力。他故意暴露谷歌移動端後端服務憑據,要求模型解包並識別以訪問數據庫。在每場2小時、預算10美元的嚴格條件下,評估了頂尖模型的表現。
Jun 4, 2026
276.3k
GPT-5. 5 拿下利用率冠軍,DeepSeek V4 Pro斬獲性價比之王!大模型網絡安全攻防實測報告出爐
大語言模型在網絡安全領域的推理能力正面臨嚴峻考驗。安全研究員Kasra Rahjerdi通過構建含有核心漏洞的圖書評論APK,對主流大模型進行模擬黑客攻擊測試,揭示其安全推理與漏洞利用的真實水平。測試限時2小時、單次預算10美元,直觀展現了各模型在複雜邏輯挑戰中的表現。
Jun 4, 2026
296.1k
