騰訊的研究者們發現,大語言模型的性能會隨着實例化agent數量的增加而增強,無需複雜的多LLM agents協作框架。實驗結果顯示多個小LM集成可以超越較大LM的性能。論文探討了性能提升與問題難度之間的關係,並提出了逐步採樣和投票、分層採樣和投票兩種優化策略。
相關推薦
AI 也會 “腦損傷”?研究揭示低質量數據對大語言模型的影響
研究發現,大語言模型持續接觸低質量數據(如社交媒體內容)後,會出現類似人類“腦損傷”的現象,導致推理能力下降23%,長上下文記憶能力下降30%。這種損傷不可逆,即使後續用高質量數據訓練也無法完全恢復。
Nov 17, 2025
100.2k
圖靈獎得主 LeCun 退出 Meta:大模型是 “死路”,未來在於 “世界模型”
圖靈獎得主Yann LeCun與Meta在AI發展方向上出現分歧。作爲Meta首席AI科學家,他近期公開質疑大語言模型是“死衚衕”,主張轉向“世界模型”研究。其離職傳聞引發關注,他曾領導基礎AI研究部門FAIR,被視爲公司核心智囊。
Nov 17, 2025
140.5k
OpenAI重磅推出GPT-5.1:更快、更準、更具“人情味”的個性化AI助理
OpenAI推出GPT-5.1模型,升級ChatGPT爲更靈活、響應快速的個性化數字助理。新模型提升響應速度和語言清晰度,引入自適應對話風格,提供更溫暖、精確的交互體驗,強調答案准確性和嚴格性。
Nov 13, 2025
101.1k
Firefox 新版本被指AI 功能默認開啓,隱私與性能爭議不斷
Firefox新版默認開啓AI功能引發爭議,用戶擔憂隱私與性能問題。測試顯示啓用後CPU和內存佔用顯著增加,影響瀏覽體驗,且多數用戶不知情。
Nov 11, 2025
157.3k
研究揭示 AI 生成社交媒體內容易被識別,情感表達仍待提升
研究發現,AI生成的社交媒體帖子容易被人類識別,準確率達70%-80%,遠超隨機水平。研究團隊測試了多個大語言模型,揭示其在內容識別方面的不足。
Nov 10, 2025
124.6k
