正文

騰訊揭祕：Agent數量越多，大語言模型效果越好

發布於AI新閒資訊

時間 :Feb 28, 2024

閱讀 :1分鐘

騰訊的研究者們發現，大語言模型的性能會隨着實例化agent數量的增加而增強，無需複雜的多LLM agents協作框架。實驗結果顯示多個小LM集成可以超越較大LM的性能。論文探討了性能提升與問題難度之間的關係，並提出了逐步採樣和投票、分層採樣和投票兩種優化策略。

AI 也會 “腦損傷”？研究揭示低質量數據對大語言模型的影響

研究發現，大語言模型持續接觸低質量數據（如社交媒體內容）後，會出現類似人類“腦損傷”的現象，導致推理能力下降23%，長上下文記憶能力下降30%。這種損傷不可逆，即使後續用高質量數據訓練也無法完全恢復。

圖靈獎得主Yann LeCun與Meta在AI發展方向上出現分歧。作爲Meta首席AI科學家，他近期公開質疑大語言模型是“死衚衕”，主張轉向“世界模型”研究。其離職傳聞引發關注，他曾領導基礎AI研究部門FAIR，被視爲公司核心智囊。

OpenAI推出GPT-5.1模型，升級ChatGPT爲更靈活、響應快速的個性化數字助理。新模型提升響應速度和語言清晰度，引入自適應對話風格，提供更溫暖、精確的交互體驗，強調答案准確性和嚴格性。

Firefox新版默認開啓AI功能引發爭議，用戶擔憂隱私與性能問題。測試顯示啓用後CPU和內存佔用顯著增加，影響瀏覽體驗，且多數用戶不知情。

研究發現，AI生成的社交媒體帖子容易被人類識別，準確率達70%-80%，遠超隨機水平。研究團隊測試了多個大語言模型，揭示其在內容識別方面的不足。

智啟未來，您的人工智能解決方案智庫