近日,埃隆・馬斯克創辦的 xAI 公司宣佈推出 Grok4.1,這是對現有 Grok4模型的一次升級。此次更新帶來了兩款新模型,分別爲 Grok4.1和 Grok4.1Thinking,這兩款模型均可免費使用,但付費用戶的使用限制會較少。

據 xAI 表示,Grok4.1在生成內容時的 “幻覺” 現象發生概率降低了三倍,相較於之前的版本,這使得 Grok4.1成爲 xAI 迄今爲止最佳的發佈版本之一。然而,目前尚不清楚 Grok4.1在性能上與其競爭對手,如最新發佈的 GPT5.1相比如何,後者在情感智力和性能方面有所提升。

根據 LMArena 的 Text Arena 工具提供的初步性能數據,Grok4.1(Thinking)和 Grok4.1在各項競爭測試中均表現優異。Text Arena 是一個開源工具,允許用戶通過並排、盲測和隨機化測試對不同的大型語言模型進行比較。
在最新的基準測試中,Grok4.1(Thinking)以1510的得分排名第一,而 Grok4.1則以1437的得分位列第19。根據測試平臺的反饋,相較於兩個月前推出的 Grok4Fast,這一版本的得分提升了40多分。
儘管 Grok4.1的升級值得關注,但可能並不是今年最強的模型。谷歌正在準備推出 Gemini3.0,預計這將是迄今爲止功能最強大的模型。

介紹:https://data.x.ai/2025-11-17-grok-4-1-model-card.pdf
劃重點:
🌟 Grok4.1推出,包含 Grok4.1和 Grok4.1Thinking 兩款模型,均可免費使用。
📉 新模型在生成內容時幻覺現象減少三倍,提高了內容生成的準確性。
🏆 初步基準測試顯示 Grok4.1(Thinking)獲得最佳評分,表現優於前一版本。
