2026年3月12日,xAI正式發佈新一代大語言模型Grok4.20Beta,該模型在保持價格競爭力的同時,憑藉極高的事實可靠性刷新了行業紀錄。

根據Artificial Analysis最新評估,Grok4.20在啓用推理功能的智能指數(Intelligence Index)中獲得48分,較前代版本提升6分。儘管在綜合基準測試中仍與Gemini3.1Pro PreviewGPT-5.4(均爲57分)存在差距,但其在AA全知測試中的表現極爲出色,非幻覺率高達78%,有效解決了AI模型普遍存在的虛假信息編造問題。

QQ20260313-091756.jpg

在產品矩陣與工程參數方面,xAI同步推出了帶推理功能、不帶推理功能以及多智能體模式的三種API版本。該模型支持高達200萬個令牌的上下文窗口,其定價策略極具市場滲透力,每百萬令牌成本僅爲2美元至6美元,較Grok4顯著降低。技術層面,Grok4.20在面對未知領域時表現出極強的剋制力,承認“不知道”的頻率大幅提升,錯誤率僅約爲五分之一。

Grok、馬斯克、xAI

當前全球大模型競爭已從單純的參數規模轉向推理深度與事實準確性的雙重博弈。Grok4.20的推出,標誌着xAI在追求通用人工智能(AGI)的過程中,正試圖通過強化“誠實性”與“低幻覺率”來構建差異化優勢。這種對事實可靠性的極致追求,不僅提升了AI在嚴謹行業應用中的落地潛力,也爲未來多智能體協同協作提供了更爲穩固的信息信任基礎。