不卷性能卷“人品”：xAI 發佈 Grok 4.20，幻覺率創行業新低

在 AI 巨頭們瘋狂堆料、追逐跑分巔峯的當下，馬斯克旗下的 xAI 卻另闢蹊徑，試圖解決 AI 領域最令人頭疼的“一本正經胡說八道”問題。今日，xAI 正式發佈了 Grok4.20Beta。儘管在絕對智力跑分上它仍與頂級梯隊保持距離，但在“誠實度”這一關鍵指標上，它卻刷新了行業紀錄。

根據 Artificial Analysis 的最新評測，Grok4.20在推理模式下的智力指數分數爲48，雖然落後於和（兩者均爲57），但其在事實可靠性上的表現極其驚人:

爲了滿足不同層級的需求，xAI 此次推出了三種 API 變體:

推理模式（Reasoning）:犧牲速度換取深度邏輯思考，是此次打破幻覺記錄的核心。

標準模式（Non-reasoning）:側重於快速響應與常規交互。

多智能體模式（Multi-agent）:支持多個 AI 實例協同處理複雜任務。

除了性能上的獨特性，Grok4.20在商業邏輯上也極具攻擊性:

Grok4.20的發佈反映出 xAI 戰略的轉變——不再執着於在通往 AGI 的總分跑道上死磕，而是精準切入“企業級可靠性”這一痛點。正如測評機構所言，如果說其他模型是在努力成爲“全知全能的先知”，那麼 Grok4.20則在努力成爲一個“絕不撒謊的助手”。

對於那些對數據準確性有極高要求的用戶來說，Grok4.20或將成爲除 OpenAI 和谷歌之外的第三個重量級選項。

前印度信息技術巨頭新創企業，欲用 AI 顛覆 IT 服務行業

前印孚瑟斯CEO維沙爾·西卡創立初創公司Hang Ten Systems，試圖用AI技術挑戰傳統IT服務業。該公司通過AI驅動的軟件開發與自動化，幫助企業持續構建、修改和運營軟件。近日，Hang Ten宣佈獲3200萬美元種子融資，由Mayfield主投，Aramco Ventures參投。

近 400 家地方報紙起訴 OpenAI 和微軟，指控侵犯版權