正文

國內 AI 戰場新王誕生！文心 X1.1 榮登大模型測評榜首

發布於AI新閒資訊

時間 :Oct 22, 2025

閱讀 :1分鐘

在日前發佈的中文精確指令遵循測評基準（SuperCLUE-CPIF）中，百度的文心 X1.1以75.51分的優異成績，成爲國產大模型中的佼佼者，獲得了國內第一的位置。這項評測包括了多達10個國內外知名模型，如 GPT-5(high)、DeepSeek-V3.2-Exp-Thinking、Claude-Sonnet-4.5-Reasoning、Gemini-2.5-Pro 等，側重於評估大型語言模型(LLM)在中文環境中執行復雜指令的能力。

SuperCLUE-CPIF 測評不僅關注模型的任務類型和指令數量，還特別強調模型將自然語言指令轉化爲符合要求的具體輸出的能力。在這次測評中，文心 X1.1在實際生產環境中的表現尤爲突出，顯示出其在複雜寫作任務和多元化場景下的強大優勢。

文心 X1.1是基於文心大模型4.5進行訓練的深度思考模型，其在升級過程中採用了迭代式混合強化學習訓練框架。這意味着，它不僅可以提升通用任務和智能體任務的效果，還能夠通過自蒸餾數據的迭代訓練，不斷提高整體性能。

在實際應用中，文心 X1.1能夠靈活運用內置知識和聯網搜索工具，精準捕捉用戶所需的信息，同時深入理解用戶的創意寫作需求，最終輸出內容結構合理、邏輯清晰且文辭優美。例如，在處理共享單車平臺的客戶服務時，文心 X1.1能夠綜合考慮用戶的情感狀態和問題類型，從而高效地解決問題，展現出完整而主動的服務過程。

作爲國內最早投入大模型研發的企業，百度藉助其 “芯片 - 框架 - 模型 - 應用” 的全棧自研體系，持續推動文心大模型的能力進化。數據顯示，文心 X1.1在事實性和指令遵循能力上較其前身文心 X1分別提升了34.8% 和12.5%，智能體表現提升了9.6%。這一成果無疑爲國產大模型的發展樹立了新的標杆。

面壁智能CTO曾國洋：從“打字機”到大模型，端側AI的進化與突圍

面壁智能另闢蹊徑，專注端側AI，將大模型壓縮進手機、汽車等終端。28歲CTO曾國洋早年主導訓練中國首個大語言模型CPM-1，如今致力推動輕量化智能落地移動設備。

Jul 14, 2026

190.1k

別人敲鐘，我們歸零:智譜披露“摸高”計劃，押注全自動化智能體生態

智譜創始人唐傑發內部信，宣佈啓動“摸高”計劃，未來兩年將戰略投入長程任務、自治智能體系統、完全自我訓練及極致安全治理四大核心引擎，全力衝擊下一代通用人工智能（AGI）。同期，智譜發佈了開源模型GLM-5.2，支持百萬token上下文並在長程任務上保持領先，以MIT協議全量開源。

Jul 13, 2026

210.7k

階躍星辰首款AI智能體手機即將發佈，跑在OpenAI前面

階躍星辰宣佈將推出新一代智能體終端，發佈AI終端品牌、智能體系統及首款AI智能體手機，成爲全球大模型企業中率先落地的原生智能體手機，上市節奏早於OpenAI規劃。該手機由華勤技術代工，雙方形成深度綁定合作關係。

Jul 9, 2026

275.4k

MiniMax計劃推出新一代大模型參數規模2.7萬億

稀宇科技（MiniMax）被曝即將推出參數高達2.7萬億的新一代大模型，旨在破解複雜任務處理和邏輯推理難題。此舉不僅彰顯了其對底層技術研發的持續重注，也映射出行業通過參數躍進追逐更高智能水平的雄心。

Jul 9, 2026

274.6k

階躍星辰將發佈全球大模型廠商首款AI智能體手機

階躍星辰將發佈全新AI終端品牌、智能體系統及首款AI智能體手機，成爲全球大模型廠商中率先實現智能體硬件落地的玩家。當前AI大模型加速向端側滲透，新一代AI終端已成戰略高地，OpenAI亦計劃2027年推出產品，階躍星辰此次搶跑佈局。

Jul 9, 2026

237.9k

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

國內 AI 戰場新王誕生！文心 X1.1 榮登大模型測評榜首

相關推薦

面壁智能CTO曾國洋：從“打字機”到大模型，端側AI的進化與突圍

別人敲鐘，我們歸零:智譜披露“摸高”計劃，押注全自動化智能體生態

階躍星辰首款AI智能體手機即將發佈，跑在OpenAI前面

MiniMax計劃推出新一代大模型 參數規模2.7萬億

階躍星辰將發佈全球大模型廠商首款AI智能體手機

MiniMax計劃推出新一代大模型參數規模2.7萬億