2025年2月27日—— OpenAI 於今日正式推出其最新語言模型 GPT-4.5,作爲研究預覽版率先提供給 ChatGPT Pro 用戶(每月訂閱費200美元)。這款被譽爲“迄今爲止最大、最知識淵博”的模型基於 GPT-4o 構建,在推理能力、情感智能以及寫作、編程等實用功能上實現顯著提升。OpenAI 表示,未來幾周內,GPT-4.5將逐步開放給 Plus、Team、Enterprise 和 Edu 用戶,標誌着人工智能技術的又一里程碑。

功能亮點:更聰明、更自然
GPT-4.5在多個領域展現了令人矚目的進步。根據 OpenAI 發佈的系統卡片,該模型通過監督微調(SFT)和強化學習(RLHF)訓練,顯著減少了“幻覺”現象(錯誤或虛構信息),並提升了情感智能和用戶交互的自然度。例如,在 PersonQA 測試中,GPT-4.5的幻覺率僅爲19%,遠低於 GPT-4o 的52%。 用戶體驗方面,GPT-4.5在寫作和編程任務中表現出色,能夠生成更具創造性和審美直覺的內容,同時更準確地理解用戶意圖。X 用戶 Simon Willison 在試用後表示:“它在知識深度和生成內容(如繪製鵜鶘)方面表現更好,交互體驗更自然。”此外,模型支持文件和圖像上傳,並集成了 ChatGPT 的畫布工具,但目前暫不支持語音、視頻或屏幕共享等多模態功能。

數據與安全:透明與責任並重
OpenAI 透露,GPT-4.5的訓練數據來源於多樣化渠道,包括公開數據、專有合作伙伴數據以及內部定製數據集,經過嚴格過濾以確保質量並保護隱私。安全方面,模型配備 Moderation API 和分類器,有效防止生成有害內容。 在第三方評估中,Apollo Research 和 METR 對 GPT-4.5的欺騙風險和自主性進行了測試,結果顯示其總體風險爲“中等”。尤其在化學、生物、放射性核材料(CBRN)和說服力領域風險中等,而網絡安全和模型自主性風險較低。OpenAI 已採取措施,如預訓練過濾 CBRN 數據並監控潛在濫用,以確保安全性。
用戶反饋:能力提升但速度待優化

首批用戶的反饋顯示,GPT-4.5在知識廣度和創造性方面廣受好評。X 用戶 @pckraftwerk 稱讚其“寫作和編碼能力顯著增強,幻覺現象減少”。然而,速度問題也引發關注。Simon Willison 指出,通過 API 使用時,GPT-4.5的響應速度較慢,可能影響實時應用場景。他還透露,該模型使用了比 GPT-4多10倍的訓練計算資源,性能提升背後是巨大的投入。
此外,OpenAI 明確表示,GPT-4.5並非專爲深度推理設計,建議用戶在需要複雜推理時選擇 o1或 o3-mini 模型,這一定位也引發了部分討論。
市場影響與未來展望
作爲 OpenAI 的最新力作,GPT-4.5被認爲將在寫作、編程和問題解決等領域推動生產力革新。其多語言表現同樣亮眼,在 MMLU 基準測試中,英語準確率達0.896,西班牙語0.8840,阿拉伯語0.8598,全面超越 GPT-4o。 業內人士預測,隨着 GPT-4.5逐步推廣,其強大的功能和較高的安全性將進一步鞏固 OpenAI 在 AI 領域的領先地位。未來,OpenAI 計劃根據用戶反饋優化模型,並可能擴展語音和視頻等功能,進一步豐富其應用場景。
結語
GPT-4.5的發佈不僅展示了 OpenAI 在技術上的雄心,也凸顯了其對安全和用戶體驗的重視。儘管速度問題尚待解決,但這款模型無疑爲 AI 的發展開啓了新的篇章。正如 OpenAI 在聲明中所說:“我們希望 GPT-4.5能爲用戶帶來更智能、更可靠的助手體驗。”
