在追求大模型“高智商”的同時,AI 的持續執行能力正成爲衡量其進化水平的新維度。根據人工智能研究機構

測試結果顯示,
AIbase 注意到,雖然測試數據中出現了模型理論上可連續工作超過20小時的數值,但
然而,也有專家對該測試的侷限性提出了質疑。目前 METR 僅涵蓋了14個樣本,且有觀點認爲這種基準測試可能被模型針對性地“刷分”。但不可否認的是,

在追求大模型“高智商”的同時,AI 的持續執行能力正成爲衡量其進化水平的新維度。根據人工智能研究機構

測試結果顯示,
AIbase 注意到,雖然測試數據中出現了模型理論上可連續工作超過20小時的數值,但
然而,也有專家對該測試的侷限性提出了質疑。目前 METR 僅涵蓋了14個樣本,且有觀點認爲這種基準測試可能被模型針對性地“刷分”。但不可否認的是,
DeepSeek公司融資突破700億元,管理層宣佈未來將專注突破性AI研究,而非短期商業化。戰略轉向全力開發新產品,特別是備受關注的DeepSeek Code,已在招聘網站發佈“Agent Harness”等多個相關崗位。
Spotify在2026年投資者日推出核心AI戰略載體——Studio by Spotify Labs,標誌其從音頻播放器轉型爲生成式音頻平臺。該桌面應用內置全能AI助理,可連接日曆、郵箱、筆記,具備網頁瀏覽與信息整理能力,並支持根據用戶日程表定製個人音頻內容。
OpenAI於5月22日發佈ChatGPT for PowerPoint插件(Beta版),將AI嵌入PowerPoint底層架構,實現零門檻免費使用。用戶無需付費,即可通過該插件在幻燈片創作中獲得AI輔助,終結傳統PPT製作的繁瑣過程。
美國總統特朗普突然取消原定簽署的AI監管行政令,該法令旨在加強政府監管,但在簽署前因白宮內部和科技巨頭強烈反對而瓦解。特朗普對監管AI缺乏興趣,擔心條款過於嚴格,導致最終放棄。
英國數學家圖靈1950年提出的圖靈測試設想,在76年後由加州大學聖地亞哥分校研究團隊在《美國國家科學院院刊》發表論文證實。認知科學家卡梅倫·瓊斯和本·伯根教授通過嚴格的經典三方圖靈測試,首次提供確鑿實證數據,標誌着計算機科學史上的里程碑時刻。