AI圈再掀巨浪!阿里巴巴震撼發佈並全面開源了其最新力作——通義千問QwQ-32B推理模型。這款被寄予厚望的新模型,並非徒有虛名,而是經過大規模強化學習的千錘百煉,在硬核的數學運算、複雜的代碼編寫以及通用的AI能力上實現了質的飛躍,整體性能已經能夠正面硬剛行業標杆DeepSeek-R1,實力不容小覷。


AI圈再掀巨浪!阿里巴巴震撼發佈並全面開源了其最新力作——通義千問QwQ-32B推理模型。這款被寄予厚望的新模型,並非徒有虛名,而是經過大規模強化學習的千錘百煉,在硬核的數學運算、複雜的代碼編寫以及通用的AI能力上實現了質的飛躍,整體性能已經能夠正面硬剛行業標杆DeepSeek-R1,實力不容小覷。

阿里巴巴發佈升級版AI推理模型Qwen3-Max-Thinking,該模型在美國邀請數學考試和哈佛-麻省理工數學錦標賽中均獲滿分,成爲首個在這兩項頂級數學競賽中實現100%準確率的中國AI模型,突顯其強大的推理與問題解決能力。
OpenAI 近期推出了一項新系統,旨在監控其最新的 AI 推理模型 o3和 o4-mini,以阻止與生物和化學威脅相關的提示。該系統的目標是防止模型提供可能教唆他人實施有害攻擊的建議,確保 AI 的安全性。OpenAI 表示,o3和 o4-mini 在能力上較之前的模型有顯著提升,因此在惡意用戶手中可能帶來新的風險。根據 OpenAI 的內部基準測試,o3在回答關於某些生物威脅的相關問題時,表現得尤爲出色。爲了應對這些風險,OpenAI 開發了這個新的監控系統,稱之爲 “以安全爲中心的推理監測器”。這個監測器
Kimi 技術團隊近日發佈了 Kimina-Prover 預覽版的技術報告,並開源了1.5B 和7B 參數的模型蒸餾版本、用於數據生成的 Kimina-Autoformalizer-7B 模型以及修訂過的 miniF2F 基準測試數據集。Kimina-Prover 是由 Numina 和 Kimi 團隊聯合研發的一款數學定理證明模型,它在形式化定理證明領域採用了一種新穎的、由推理驅動的探索範式,展現出極佳的性能。
近日,谷歌在開發者平臺 Google AI Studio 及 Gemini 應用程序上發佈了其最新的人工智能推理模型 ——Gemini2.5。此模型具備停下來 “思考” 的能力,標誌着人工智能技術的新進步。谷歌還推出了 Gemini2.5Pro Experimental,這款多模式推理 AI 模型被認爲是迄今爲止最智能的。Gemini2.5的發佈是谷歌針對每月20美元的 Gemini Advanced 訂閱者的一項新服務,用戶可以體驗到其強大的推理能力。自從2024年9月 OpenAI 發佈首個 AI 推理模型以來,各大科技公司如 Anthropic、DeepSeek、谷歌和 xAI 等紛紛推出了各自的推理模
騰訊混元 T1正式版上週發佈後,不少用戶關心何時能夠在元寶中使用這一新版本。對此,騰訊官方在最新消息中宣佈,混元 T1正式版與 DeepSeek V3最新版一同上線,爲用戶帶來了全新的體驗。混元 T1正式版是騰訊自研的深度思考模型,與之前的 T1Preview 版本相比,進行了全面的升級。新版本不僅提升了速度和性能,還顯著改善了綜合效果,能夠實現秒級響應,滿足用戶對推理模型的高效需求。用戶體驗的優化使得混元 T1在各類推理任務中表現得更加出色。此外,與混元 T1同時推出的還有 DeepS