國家自然資源部近日宣佈,國家海洋環境預報中心聯合海洋出版社有限公司和三六零數字安全科技集團有限公司成功開發併發布了海洋垂直領域大語言模型——"瀚海智語"(英文名稱OceanDS)。
該模型以360智腦13B和Deepseek-R1-70B大模型爲基座,專注于海洋領域應用,已順利通過專家評審並正式發佈。"瀚海智語"的問世標誌着中國在海洋領域人工智能技術應用方面邁出了重要一步,將爲海洋行業的智慧化轉型提供強有力的技術支撐。

360智腦團隊宣佈推出全新的Light-IF系列模型,這一創新框架旨在顯著提升大型語言模型(LLM)在複雜指令遵循方面的能力。隨着人工智能技術的不斷進步,儘管LLM在數學、編程等領域已經展現出了卓越的推理能力,但在遵循複雜指令方面仍存在不足。爲了解決這一問題,360智腦團隊提出了以預覽-自檢式推理和信息熵控制爲核心的Light-IF框架。 Light-IF框架通過五個關鍵環節來提升模型性能:難度感知指令生成、Zero-RL強化學習、推理模式提取與過濾、熵保持監督冷啓動、熵自適應正則強化學習。這一框架的提出,旨在破解當前推理模型中存在的“懶惰推理”現象,即模型在思考階段僅複述指令而不主動檢查約束是否被滿足
在人工智能技術日益發展的背景下,中國在海洋領域迎來了一個重要里程碑。3月24日,中國自然資源部宣佈,國內首個業務化的垂域大模型 “瀚海智語” 正式發佈,並順利通過了專家評審。這一模型的推出,不僅爲海洋行業的智能化轉型提供了強有力的技術支持,也標誌着我國在海洋人工智能應用領域邁出了重要一步。“瀚海智語” 是由國家海洋環境預報中心、海洋出版社有限公司和三六零數字安全科技集團有限公司聯合開發,基於360智腦13B 和 Deepseek-R1-70B 兩個大型模型。與通用大語言
近日,360智腦團隊宣佈成功復現Deepseek的強化學習效果,並正式發佈開源推理模型 Light-R1-14B-DS。該模型性能表現超越 DeepSeek-R1-Distill-Llama-70B和 DeepSeek-R1-Distill-Qwen-32B,成爲業界首款在14B參數規模上實現強化學習效果的模型,顯著提升了數學推理能力,成績超過大多數32B級別模型。與 DeepSeek-R1-14B 相比,Light-R1-14B-DS*在數學競賽任務中表現突出:在 AIME24測試中提升4.3分,在 AIME25中更是提高10分。此外,在數學推理任務 GPQA 上,該模型取得61.7分 的優異成績。爲實現這一突破,360智腦團隊採用了兩
360智腦團隊與北京大學聯合研發的中等量級推理模型 Tiny-R1-32B-Preview 正式發佈。這一模型僅以5%的參數量,成功逼近了 Deepseek-R1-671B 的滿血性能,展現了小模型在高效推理領域的巨大潛力。該模型在多個關鍵領域的表現尤爲突出。在數學領域,Tiny-R1-32B-Preview
360集團的創始人、董事長及CEO周鴻禕近日宣佈,公司的360安全大模型將向公衆免費開放。周鴻禕強調,360集團的目標是普及大模型技術,使其不再是隻有少數廠商能夠利用來盈利的稀有資源。他期望通過這一舉措,讓更多企業和個人能夠負擔得起並有效利用大模型技術,從而推動安全行業的技術進步和生產力的變革。