在剛剛結束的華爲全聯接大會上,華爲技術有限公司聯合浙江大學推出了國內首個基於昇騰千卡算力平臺的基礎大模型 ——DeepSeek-R1-Safe。這一創新性產品旨在解決當前 AI 領域面臨的安全與性能問題,開創了智能科技的新篇章。

浙江大學計算機科學與技術學院的院長任奎在會上詳細介紹了這一模型的核心創新。DeepSeek-R1-Safe 是通過一個全流程的安全後訓練框架構建而成,涵蓋了高質量的安全語料庫、平衡優化的安全訓練以及自主創新的軟硬件平臺。這一框架的設計旨在從底層解決 AI 模型在安全訓練中的關鍵問題。

值得一提的是,DeepSeek-R1-Safe 在千億級參數的安全訓練中實現了突破,其防禦能力表現驚人。測試數據顯示,該模型在對抗有毒有害言論、政治敏感內容及違法行爲教唆等 14 個維度的有害信息時,整體防禦成功率接近 100%。而在多種越獄模式的防禦上,成功率也超過了 40%。綜合安全防禦能力高達 83%,在與同類模型 Qwen-235B 和 DeepSeek-R1-671B 的對比中,表現優越,超出 8% 至 15%。

此外,在 MMLU、GSM8K、CEVAL 等通用能力基準測試中,DeepSeek-R1-Safe 的性能損耗控制在 1% 以內,這表明其不僅提高了安全防護能力,同時也確保了模型的可用性,成功達成了安全與性能的平衡。

華爲昇騰計算業務總裁張迪煊在會上表示,華爲正在積極推動基礎軟件創新與 AI 安全能力建設,通過開放協作與高校和產業夥伴共同推動技術進步。同時,該模型也已在 ModelZoo、GitCode、GitHub、Gitee 等社區全面開源,讓更多開發者和研究人員能夠參與其中。

這一里程碑式的發佈不僅爲 AI 安全領域帶來了新的希望,更爲未來的 AI 產業生態協同發展鋪平了道路。