烏鎮峯會重磅發佈！360首發《大模型安全白皮書》，首提“全鏈路AI安全防線”應對智能時代新威脅

當大模型加速涌入金融、政務、能源等關鍵領域，其“越智能，越危險”的安全悖論正引發行業警覺。在2025年世界互聯網大會烏鎮峯會上，360數字安全集團正式發佈國內首份《大模型安全白皮書》，系統性揭示大模型全生命週期中的五大核心風險，並首次提出“外掛式安全 + 平臺原生安全”雙軌治理框架，爲高危AI時代拉起一道縱深防禦屏障。

白皮書指出，大模型的安全威脅已形成跨層級、強耦合的複雜矩陣，涵蓋五大維度:

基礎設施層:算力集羣、訓練平臺遭攻擊可能導致模型被投毒或竊取;
內容層:生成虛假信息、違規內容或“AI幻覺”引發社會風險;
數據與知識庫層:訓練數據泄露、知識庫被污染將動搖模型可信根基;
智能體層（Agent）:自主決策的AI代理若被操控，可能執行惡意任務;
用戶端層:提示注入、越權訪問等攻擊可繞過防護直接操控模型行爲。

面對這一多維威脅，360提出雙軌並行的安全策略:

“外掛式安全”:在模型外部部署監測、過濾與審計系統，如內容合規網關、異常行爲檢測;

“平臺原生安全”:將安全能力內嵌至大模型研發、訓練、部署、推理各環節，實現“安全即代碼”。

基於該理念，360已構建覆蓋數據脫敏、模型加固、內容過濾、Agent行爲審計、API防護、紅藍對抗、安全合規等七大核心能力的全鏈路解決方案，並在金融、製造、政務等多個行業落地實踐。

360強調，單靠企業防護遠遠不夠。未來將聯合產學研各方，推動大模型安全標準制定、威脅情報共享與開源安全工具共建，打造開放、協同、可信的AI安全生態。

AIbase認爲，在大模型從“技術秀場”邁向“生產基礎設施”的關鍵節點，360的白皮書不僅是一份風險預警，更是一張AI安全新基建的路線圖。當智能成爲生產力，安全必須成爲底線——這場由360發起的防禦戰，關乎的不只是技術，更是AI能否被社會真正信任與託付的未來。

OpenAI新推AI模型o3幻覺現象加劇，精準性令人擔憂

最近，OpenAI 推出了其最新的 o3和 o4-mini AI 模型，這些模型在許多方面都達到了尖端水平。然而，新的模型在 “幻覺” 問題上卻並沒有改善，反而幻覺現象比 OpenAI 之前的多個模型更爲嚴重。所謂 “幻覺”，是指 AI 模型會錯誤地生成虛假信息，這是當今最棘手的 AI 問題之一。以往每一代新模型在減少幻覺方面都有所改善 o3和 o4-mini 卻打破了這一規律。根據 Open 的內部測試，這兩款被稱爲推理模型的 AI，在幻覺頻率上超過了公司的前幾代推理模型以及傳統的非推理模型，比如 GPT-4o。圖源備

西湖大學研發 AI 文本檢測模型，助力辨別人工智能創作

近日，西湖大學的研究團隊成功研發出一種能夠檢測人工智能生成文本的新模型。該團隊的負責人張嶽教授在接受採訪時表示，這一模型採用無監督算法，可以有效判斷一篇文章是否由 AI 創作，尤其在人工智能迅速發展的當下顯得尤爲重要。張嶽教授提到，隨着科技的不斷進步，AI 在創作領域的應用日益普及。然而，AI 生成文本的問題也隨之而來，例如 “AI 幻覺”。這種現象指的是 AI 在生成內容時，有時會編造虛假的細節，導致產生與事實不符的結果。在教育領域，如果學生的畢業設計

MongoDB 斥資 2.2 億美元收購 Voyage AI

數據庫引擎開發商 MongoDB 近日宣佈收購人工智能初創公司 Voyage AI，交易金額高達2.2億美元。此次收購旨在幫助企業降低其 AI 應用程序中可能出現的 “幻覺” 現象，增強其產品的可靠性和準確性。圖源備註：圖片由AI生成，圖片授權服務商MidjourneyMongoDB 總裁兼首席執行官 Dev Ittycheria 在聲明中表示，Voyage AI 的技術將與 MongoDB 進行深度整合，能夠有效減少開發人員在管理外部嵌入 API、獨立的向量存儲或複雜搜索管道方面的工作量。通過這樣的整合，開發者可以更專注於構建高質量的 AI 應用，

Patronus AI推首個自助AI檢測API，打破AI幻覺的魔咒

在人工智能迅速發展的今天，AI “幻覺” 現象愈加頻繁，給許多企業帶來了不小的困擾。客戶服務聊天機器人自信地描述不存在的產品，金融 AI 編造市場數據，醫療機器人則提供危險的醫療建議。這些問題不再是單純的趣事，而是正在影響公司聲譽與盈利的重大隱患。爲了應對這一挑戰，位於舊金山的初創公司 Patronus AI 宣佈推出全球首個自助服務平臺，旨在實時檢測和防止 AI 系統出現故障。這個平臺就像是 AI 系統的 “拼寫檢查器”，可以在問題發生前將其捕捉到。Patronus AI 的首席執行

烏鎮峯會重磅發佈！360首發《大模型安全白皮書》，首提“全鏈路AI安全防線”應對智能時代新威脅

相關推薦

谷歌拒絕爲 AI “幻覺” 負責，反擊誹謗訴訟

OpenAI新推AI模型o3幻覺現象加劇，精準性令人擔憂

西湖大學研發 AI 文本檢測模型，助力辨別人工智能創作

MongoDB 斥資 2.2 億美元收購 Voyage AI

Patronus AI推首個自助AI檢測API，打破AI幻覺的魔咒

烏鎮峯會重磅發佈！360首發《大模型安全白皮書》，首提“全鏈路AI安全防線”應對智能時代新威脅

相關推薦

谷歌拒絕爲 AI “幻覺” 負責，反擊誹謗訴訟

OpenAI新推AI模型o3幻覺現象加劇，精準性令人擔憂

​西湖大學研發 AI 文本檢測模型，助力辨別人工智能創作

​MongoDB 斥資 2.2 億美元收購 Voyage AI

Patronus AI推首個自助AI檢測API，打破AI幻覺的魔咒

西湖大學研發 AI 文本檢測模型，助力辨別人工智能創作

MongoDB 斥資 2.2 億美元收購 Voyage AI