告別信息泄露!OpenAI 推出 Privacy Filter，支持12.8萬超長上下文與8類隱私識別

OpenAI 近日宣佈推出一款前沿的個人身份信息（PII）脫敏模型——Privacy Filter。該模型目前已通過 Apache2.0協議在 Hugging Face 和 GitHub 同步開源，旨在爲開發者提供一個可本地運行、支持高度定製的隱私保護工具。

區別於傳統的規則匹配工具，Privacy Filter 具備深層的語言理解能力。它能根據上下文語境，精準識別非結構化文本中的敏感信息。這意味着它在有效遮蓋個體私密數據的同時，能夠最大限度地保留文本中的公開有用信息。

在技術架構上，該模型展現了極高的靈活性與效率:

混合專家（MoE）設計: 雖然總參數規模達 15億，但每次推理僅激活約 5000萬個參數。這使得它可以在筆記本電腦甚至瀏覽器等資源受限的邊緣設備上流暢運行。
超長上下文支持: 具備 12.8萬 Token 的上下文窗口，利用雙向 Token 分類架構和受限維特比算法，確保了長文本處理的連貫性與準確性。
高精度識別: 在 PII-Masking-300k 基準測試修正版中，該模型取得了 97.43% 的 F1分數，其中召回率高達98.08%。

Privacy Filter 能夠精準識別並標註八類核心敏感信息:

OpenAI 將其定位爲預過濾層。用戶在將文本發送至雲端大模型前，數據可先在本地完成 PII 檢測與脫敏。這種“數據不離設備”的處理方式，有效解決了用戶誤將隱私信息粘貼至 AI 工具的風險。

雖然該工具功能強大且支持微調，但 OpenAI 同時也提醒，在醫療、法律、金融等高敏感領域，人工審覈與領域特定的微調依然不可或缺。

搞定大模型“健忘症”：華爲大牛深圳創業，MemoraX AI 獲千萬美元融資

在AI大模型快速發展的背景下，記憶短板問題日益凸顯。深圳新銳公司MemoraX AI專注於解決這一痛點，近日完成千萬美元種子輪融資，由L2F光源創業者基金和鐘鼎資本領投，多家機構跟投。公司位於深圳南山，從成立到融資速度驚人，旨在攻克大模型“轉頭就忘”的難題。

爆料稱OpenAI深度佈局硬件：正聯手多方研發“去應用化”AI手機