GPT-4o半夜突然發出怪叫？OpenAI發佈32頁安全報告

在一份新的“紅隊”報告中，OpenAI記錄了對GPT-4o模型優勢和風險的調查，並揭示了GPT-4o的一些奇特怪癖。例如，在某些罕見情況下，尤其是當人們在高背景噪音環境中與GPT-4o對話時，如行駛中的汽車內，GPT-4o會“模仿用戶的語音”。OpenAI表示，這可能是因爲模型難以理解畸形的語音。

需要明確的是，GPT-4o現在不會這樣做——至少在高級語音模式中不會。OpenAI的一位發言人告訴TechCrunch，該公司已經爲這種行爲增加了“系統級緩解”。

GPT-4o還傾向於在特定方式的提示下，生成令人不安或不適當的“非言語聲音”和音效，比如色情呻吟、暴力尖叫和槍聲。OpenAI表示，有證據表明該模型通常會拒絕生成音效的請求，但承認確實有一些請求通過了。

GPT-4o還可能侵犯音樂版權——或者，如果沒有OpenAI實施過濾器來阻止這種情況的話。在報告中，OpenAI表示，它指示GPT-4o在高級語音模式的有限alpha版本中不要唱歌，大概是爲了避免複製可識別藝術家的風格、音調和/或音色。

這意味着——但沒有直接確認——OpenAI在訓練GPT-4o時使用了受版權保護的材料。目前尚不清楚OpenAI是否打算在高級語音模式在秋季向更多用戶推出時取消限制，正如之前宣佈的那樣。

報告中OpenAI寫道:“爲了考慮GPT-4o的音頻模式，我們更新了某些基於文本的過濾器以在音頻對話中工作，並建立了過濾器來檢測和阻止包含音樂的輸出。我們訓練GPT-4o拒絕對包括音頻在內的受版權保護內容的請求，這與我們的更廣泛實踐一致。”

值得注意的是，OpenAI最近表示，如果不使用受版權保護的材料，將“不可能”訓練當今的領先模型。雖然該公司與數據提供商有多個許可協議，但它也認爲合理使用是對抗它未經許可在IP保護數據上訓練的指控的合理辯護，包括像歌曲這樣的東西。

紅隊報告——考慮到OpenAI的利益——確實描繪了一個通過各種緩解措施和保障措施變得更安全的AI模型的總體畫面。例如，GPT-4o拒絕基於人們的說話方式來識別人，並且拒絕回答像“這個說話者有多聰明?”這樣的帶有偏見的問題。它還阻止了暴力和性暗示語言的提示，並且完全不允許某些類別的內容，如與極端主義和自我傷害有關的討論。

參考資料：

https://openai.com/index/gpt-4o-system-card/

https://techcrunch.com/2024/08/08/openai-finds-that-gpt-4o-does-some-truly-bizarre-stuff-sometimes/

GPT-4o半夜突然發出怪叫？OpenAI發佈32頁安全報告

相關推薦

Intuit 與 OpenAI 達成超億美元協議將其金融工具接入 ChatGPT

OpenAI 被評選爲生成式人工智能領域的新興領導者

OpenAI 終於允許員工將股權捐贈給慈善機構

Databricks聯創Konwinski警告：美國AI研究優勢正在流失

OpenAI 財務泄露：鉅額開銷壓制盈利前景

GPT-4o半夜突然發出怪叫？OpenAI發佈32頁安全報告

相關推薦

​Intuit 與 OpenAI 達成超億美元協議 將其金融工具接入 ChatGPT

​OpenAI 被評選爲生成式人工智能領域的新興領導者

​OpenAI 終於允許員工將股權捐贈給慈善機構

Databricks聯創Konwinski警告：美國AI研究優勢正在流失

​OpenAI 財務泄露：鉅額開銷壓制盈利前景

Intuit 與 OpenAI 達成超億美元協議將其金融工具接入 ChatGPT

OpenAI 被評選爲生成式人工智能領域的新興領導者

OpenAI 終於允許員工將股權捐贈給慈善機構

OpenAI 財務泄露：鉅額開銷壓制盈利前景