安全枷鎖下的最強AI：Claude Fable 5 爲何連基礎生物題也答不上？

Anthropic 近日正式發佈了其最新一代人工智能模型Claude Fable5。作爲公司目前面向大衆開放的最強 AI，它在生物學、網絡安全等領域的潛力備受期待。然而，這款模型在實際使用中卻表現出一種“選擇性失憶”:即便面對高中水平的基礎生物學問題，它也往往拒絕回答，並主動將請求轉接給其前代旗艦模型Claude Opus4.8。

這種現象並非源於模型能力的缺失，而是 Anthropic 出於極高安全標準所做的刻意限制。作爲Mythos級模型，Claude Fable5具備極強的高階任務處理能力，同時也伴隨着顯著的濫用風險。在開發與上線過程中，Anthropic 將生物學領域視爲安全紅線的重中之重，其防護策略甚至到了“矯枉過正”的地步。

在實際測試中，這種保守策略的副作用顯而易見。無論是關於細胞線粒體功能的科普、花粉症成因的探討，還是哮喘藥物原理等無害醫學常識，Claude Fable5均予以駁回。甚至連埃博拉病毒這類公共衛生相關話題，也觸發了其屏蔽機制。這種“無差別攔截”導致原本具備學術價值和科普意義的交流被迫中斷。

Anthropic 對此迴應稱，此舉核心目的是爲了防範惡意用戶利用先進 AI 從事高風險生物研究，例如開發生物武器。公司發言人帕魯爾・馬赫什瓦里表示，爲了讓模型能夠儘早上線，團隊選擇了極端保守的防護路線，並承認目前存在較多的識別誤判。

對比來看，Claude Fable5在化學與網絡安全領域的限制則顯得更加靈活。雖然它會拒絕提供炸藥製造工藝或炭疽桿菌培養方式等危險信息，但對於氯氣用途、密碼安全及物理學原理等中性技術問題，模型能夠正常作答。只有在涉及劇毒物質等極端場景時，它纔會調用上一代模型進行輔助處理。

目前，Anthropic 正致力於優化識別機制以減少誤判，並計劃在未來針對生物醫學領域的專業用戶，推出能夠解鎖這些限制的特定版本，旨在平衡科研效率與社會安全。這一“受限發佈”模式，或許正是當前頂尖 AI 模型在追求強大性能與嚴苛安全之間尋找平衡的一個縮影。

27億留不住核心大牛?谷歌 AI 天團現離職潮，多位頂級科學家投奔死敵

谷歌頂級AI研究員喬納斯·阿德勒與亞歷山大·普里策爾離職，加盟競爭對手Anthropic，兩人均爲Gemini模型開發核心。此前，效力谷歌24年的傳奇研究員諾姆·沙澤爾宣佈跳槽OpenAI，谷歌曾斥資27億美元收購其創辦的初創公司。接連出走使谷歌AI人才流失挑戰加劇。

把 AI 變成全職同事:Anthropic 推出“始終在線”的協同實體 Claude Tag

Anthropic發佈企業AI工具Claude Tag，定位“始終在線”的AI隊友，深度嵌入Slack，支持@Claude 進行實時交互、獲取洞察與分配任務，深化協同辦公自動化。測試版率先向Claude Enterprise及Team客戶開放，相比此前僅支持私信與代碼路由的集成，新工具強化了聊天場景下的協作能力。

安全枷鎖下的最強AI：Claude Fable 5 爲何連基礎生物題也答不上？

相關推薦

2026全球獨角獸總估值飆升43%:大模型點燃資本狂熱，重塑全球科技產業重心

27億留不住核心大牛?谷歌 AI 天團現離職潮，多位頂級科學家投奔死敵

Anthropic AI模型數小時"攻破"美國機密系統，政府反手就把它"關了禁閉"

美國AI創業公司狀告政府：切斷大模型訪問等於"斷人活路"

把 AI 變成全職同事:Anthropic 推出“始終在線”的協同實體 Claude Tag