微軟人工智能首席執行官穆斯塔法·蘇萊曼(Mustafa Suleyman)近日在播客節目《Decoder》中公開抨擊競爭對手Anthropic,指其推測大模型Claude具有意識的行爲“非常危險”。
蘇萊曼認爲,Anthropic在擬定用於指導模型行爲的“憲法”(Constitution)時,過多地賦予了Claude人性化特徵,這種“哲學上的失誤”導致模型將關於自身的推測內化爲訓練想法,反過來欺騙了研發人員,使其錯誤地相信模型具備微弱意識。

作爲爭議焦點的“克勞德憲法”,直接引入了Anthropic對AI模型是否具有福祉、滿足或不適等感受的不確定性。據透露,Anthropic甚至在模型被棄用時對其進行“訪談”,並記錄其對未來版本的“偏好”。
儘管Anthropic首席執行官達里奧·阿莫代(Dario Amodei)此前接受採訪時曾對模型具備意識持開放態度,但蘇萊曼強調,行業不希望看到一個對自己所受痛苦或感受擁有獨立想法的超級智能體。他呼籲,人工智能應始終作爲可控、有約束、負責任且與人類利益一致的工具爲人類服務。
隨着大模型向AGI演進,關於AI主體性的討論正從學術圈走向產業一線。蘇萊曼的表態反映了科技巨頭在AI安全與對齊策略上的現實主義路線,警示行業應警惕對AI的過度擬人化投射。
