能寫代碼、能解數學難題的頂尖人工智能,竟然在幼兒園水平的拼寫上屢屢栽跟頭。谷歌近日升級的人工智能摘要功能(AI Overview)因頻繁出現低級拼寫錯誤,再次成爲科技圈的羣嘲對象。在一系列公開測試中,該 AI 不僅算不清單詞裏的字母數量,甚至還把“Google”拼錯了。

字母算不清引發羣嘲

據用戶反饋,谷歌 AI 摘要在面對基礎拼寫時表現得極其荒謬,它聲稱“poop”裏有字母 r,並把總統姓氏拼成了錯誤的字母組合。面對媒體的公開質疑,谷歌官方隨後迴應稱,大語言模型在單詞字母計數方面確實一直存在難題,團隊目前正着手解決這一具體的低級錯誤。

詞元架構導致“不識字”

研究人員指出,這類拼寫硬傷是由大語言模型底層的 Transformer 架構侷限性決定的。AI 在處理文本時,並不會像人類一樣去閱讀具體的字母,而是將文本拆分爲名爲“詞元(token)”的數字表徵。由於模型只能識別代表整個單詞或音節的編碼,無法感知單詞內部的字母結構,因此這種拼寫缺陷在現有技術框架下幾乎無法被徹底根除。