據《華爾街日報》 1 月 14 日報道,韓國政府斥巨資推動的“本土大模型競賽”陷入爭議漩渦:五家決賽入圍企業中,至少三家被指在其模型中使用了來自中國和美國公司的開源代碼,包括智譜AI、阿里巴巴、OpenAI及DeepSeek等,引發關於“國產AI是否真正自主”的激烈辯論。

這場始於 2024 年 6 月的國家級項目,旨在三年內打造性能達到國際領先模型95%水平的純韓國技術大模型,以減少對中美科技巨頭的依賴,保障國家經濟與安全利益。獲勝者將獲得政府提供的優質數據、人才資金及關鍵AI芯片使用權。然而,理想豐滿,現實骨感——當技術全球化與開源協作成爲行業常態,“從零造輪子”的自主路線顯得愈發不切實際。

爭議焦點集中於入圍企業Upstage。競爭對手Sionic AI CEO高錫賢公開指控其模型部分模塊與中國智譜AI的開源代碼高度相似,甚至殘留版權標記,質疑其“套殼中國模型卻申領 taxpayer 資金”。儘管Upstage緊急召開直播發佈會,展示完整訓練日誌證明核心模型爲自研,並解釋僅在推理框架(非訓練核心)中使用了全球廣泛採用的智譜開源組件,高錫賢隨後道歉,但風波已起。

隨後,Naver與SK電訊亦被捲入。Naver被指其視覺與音頻編碼器與阿里通義千問及OpenAI產品存在相似性;SK電訊則被發現推理代碼與DeepSeek開源庫雷同。兩家公司均強調:模型的核心訓練引擎完全自研,外部組件僅用於標準化的輸入/輸出處理,屬於行業通用實踐。

對此,學界觀點兩極。哈佛大學教授魏裕炎指出:“拒絕開源軟件等於放棄技術紅利,完全自研每一行代碼既不現實也無必要。”首爾國立大學AI研究所所長李在武也證實,受質疑模型的核心參數訓練過程確爲從零開始,未直接複製外國模型權重。

然而,反對者擔憂:即便僅使用外圍代碼,也可能引入潛在後門或依賴風險,削弱“主權AI”的戰略意義。目前,韓國科學部尚未就競賽規則中“是否允許使用外國開源代碼”作出明確界定,但部長裴慶勳表示歡迎技術辯論,稱“這正是韓國AI未來的光明所在”。

在全球加速構建“AI主權”的浪潮下,韓國困境折射出一個普遍難題:在高度互聯的AI生態中,真正的“技術獨立”邊界究竟在哪裏? 是代碼逐行自研,還是核心算法與數據主權可控?這場風波或許沒有簡單答案,但它無疑爲各國敲響警鐘——AI自主化,遠不止一場模型競賽,而是一場涵蓋技術倫理、產業政策與全球協作的系統性工程。