ウォールストリート・ジャーナル(WSJ)の1月14日付記事によると、韓国政府が巨額を投じて推進する「国内大規模モデル競争」は論議に巻き込まれている。5社が決勝進出した中で、少なくとも3社が中国や米国の企業のオープンソースコードをモデルに使用していると指摘されており、智譜AI、アリババ、OpenAI、DeepSeekなどが含まれる。この事実が「国内AIが本当に自主的であるのか」という激しい議論を引き起こしている。

2024年6月から始まった国家プロジェクトでは、3年以内に国際的なモデルの95%の性能を持つ純粋な韓国技術の大規模モデルを構築することを目指し、米中テクノロジー企業への依存を減らして、国家経済と安全保障利益を守ることを目的としている。優勝者には政府が提供する優れたデータ、人材、資金および主要なAIチップの使用権が与えられる。しかし、理想は立派だが現実は厳しく、技術のグローバル化とオープンソース協力が業界の常態となった現在、「ゼロからホイールを作り出す」自主路線はますます現実的ではなくなっている。

今回の論議の中心は、出場企業のUpstageに集まっている。競合企業Sionic AIのCEOであるコ・スヒョン氏は、Upstageのモデルの一部のモジュールが中国の智譜AIのオープンソースコードと非常に似ており、その著作権表示が残っていると主張し、そのモデルが「中国モデルを装って納税者の資金を受領している」と疑問を投げかけた。Upstageは緊急にライブ配信の記者会見を開き、訓練ログを提示して核心モデルが自社開発であることを証明し、推論フレームワーク(トレーニングのコアではない)で世界中で広く使われている智譜のオープンソースコンポーネントを使用したことを説明した。コ・スヒョン氏はその後謝罪したが、騒動はすでに起きていた。

その後、NaverとSKテレコムも関与した。Naverは視覚と音声エンコーダーがアリババの通義千問やOpenAI製品と類似していると指摘された。一方、SKテレコムは推論コードがDeepSeekのオープンソースライブラリと似ていることが判明した。両社とも、モデルのコアトレーニングエンジンは完全に自社開発しており、外部コンポーネントは標準的な入出力処理にのみ使用されていると強調し、これは業界の一般的な慣習であると述べた。

これに対して学界の意見は分かれる。ハーバード大学のウィー・ユイェン教授は、「オープンソースソフトウェアを拒否することは技術の恩恵を放棄することであり、すべてのコードを自前で作るのは現実的でも必要でもない」と述べた。ソウル国立大学AI研究所長のイ・ジェウクも、指摘されたモデルのコアパラメータトレーニングプロセスがゼロから開始され、外国モデルの重みを直接コピーしていないことを確認した。

一方で反対者は、外側のコードをわずかに使用するだけで、潜在的なバックドアや依存リスクを導入してしまう可能性があり、これは「主権AI」の戦略的意義を弱める恐れがあると懸念している。現在のところ、韓国の科学省は、競技ルールにおいて「外国のオープンソースコードを使用することが許可されているかどうか」について明確な規定をしていないが、大臣のペ・ギョンフンは技術的な議論を歓迎し、「これは韓国AIの明るい未来である」と語った。