日本のテクノロジー界で開催された高調な発表が、技術の透明性に関する世論の風潮へと変化しています。最近、日本発の楽天グループ(Rakuten)は「日本最大で性能最強」と称する自社開発の大規模モデルを発表しました。 このモデルは7000億パラメータを持ち、日本経済産業省(METI)のGENIACプロジェクトの支援のもとで開発された重要な成果です。しかし、このモデルがリリースされて間もなく、オープンソースコミュニティが技術的な検証を通じて「外装だけのモデル」という疑いを提起しました。

開発者たちは、モデルの下位構造と設定ファイルのconfig.jsonが中国チームによって開発されたものであることを示唆していることを発見しました。証拠によると、楽天のモデルは「DeepseekV3ForCausalLM」という構造名を保持しており、これは実際にはそのモデルをもとに日本語データを微調整したものであり、ゼロから自前で開発したわけではないのです。

議論の中心は、楽天が宣伝や協定処理において「曖昧な領域」に踏み込んでいる点にあります:

情報開示の欠如: ニュースリリースでは、楽天は「オープンソースコミュニティの精华を統合した」と一言で述べるにとどまり、そのモデルの貢献について一切触れていません。

協定操作の問題: コミュニティは、楽天がリリース当初、元のプロジェクトに必須のMITライセンスのファイルを疑似に削除したと指摘しています。その後、法律的に適合するためにNOTICEファイルを補完しましたが、このような「先に切って後で説明する」ようなやり方は、オープンソースへの誠意が欠如していると批判されています。

現在、楽天グループは許可ファイルの削除および下位構造の高い一致について正面からコメントしていません。