今日は中国政府网は『人民日報』が国家データ局の記事を引用したものを転載し、公式な文脈で大規模モデルの基本単位「Token」を正式に「語元」と命名しました。この報道によると、中国の人工知能業界における日々の語元呼び出し量は140兆回を突破しています。この権威的な名称の決定は、長年にわたる学術界と産業界での「Token」の中国語訳に関する論争を終結させ、また大規模モデル技術の標準的な文脈が国家レベルでさらに規範化されたことを示しています。

QQ20260324-135141.jpg

以前には、「Token」の命名について業界内で多くの競合案が提示されました。騰訊研究院の楊斌氏が提案した「モーユエン(模元)」は広く議論を巻き起こしました。その後、百川スマートの創設者王小川氏や潞晨科技の創設者尤洋氏、および元清华大学教授胡翌霖氏などの専門家が推奨した「チユエン(智元)」という案は、「汎用的知能」ではなく単なる「汎用的計算」の単位としての特性を強調していたため、ソーシャルメディアで高い注目を集めました。

しかし、最終的に公式に採用されたのは「語元」です。「語元」はAIが人間の言語を理解する最小単位であり、文字と単語の間に位置する切片の粒度を持ち、大規模モデルがテキストを処理する際の意味の切片をより正確にカバーすることができます。呼び出し量が140兆回という歴史的な壁に達した今、統一された用語規範は業界間のコミュニケーションコストを低減し、後のAIインフラの統計的量化と政策制定の基盤となるでしょう。