2026年の春節期間、中国の大規模モデルの競争は連続して注目を集めた。DeepSeekが現象級製品となった後、智譜AIの新世代の大規模モデルGLM-5もその神秘を解き明かした。この動きは直接的に資本市場を沸かせ、
マスクの暴露:謎のモデル「Pony Alpha」はGLM-5だった
数日前、世界中のモデルサービスプラットフォームOpenRouterに、「Pony Alpha」という名前の匿名モデルが登場し、コードの記述能力がClaude Opusと匹敵するため、世界中で話題になった。
身分確認:このモデルのシステムプロンプトは自身をGLMであることを明らかにしている。
「指紋」の識別:ネットユーザーはGLMシリーズ固有の論理的なバグ(例えば、「鍋内に植物油を入れて熱くする」と入力すると特定の異常な答えが返るなど)を検証することで、ほぼ確実に所属先を特定できる。
コアブラックテクノロジー:DeepSeekの構造を再利用し、パラメータを倍増
GLM-5は、
スケールの飛躍:総パラメータ数は高さ745Bであり、前バージョンのGLM-4.7の2倍である。
計算効率:256のエキスパートを持ち、一度に8つ(約44Bのアクティベーションパラメータ)が活性化され、スパース度はわずか5.9%である。
長文およびマルチモーダル:最大の202Kトークンのコンテキストウィンドウをサポートしている。また、2026年の市場ニーズに対応して、GLM-5は動画理解などのマルチモーダル機能を強化し、以前の
の純テキスト構造の欠点を補った。DeepSeek
業界への影響:展開のハードルがさらに低下
DSA構造を採用したことで、GLM-5はvLLMやSGLangなどの主要な推論フレームワークの既存の最適化手法を直接再利用できる。これは企業向けユーザーがこのモデルを展開する際、技術的ハードルと計算リソースのコストが大幅に低下することを意味する。
中国のAIが海外大規模モデルを「盗む」波の中で、
