4月10日、智譜は新世代の旗艦モデル GLM-5.1 を正式にリリースし、オープンソース化しました。このモデルの最も顕著な進歩は、長距離タスク(Long-Horizon Task)処理能力であり、世界で初めて「8時間連続作業」が可能なオープンソースモデルとなりました。

image.png

コア的な突破:「一問一答」から「自主的な業務」へ

智譜チームは、大規模モデルの次の段階の基準は単なるスコアではなく、「どれだけ独立して仕事をできるか」であると指摘しています。

  • 8時間以上の持続力:GLM-5.1は一度のタスクにおいて、8時間以上独立して継続的に作業できます。その間、自ら計画を立て、実行し、ボトルネックを見つけて自己進化し、最終的にはエンジニアリングレベルの成果を提供します。

  • コード能力の頂点: 専門的なソフトウェア開発を測定するSWE-bench Proベンチマークテストにおいて、GLM-5.1は海外のトップモデルOpus4.6に対して初めての優越を達成しました。

  • 実際の性能は驚くべきもの: 大量データ検索システムに関するプログラミングテストにおいて、GLM-5.1は6000回以上の操作最適化を経て、最終的に以前の最高記録の6倍の速度に達しました。

image.png

業界のトレンド:「価格戦争」から「性能プレミアム」へ

性能の飛躍的な向上に伴い、智譜の価格戦略も大きく転換しました:

  • 価格が海外と同等に: プラットフォームのデータによると、GLM-5.1は再び10%値上げしました。コード作成シーンでの価格は初めて海外の主要企業Anthropicと同等になりました。

  • 商業的価値に戻る:智譜CEO 張鵬は、長期的な低価格競争は業界にとって良くないと述べ、価格調整はAIの価値を正常な範囲に戻すためです。現在、智譜はグローバルな価値創出を実現しており、APIビジネスのARR(年間定常収入)は前年比で60倍に上昇しています。

市場の傾向:ベースラインの計算力とモデルが「価格上昇の波」に巻き込まれ

2026年の始まり以来、国内のAI業界は「安さで数量を稼ぐ」から「価値に基づく価格設定」への集団的な転換を経験しています:

  • 騰訊雲: AI計算力およびコンテナサービスなどの製品を統一して5%値上げしました。

  • アリババクラウド: AI計算力に関連する製品の価格は5%〜34%上昇しました。

  • 百度スマートクラウド: 関連するAI計算力サービスは5%〜30%上昇しました。

結論:AGIの「タイムライン」

業界の共通認識によると、AGIを測る重要な指標はタスク完了のタイムラインです。先端モデルがタスクを独立して完了する時間は毎7か月ごとに倍になります。GLM-5.1が「8時間作業モード」を開始したことで、大規模モデルは一つの質問に応えるチャットボットから、複雑な工学プロジェクトに深く関与できる「仮想従業員」として正式に変貌しました。