大規模モデルにも8時間勤務制！ズーピーGLM-5.1を発表：長時間のタスク能力が初めてOpus4.6を上回る

4月10日、智譜は新世代の旗艦モデル GLM-5.1 を正式にリリースし、オープンソース化しました。このモデルの最も顕著な進歩は、長距離タスク（Long-Horizon Task）処理能力であり、世界で初めて「8時間連続作業」が可能なオープンソースモデルとなりました。

コア的な突破:「一問一答」から「自主的な業務」へ

智譜チームは、大規模モデルの次の段階の基準は単なるスコアではなく、「どれだけ独立して仕事をできるか」であると指摘しています。

8時間以上の持続力:GLM-5.1は一度のタスクにおいて、8時間以上独立して継続的に作業できます。その間、自ら計画を立て、実行し、ボトルネックを見つけて自己進化し、最終的にはエンジニアリングレベルの成果を提供します。
コード能力の頂点: 専門的なソフトウェア開発を測定するSWE-bench Proベンチマークテストにおいて、GLM-5.1は海外のトップモデルOpus4.6に対して初めての優越を達成しました。
実際の性能は驚くべきもの: 大量データ検索システムに関するプログラミングテストにおいて、GLM-5.1は6000回以上の操作最適化を経て、最終的に以前の最高記録の6倍の速度に達しました。

業界のトレンド:「価格戦争」から「性能プレミアム」へ

性能の飛躍的な向上に伴い、智譜の価格戦略も大きく転換しました:

価格が海外と同等に: プラットフォームのデータによると、GLM-5.1は再び10％値上げしました。コード作成シーンでの価格は初めて海外の主要企業Anthropicと同等になりました。
商業的価値に戻る:智譜CEO 張鵬は、長期的な低価格競争は業界にとって良くないと述べ、価格調整はAIの価値を正常な範囲に戻すためです。現在、智譜はグローバルな価値創出を実現しており、APIビジネスのARR（年間定常収入）は前年比で60倍に上昇しています。

市場の傾向:ベースラインの計算力とモデルが「価格上昇の波」に巻き込まれ

2026年の始まり以来、国内のAI業界は「安さで数量を稼ぐ」から「価値に基づく価格設定」への集団的な転換を経験しています:

騰訊雲: AI計算力およびコンテナサービスなどの製品を統一して5％値上げしました。
アリババクラウド: AI計算力に関連する製品の価格は5％〜34％上昇しました。
百度スマートクラウド: 関連するAI計算力サービスは5％〜30％上昇しました。

結論:AGIの「タイムライン」

業界の共通認識によると、AGIを測る重要な指標はタスク完了のタイムラインです。先端モデルがタスクを独立して完了する時間は毎7か月ごとに倍になります。GLM-5.1が「8時間作業モード」を開始したことで、大規模モデルは一つの質問に応えるチャットボットから、複雑な工学プロジェクトに深く関与できる「仮想従業員」として正式に変貌しました。

ステップ3.7 Flash：エージェントの効率の新しい時代が本当に訪れました

本日、オープンソースモデルのステップ3.7 Flashが正式にリリースされ、Apache 2.0ライセンスで重みが公開されました。エージェント時代における効率性・信頼性・マルチモーダル実行などの主要な課題を直撃しています。複数のベンチマークテストで優れた成績を収めています：ClawEval-1.1では67.1点で1位、SimpleVQA Searchでは79.2点で1位、SWE-PROでは56.3点で2位、V* Pythonでは95.3点を記録し、エージェントタスクやコード生成においてその実力を示しています。

李開復：オープンソースモデルはAI主権を実現するより最適な道筋

李開復氏は「AI主権」の概念を提起し、その重要性が技術の制御、データのセキュリティ、モデルと本土文化・法規の適合性に及ぶことを強調した。彼は各国がオープンAIを再構築しようと無理に進む必要はなく、閉鎖的な自社開発はコストが高く現実的ではないと述べた。資源が限られた国や企業にとって、オープンソースモデルを基盤にしたローカルなシステム構築は、より実現可能な第三の選択肢であると指摘した。

グーグルGemma4 推理速度が3倍に高速化オフライン大モデルの時代が本当に訪れた

Googleは最近、オープンソースモデルGemma4向けにマルチトークン予測（MTP）ドラフターを発表。投機的デコードアーキテクチャを活用し、推論速度を最大3倍に向上させつつ、出力品質と論理能力を維持。リリース後、ダウンロード数が急増し、世界で最も注目されるオープンソースモデルの一つとなった。....

DeepSeek-V4のベータ版が正式リリースされました：1Mに及ぶ長文のコンテキストが全員に利用可能に

深度求索がDeepSeek-V4シリーズプレビュー版を公開・オープンソース化。100万字超の長文コンテキストを実現し、エージェント協調や知識推論で国内トップレベルに。Pro版（1.6Tパラメータ、アクティブ49B）とFlash版を提供。Proはトップクローズドモデルに匹敵、Flashは効率性を重視。....

大規模モデルにも8時間勤務制！ズーピーGLM-5.1を発表：長時間のタスク能力が初めてOpus4.6を上回る

コア的な突破:「一問一答」から「自主的な業務」へ

業界のトレンド:「価格戦争」から「性能プレミアム」へ

市場の傾向:ベースラインの計算力とモデルが「価格上昇の波」に巻き込まれ

関連推奨

ステップ3.7 Flash：エージェントの効率の新しい時代が本当に訪れました

李開復：オープンソースモデルはAI主権を実現するより最適な道筋

グーグルGemma4 推理速度が3倍に高速化オフライン大モデルの時代が本当に訪れた

DeepSeek-V4のベータ版が正式リリースされました：1Mに及ぶ長文のコンテキストが全員に利用可能に

テンセントが最新のオープンソース言語モデル「Hy3 Preview」をリリースし、スマートな時代の新潮流を牽引

大規模モデルにも8時間勤務制！ズーピーGLM-5.1を発表：長時間のタスク能力が初めてOpus4.6を上回る

コア的な突破:「一問一答」から「自主的な業務」へ

業界のトレンド:「価格戦争」から「性能プレミアム」へ

市場の傾向:ベースラインの計算力とモデルが「価格上昇の波」に巻き込まれ

関連推奨

​ステップ3.7 Flash：エージェントの効率の新しい時代が本当に訪れました

李開復：オープンソースモデルはAI主権を実現するより最適な道筋

グーグルGemma4 推理速度が3倍に高速化 オフライン大モデルの時代が本当に訪れた

DeepSeek-V4のベータ版が正式リリースされました：1Mに及ぶ長文のコンテキストが全員に利用可能に

テンセントが最新のオープンソース言語モデル「Hy3 Preview」をリリースし、スマートな時代の新潮流を牽引

ステップ3.7 Flash：エージェントの効率の新しい時代が本当に訪れました

グーグルGemma4 推理速度が3倍に高速化オフライン大モデルの時代が本当に訪れた