記事本文

トランスフォーマー構造を超える？Inceptionが世界初の拡散モデルを基盤とした推論大規模モデルMercury 2を発表

公開AI二ュ-ス

時間 :Feb 25, 2026

読む :1分

人工知能スタートアップのInception Labsは、近日、Mercury2をリリースしました。これは性能が強く、さらに下層のアーキテクチャにおいて大胆な「パラダイムシフト」を実現したモデルです。

このモデルは現在主流のTransformerアーキテクチャを完全に廃止し、テキスト生成には拡散モデル（Diffusion-based）を採用しています。これにより、従来の大規模モデルの性能ボトルネックを打ち破る試みが行われています。

従来のモデルのように1文字ずつトークン（文字）を生成するのではなく、Mercury2の仕組みは経験豊富な編集者に似ています。1文字ずつ生成するのではなく、複数のテキストブロックを同時に全体最適化や再構成することができます。このような並列処理のロジックにより、Mercury2は複雑な論理推論タスクにおいて驚くべき速度の優位性を示しています。

AIbaseが取得した実測データによると、NVIDIA Blackwell GPUのサポートのもと、Mercury2の生成速度は驚くほど1秒間に1009トークンに達しています。エンドツーエンドの遅延テストでは、このモデルは1.7秒で応答を完了します。これはGoogleのGemini3Flashより8倍以上速く、AnthropicのClaude Haiku4.5よりもはるかに優れています。スピードが非常に速いにもかかわらず、GPQA DiamondやAIMEなどの権威ある推論ベンチマークテストにおいても、現在のトップクラスの軽量推論モデルと同等の品質を維持しています。

Inception Labsは、競争力のある価格戦略を採用しており、入力と出力のコストは同業他社の四分の一です。現在、Mercury2はAPIインターフェースを正式に公開しており、128,000トークンの超長文対応およびツール呼び出し機能をサポートしています。応答速度を追求する音声アシスタント、検索システム、プログラミングツールにとって、「非常識な道を歩む」この拡散推論モデルは、魅力的な新選択肢を提供しています。

要約:

🌀 アーキテクチャの本質的な革新:従来の1文字ずつ生成のモードを捨て、拡散モデル技術を採用し、複数のテキストブロックを同時に全体最適化できるようにし、推論ロジックに質的な変化をもたらします。
⚡ 極めて高性能な表現:最新のハードウェアによって支えられ、秒単位での応答が可能となり、1秒間に1000以上のトークンを生成し、遅延性能はGemini3やClaude4.5を大幅に上回ります。
💰 高コスト効果の商用戦略:非常に低い価格コストで既存市場の枠組みに挑戦し、長文対応およびAPI接続をサポートし、特に遅延に敏感な企業向けAIアプリケーションを主に狙っています。

1%のパフォーマンス向上は過去のもの？CVPR2026が視覚知能のパラダイム再定義を明らかに

コンピュータビジョンは「見る」から「理解・対話」へシフト。認識精度の追求は限界に達し、CVPR2026では視覚を推論・意思決定・対話の仲介役と位置付け、マルチモーダルモデルによる「思考連鎖」論理展開など、適応的・暗黙的アプローチが主流に。....

Apr 30, 2026

222.0k

中国製大規模モデルが海外でランキングを制覇！コンポンHy3 previewが世界的大規模モデルAPI呼び出し数ランキングトップに

OpenRouterの世界的大規模モデルAPI呼び出し数ランキングによると、テンセントのコンポンHy3previewモデルは高い使用頻度により国際的な競品を上回り、総合ランク1位を獲得しました。これは開発者による性能への評価を示しており、中国製の大規模モデルが世界的なAIエコシステムにおける影響力が急速に拡大していることを示しています。このモデルはツール呼び出しやプログラミングのシナリオにおいて優れた性能を発揮しています。

Apr 29, 2026

211.7k

ミリメートル単位の正確なアライメント：小米がVLA大規模モデルの後学習フローをオープンソース化

小米は最近、視覚-言語-動作大規模モデルXiaomi-Robotics-0の実機後の学習フローをオープンソース化しました。これにより、身体を持つ知能の発展が促進されます。チームは約20時間のタスクデータのみを使用して、ロボットにイヤホンの正確な収納などの高難度操作を習得させ、複雑なスキルを迅速に学ぶ能力を示しています。

Apr 27, 2026

194.7k

国内の大規模モデルがさらに進化：Qwen3.6-35B-A3Bが正式にオープンソースとなり、高効率とマルチモーダルな思考を強調

国内のAIモデルであるQwen3.6-35B-A3Bが正式にオープンソースとなり、混合エキスパートアーキテクチャを採用しています。総パラメータ数は350億ですが、推論時には30億のパラメータのみが活性化され、「小勝大」という効率的な性能を実現し、計算資源コストを大幅に削減しています。

Apr 20, 2026

378.5k

アリババがQwen3.6-Max-Previewを発表：プログラミングの知能の新基準

アリババはQwen3.6-Max-Previewのプレビュー版モデルを発表し、ユーザーはQwenStudioでの対話またはアリ雲百煉APIを通じて呼び出すことができます。Qwen3.6-Plusに比べて、新しいモデルはインテリジェントなコンポーネントのプログラミング、世界の知識、命令の遵守などの面で著しく向上しており、6つの主要なプログラミングベンチマークテストで優れた成績を収めています。

Apr 20, 2026

1,274.2k

インテリジェントな未来、あなたの人工知能ソリューションシンクタンク