世界中のAIチップ競争が高まりを続ける中、新興チップ企業のPositronは、その新しいAI推論チップ「Asimov」を正式に発表しました。同社はこのチップが大規模言語モデル(LLM)の推論を深く最適化し、エネルギー効率(1ワットあたりのトークン数)とコストパフォーマンス(1ドルあたりのトークン数)という2つの重要な指標において、英偉達の次の世代のRubinアーキテクチャの5倍になると発表しており、業界内で大きな注目を集めています。

Positronのコアとなる考え方は、従来のGPUアーキテクチャを「減算」する形での再構築です。Asimovチップは、従来の計算カードに備わっている複雑な制御回路を排除し、より純粋なテンソル処理アーキテクチャを採用しています。これは、非計算プロセスにおけるエネルギー損失をできるだけ抑えることを目的としています。このような設計思想により、Asimovは同等規模のモデルを実行する際に消費電力が少なくなり、チップの製造およびパッケージングコストも大幅に削減されています。Positronチームは、現在のデータセンターで厳しい電力制限が課されている中、この極限のエネルギー効率がAIサービスの導入における鍵になると考えています。

Asimovは驚異的な理論値を示していますが、英伟達の市場地位を脅かすことは簡単ではありません。現在、PositronはPyTorchやTensorFlowで作成された既存のモデルを簡単に移行できるためのコンパイラや開発エコシステムの構築に取り組んでいます。Asimovチップは先進的なプロセス技術を使用し、現在主流のTransformerアーキテクチャに対してハードウェアレベルでの強化を施し、トリアクセルパラメータのモデルを処理する際でも高いスループットと低い遅延を維持できるようにしています。

AIbaseは、Positronの参入がAIチップ分野における「汎用演算力」から「専用推論」への転換を示していると考えています。Asimovが約束通りの5倍の性能を実現すれば、大規模言語モデルの推論市場のコスト構造を根本的に変える可能性があります。

要点:

  • 🚀 エネルギー効率の頂点への挑戦: Asimovチップは、1ワットおよび1ドルあたりのトークン出力効率が英偉達の次世代Rubinアーキテクチャの5倍であると主張し、極限のコストパフォーマンスを重視しています。

  • 🏗️ アーキテクチャの簡素化と革新: 一般的な計算の冗長な設計を捨て、テンソル計算に特化した専用アーキテクチャによって、推論プロセスにおけるエネルギー損失とハードウェアコストを大幅に削減しています。

  • 🌐 大規模な推論に焦点を当てた設計: Transformerアーキテクチャに深い最適化を施したハードウェア設計であり、トリアクセルパラメータのモデルを配置する際の電力制限と高価な運用費用を解決することを目指しています。