北京時間の4月9日、Metaは個人スーパーアイのモデル「Muse Spark」を正式にリリースし、その新シリーズモデルの初の製品が実現したことを示しました。このモデルは多モーダル、深層推論、ツール呼び出し、視覚的思考プロセス、および複数エージェント協働をネイティブにサポートしており、「個人スーパーアイ」として位置付けられ、すでにMeta.ai公式サイトとMeta AIアプリで利用可能です。
コンテプレーティングモード:マルチエージェント並列推論性能が目立つ
Muse Sparkのコンテプレーティングモードは、マルチエージェント並列推論アーキテクチャを採用しており、Humanity's Last Examのベンチマークで58%の成績を達成し、FrontierScience Researchのベンチマークでは38%に達しました。これは、Gemini3.1Deep ThinkやGPT5.4Proと直接対等です。このパフォーマンスは、複雑な推論タスクにおける強力な競争力を示しています。

計算効率の革命:同じ性能でLlama4Maverickの1/10の演算力で十分
Llama4Maverickと比較すると、Muse Sparkは同等の性能を達成するためには10倍以上の計算量が不要です。この画期的な効率向上により、個人ユーザーと軽量な展開シナリオにとって広大な空間が開かれました。
ネイティブなマルチモーダルアーキテクチャ:視覚能力が基本構造から再構築
Muse Sparkは、後から組み合わせるのではなく、基本構造から視覚情報を統合したネイティブなマルチモーダルアーキテクチャを採用しています。この設計により、視覚STEM問題、エンティティ認識および位置決定タスクにおいて優れた性能を発揮します。最も直感的な例は、ユーザーが写真を1枚撮るだけで、モデルが完全な数独ゲームを自動的に生成できる点です。これにより、強力な視覚理解と生成能力が示されています。
健康推論のブラックテクノロジー:1,000人以上の医師と共同訓練
健康分野では、Muse Sparkは1,000人以上の医師と専門的なトレーニングを行いました。これにより、高度にインタラクティブな健康情報の表示が可能になります。例えば、ユーザーがアップロードした食事の写真やデータに対して、モデルは栄養成分分析を行い、赤緑のポイントで推奨と非推奨の食品を直感的に表示します。これにより、ユーザーは科学的な意思決定を迅速に行うことができます。
オープン性と実装:APIのプレビューも同時に開始
現在、Muse Sparkはhttps://meta.aiとMeta AIモバイルアプリで正式にリリースされており、一部のユーザー向けにプライベート API プレビューも提供されています。コンテプレーティングモードは徐々に多くのユーザーに配信されます。Metaは、Museシリーズの後続製品も「個人スーパーアイ」を軸に継続的に改善していくと述べています。
