NVIDIAがマルチモーダルなパーソナルモデルを発表、推論効率は競合の9倍

現地時間4月28日、NVIDIAは最新のオープンなマルチモーダル大規模モデルである「Nemotron3Nano Omni」を正式にリリースしました。このモデルは「万能選手」として位置付けられ、ビデオ、音声、画像、テキストの深い推論能力を高度に統合することで、開発者により迅速でスマートな対話応答ソリューションを提供することを目的としています。

技術構造における革新はこのモデルの大きな特徴です。Nemotron3Nano Omniは30B-A3Bの「ミックス・オブ・エクスパート（MoE）」アーキテクチャを使用し、視覚と音声エンコーダーをシステム内に直接統合しています。このような一元化された設計により、これまで多モーダル処理に複数の独立したセンシングモデルを依存していた状況を打破し、「断片的なコンテキスト」から「統一されたコンテキスト」への飛躍を実現しました。

パフォーマンスデータの表現は特に目立ちます。公式の公表によると、このモデルは複雑な文書処理、動画理解、音声認識などの6つの権威あるランキングで首位を獲得しています。その独自の感知精度により、このシステムは非常に高いインタラクティブ性を維持しながら、同類のオープンな全方向モデルの9倍のスループットを達成しています。これは、企業がAIエージェントを導入する際、低いコストでより強力な拡張性を実現でき、応答の即時性を損なうことなく行えることを意味します。

現在、多くの先駆的なテクノロジー企業がこのモデルに接続しています。H社のCEOであるGautier Cloix氏はこのモデルについて評価し、新しいアーキテクチャにより、AIエージェントがリアルタイムでフルハイビジョン画面の録画を解釈できるようになったと述べました。これは、AIが単なるタスクの実行者から、リアルタイムでデジタル環境を感知し理解する相互作用者へと進化したことを示しています。

マイクロソフトがAIを全面的に導入し、Windowsの脆弱性を掘り下げて、今後のセキュリティパッチの修正数が大幅に増加する

MicrosoftのWindowsチームがAIで脆弱性を発見し、月例セキュリティ更新に反映。脆弱性の増加ではなく検出効率の向上が要因と強調。5月からマルチモーダルAIセキュリティシステム「MDASH」を内部導入し、Windowsの重要コンポーネントを自動スキャンしてシステム強化に貢献。....

ステップスターがステップエッジシリーズの端末モデルを発表し、ローカルでの効率的なマルチモーダル処理を実現

階躍星辰がスマホや車載向けにStep Edgeシリーズを発表。基本版・Audio版・GUI版・Gen版があり、画像・音声・テキストのローカル処理に対応。画面理解、音声認識、UI操作、画像生成が可能で、ツール呼び出し遅延は0.1秒。単純タスクや高頻度・弱電波環境では端末内で完結し、複雑な推論はクラウドと連携する端雲協調を実現。....

商湯がオープンソースしたSenseNova-Vision統一ビジョン大モデル単一モデルで4つの核心的なビジョンタスクを横断

商湯は「日日新SenseNova-Vision」ビジョン大モデルを発表し、オープンソース化しました。このモデルの核心はビジョン能力をナチュラルに汎用ベースモデルに組み込むことで、従来の検出やセグメンテーションなどの専門モデルを束ねる分断されたアプローチを打ち破りました。このモデルは単一モデルとして、複数の評価で4つの分野においてパフォーマンスを圧倒し、ビジョンタスクにおける統一ナチュラル構造への重要なアップグレードを示しています。

米国民の7割がAIの利益を共有することを望んでおり、国民財産基金の設立を呼びかけている

米国でIT企業が人員削減を続ける一方、利益は増大し国民の怒りが高まっている。最新調査では69％が、AI企業に株式の50％を公共の基金に提供させ、全市民に技術変革の利益を分配する案を支持。失業危機への対策として注目される。....

NVIDIAがマルチモーダルなパーソナルモデルを発表、推論効率は競合の9倍

関連推奨

マイクロソフトがAIを全面的に導入し、Windowsの脆弱性を掘り下げて、今後のセキュリティパッチの修正数が大幅に増加する

ステップスターがステップエッジシリーズの端末モデルを発表し、ローカルでの効率的なマルチモーダル処理を実現

商湯がオープンソースしたSenseNova-Vision統一ビジョン大モデル単一モデルで4つの核心的なビジョンタスクを横断

米国民の7割がAIの利益を共有することを望んでおり、国民財産基金の設立を呼びかけている

Claude Codeがさらに進化！内蔵ブラウザでAIがウェブサイトを自主的に閲覧

NVIDIAがマルチモーダルなパーソナルモデルを発表、推論効率は競合の9倍

関連推奨

マイクロソフトがAIを全面的に導入し、Windowsの脆弱性を掘り下げて、今後のセキュリティパッチの修正数が大幅に増加する

ステップスターがステップエッジシリーズの端末モデルを発表し、ローカルでの効率的なマルチモーダル処理を実現

商湯がオープンソースしたSenseNova-Vision統一ビジョン大モデル 単一モデルで4つの核心的なビジョンタスクを横断

米国民の7割がAIの利益を共有することを望んでおり、国民財産基金の設立を呼びかけている

Claude Codeがさらに進化！内蔵ブラウザでAIがウェブサイトを自主的に閲覧

商湯がオープンソースしたSenseNova-Vision統一ビジョン大モデル単一モデルで4つの核心的なビジョンタスクを横断