人工知能動画生成技術の競争が激化する中、最新の業界ランキングが再び注目を集めている。7月3日、ユーザーによる盲測フィードバックに基づく権威あるランキング「Video Arena」が更新され、グーグルDeepMindが開発したテキストから動画を生成するモデル「Gemini Omni Flash」が1404Eloの高スコアで首位に躍進し、現在の動画モデル分野のリーダーとなった。

今回のランキングの更新は、グーグルがマルチモーダル大規模モデル分野における深い蓄積を示すとともに、動画生成技術が急速に進化していることを反映している。データによると、Gemini Omni Flashはこれまで長期間優位を保っていたビデオット(ByteDance)のSeedanceシリーズモデルをこの回に追い越した。現在のスコア差は101Eloである。この変化は業界内の激しい競争を証明しており、Video Arenaのランキングはユーザーの実際の盲測投票によって作成されるため、モデルの生成品質、論理的一貫性、ユーザー体験などの総合的なパフォーマンスを直接反映している。

image.png

より広い視点で見ると、AI動画大規模モデル技術の進化に伴い、主要企業間の順位が頻繁に入れ替わっている。グーグルは今回の技術進化において強力な動きを見せ、その下にある動画モデル全体の順位は以前のVeo時代と比較して顕著に向上し、7位分だけ進んだ。