グーグルは最近、動画生成モデルのVeo3.1をリリースしました。これは5月に発表されたVeo3のアップグレード版です。新バージョンでは音声出力、編集制御の粒度、画像から動画への変換品質などにおいて改善が行われており、より現実的な動画スニペットを生成し、ユーザーの指示に正確に対応できるようになりました。
機能面では、Veo3.1はユーザーが動画に新しいオブジェクトを追加できるようにし、システムが自動的に既存の画面スタイルに統合します。グーグルはまた、近日中に動画編集ツールFlowで既存のオブジェクトを動画から削除する機能をサポートする予定であることを明らかにしました。これにより、編集の柔軟性がさらに向上します。

Veo3は以前から複数の編集機能を提供しており、参考画像に基づいてキャラクターを生成したり、最初と最後のフレームをAIが生成し、その間のコンテンツを補完したり、最終フレームをもとに既存の動画を拡張する機能などが含まれます。Veo3.1のコアアップグレードは、これらのすべての編集機能に音声生成能力を追加したことで、出力される動画スニペットに音声要素を追加し、コンテンツの完成度と没入感を高めています。
配布チャネルに関しては、Veo3.1は複数のプラットフォームを通じてユーザーに開放されます。グーグルはこのモデルを動画編集ソフト「Flow」やGeminiアプリケーション、開発者向けのVertex AIおよびGemini APIインターフェースに統合しています。グーグルが明らかにしたデータによると、Flowが5月にリリースされて以来、ユーザーはこのプラットフォーム上で2億7,500万個以上の動画を作成しています。
今回のアップデートは、AIによる動画生成技術が二つの方向で進化していることを示しています。一つは生成品質の継続的な向上であり、より現実的な映像、より正確なプロンプトの理解です。もう一つは編集能力の細分化であり、全体的な生成から部分的な修正、オブジェクトの追加や削除などの精密操作へと進化しています。音声生成の導入は、これまでのAI動画ツールが一般的に欠けていた音声要素の不足を補うものです。
ただし、技術の成熟度という観点から見ると、AIによる動画生成はまだ急速に進化中の段階です。動画の連続性、物理法則の正確さ、複雑なシーンの処理能力など、各モデルは引き続き改善を進めています。Veo3.1の実際の性能、例えば音声と映像の同期品質やオブジェクトの自然な融合など、詳細についてはユーザーの実際の使用経験によって検証される必要があります。
