最近、グーグルはGeminiアプリをアップデートし、ユーザーに新しいAIビデオ生成のコントロール方法を提供しました。ユーザーは1つのビデオプロンプトで複数の参照画像をアップロードできるようになりました。システムはこれらの画像とテキストをもとにビデオと音声を生成します。この新機能により、ユーザーは最終的なビデオの見た目や音声をより直接的に制御できるようになります。

グーグルは以前から、拡張ビデオAIプラットフォーム「Flow」でこの機能をテストしていました。Flowは既存のビデオクリップの拡張や複数のシーンの結合をサポートしており、Geminiアプリよりも高いビデオクォータを提供しています。グーグルによると、10月中旬にリリースされたVeo3.1バージョンは、Veo3.0に比べてテクスチャのリアルさ、入力の正確性、音質の面で大幅に向上しています。
今回のアップデートにより、ユーザーはAIツールをより柔軟に利用し、自分に合ったコンテンツを作成できるようになります。複数の参照画像をアップロードできる機能により、クリエイターはビデオ制作に多くのパーソナライズ要素を取り入れることができ、視覚的・聴覚的な体験を観客に提供することができるようになります。
現在、AI技術が急速に進化している時代において、グーグルのこの取り組みは、ビデオ生成分野での継続的な革新を示しています。ユーザーのニーズが多様化する中、AIツールの柔軟性とカスタマイズ性がますます重要になっています。Geminiの新機能は間違いなく、多くのクリエイターの注目を集めることになるでしょう。
ポイント:
🌟 ユーザーは複数の参照画像をアップロードしてAIによるビデオと音声の生成を導くことができます。
🎥 新機能により、ビデオの最終的な効果に対するユーザーのコントロール力が向上しています。
🔊 Veo3.1バージョンは、前のバージョンに比べてビデオ品質と音声体験において明確な改善が見られます。
