生成AIが音声分野で進化を遂げ、これまでの「短いメロディー」から「フル曲の創作」へと深水区に進んでいる。

今週火曜日、グーグル傘下のAI研究所であるDeepMindは、音楽創作に特化したアップグレード版の大規模モデルLyria 3 Proを正式リリースしました。前バージョンと比べて、このモデルは音質において飛躍的な進歩を遂げただけでなく、特に重要な点として非常に強い「構造意識」を備えており、論理的に整った長時間の音声を処理・生成することが可能です。

「断片」から「章」へ:AIが曲の編成の鍵を握る

これまでのAI音楽モデルは、30秒程度の背景音楽しか生成できず、一曲全体の導入部や展開、クライマックスなどがないのが一般的でした。しかしLyria 3 Proの登場によって状況は変わりました:

構造化された創作: ユーザーは今やこのモデルを使って、イントロ(Intro)、ボーカル(Verse)、サビ(Chorus)、ブリッジ(Bridge)などの曲の全体構成を編成できます。

長時間音声処理: より長い時間の音声を創作できるようになり、AIが生成する内容はもはや断片的なメロディーではなく、プロの商業的レベルに達する完全な曲になります。

高品質出力: このモデルは24ビットの高音質出力をサポートし、プロ級の音声制作に必要な基本的な要件を満たしています。

マルチモーダルインタラクション:一言で自分の「感情のヒット曲」を定義しよう

グーグルが持つ強力なマルチモーダル技術を基盤として、Lyria 3 Proの操作性はさらに低くなりました:

意図理解: ユーザーはただ文章を入力すれば、特定のスタイル、感情、リズムなどに対応して、AIがクリエイティブなアイデアを正確に捉えます。

迅速なフィードバック: 想いから曲への変換効率が非常に高く、音楽創作の初稿期間を大幅に短縮します。

業界観察:AIがデジタル音楽生産ラインを再構築中

今年2月に初期版のLyria 3をリリースしてから、現在のPro版へのアップデートまで、グーグルはAI音楽分野での進歩を加速させています。

コンテンツクリエイターにとってこれはコスト削減と効率向上のツールですが、伝統的な音楽業界にとっては、Lyria 3 Pro