グーグルは最近、ジーニー・エコシステム内で最新の音楽生成モデル「Lyria 3」を正式にリリースしました。このモデルはグーグル・ディープマインドが開発したもので、AI音楽分野におけるまた一つの重要な進歩であり、ユーザーに多くの創作可能性をもたらしています。今回のLyria 3のリリースでは、テキスト、画像、動画など複数のモダリティの入力をサポートしており、高音質な30秒間の音楽曲を生成でき、英語、ドイツ語、スペイン語、ヒンディー語などの言語に対応しています。現在、ユーザーはデスクトップ端末で段階的に体験できます。モバイル端末からのアクセスも近くオープンされる予定です。
Lyria 3の中心的な革新点は技術の向上であり、具体的には3つの特徴があります:第一に、ユーザーが追加の入力なしでも自動的に歌詞とメロディを一致させることができる機能です。第二に、ビートやボーカルスタイルなどの要素に対して細かい制御が可能で、クリエイターの個別化されたニーズに応えます。第三に、Lyria 3は多様なモダリティの協調合成能力を持ち、ユーザーが1枚の画像をアップロードするだけで、その感情に合った音楽を生成できます。
一方で、グーグルはLyria 3の設計において法的合規性を特に考慮し、ますます厳しくなる音楽著作権規制に応えています。すべての生成されたオーディオにはSynthIDの水印技術が組み込まれており、これにより音楽の出所が追跡可能となり、プラットフォームに対するユーザーの信頼感が強化されます。さらに、Lyria 3は有名な音楽家の名前を処理する際にも慎重な戦略を採用しており、彼らの特有のスタイルを直接コピーすることを避けて、潜在的な著作権問題を回避しています。
ただし、Lyria 3はポピュラーや主流のジャンルでは優れた性能を発揮していますが、一部のマイナーな前衛的なスタイルでは柔軟性に欠けるところがあります。また、生成される曲の長さは30秒に制限されており、これはグーグルが現在短いコンテンツの創作に重点を置いていることを示しており、特にYouTube Shorts向けのBGMを提供するために使われています。これにより、TikTokなどのプラットフォームとの競争においても有利な立場になります。
Lyria 3のリリースとともに、グーグルはAI音楽エコシステムの構築に積極的に取り組んでおり、Lyria 3とGeminiの連携を通じて「統合型クリエイティブ・キット」を作り上げようとしています。ユーザーは利用中により高い生成量を得られ、カスタムの音楽ジャケットを取得できるため、閉じたサイクルのクリエイティブ体験が実現します。
総合すると、Lyria 3のリリースは技術的な突破だけでなく、音楽産業の未来発展において新たな課題と機会をもたらしています。グーグルが取る法的合規措置と技術革新のバランスは、今後のAI音楽業界の発展において重要なテーマとなるでしょう。
