マイクロソフトは10月17日に、OpenAIが開発した新世代の動画生成モデル「Sora2」がAzure AI Foundryの国際版でリリースされ、パブリックプレビューに移行したことを発表しました。このモデルは初めてクラウドプラットフォームを通じて企業や開発者にAPIインターフェースを開放し、生成型AIによる動画ツールが閉鎖的なテストから商業化への段階に入ったことを示しています。

Sora2はマルチモーダルな動画生成モデルであり、テキスト、画像、動画などさまざまなタイプの入力データを処理し、これらの要素を組み合わせて新しい動画コンテンツを作成できます。この能力により、広告制作、教育動画、ソーシャルメディアコンテンツなどのさまざまなシナリオに適用可能です。ユーザーはテキストの説明を直接使って動画のスニペットを生成でき、従来の動画制作における撮影や編集などの工程を省略できます。

sora

図の出典:AIによって生成された画像

接続方法については、ユーザーはAzure AI FoundryのStandard Global APIを通じてSora2サービスにアクセスする必要があります。料金は1秒あたり0.1ドルです。この料金戦略は生成時間に基づく課金モデルであり、短い動画を大量に生成する企業ユーザーにとってコスト構造は比較的明確で予測可能です。

マイクロソフトはSora2をAzureプラットフォームに配置し、雲サービス分野でのOpenAIとの深い協力関係を継続しています。以前のGPTシリーズモデルもAzureを通じて企業顧客に最初に公開されました。この協力関係により、マイクロソフトは最新のAI機能を迅速に自社のクラウドエコシステムに統合できる一方、OpenAIには大規模な商用展開のインフラストラクチャを提供することができます。

技術の進化の観点から見ると、Sora2は初代バージョンと比べてマルチモーダル融合や動画の一貫性において改善されている可能性がありますが、公式には詳細な技術パラメーターや性能ベンチマークテストデータは公表されていません。パブリックプレビュー段階ではサービスが継続的に最適化されているため、利用中に生成品質が不安定だったり、特定のシナリオでの理解が誤っているなどの問題が発生する可能性があります。

動画コンテンツ制作業界にとって、AIによる動画生成ツールの登場は効率向上の機会をもたらす一方で、著作権、真実性、創作価値に関する議論も引き起こしています。企業がこのようなツールを使用する際には、生成されたコンテンツの商業利用権限、潜在的な倫理リスク、既存のワークフローとの統合方法を考慮する必要があります。

注目すべきは、Sora2が現在はAzure AI Foundryの国際版でのみリリースされているということです。これにより、中国地域のユーザーは現在、Azure中国地域を通じてこのサービスに直接アクセスすることはできません。また、1秒あたり0.1ドルの料金は個人クリエイターにとっては依然として高額であり、大規模な使用ではコストが急速に増加します。マイクロソフトが将来的に異なるユーザー層向けの差別化された料金プランを導入するかどうかは見守る必要があります。

市場競争の観点から見ると、Sora2のリリースはグーグルのVeo、メタの動画生成ツール、および国内の可靈、即夢などの製品と競争することになります。各社が動画生成の品質、制御性、コスト、アプリケーションシナリオの適合性などの次元で違いを持つことになり、商業化段階における市場構造が決まっていくでしょう。