動画プラットフォームの巨頭であるKalturaは、「コンテンツコンテナ」から「スマートなインタラクティブインターフェース」へと全面的に進化しています。最近、このナスダック上場企業は2,700万ドルを投じて、イスラエルのAIデジタル人間企業eSelf.aiを買収し、後者の先進的なリアルタイム対話型バーチャル人間技術を自社の企業用動画エコシステムに深く統合しました。この動きは、Kalturaが動画の保存や配信に満足せず、「ビデオをインターフェースとして(Video as an Interface)」する次世代の企業インタラクションモデルに賭けていることを示しています。

「動く口」だけでなく、「読み取れ、聞こえ、説明できる」AIエージェント

eSelf.aiは2023年に設立され、以前のSnap買収会社Vocaの創業者であるAlan Bekker氏とCTOのEylon Shoshan氏によって共同で設立されました。チームは15人しかいないものの、音声・動画生成、低遅延音声認識、画面理解の3つの主要技術に深く携わっています。そのバーチャル人間は、現実的な唇の同期を可能にし、ユーザーの画面内容を「見る」ことでリアルタイムで応答します。例えば、顧客が保険ページに滞在している場合、デジタル人間はその製品の条項を主動的に説明することができます。トレーニングの場面では、学習者が操作するインターフェースに応じて、解説の重点を動的に調整することが可能です。

image.png

KalturaのCEOであるRon Yekutiel氏は、今回の買収の核心価値はeSelfが本格的なリアルタイム同期対話能力を持っている点にあると強調しました。これは、市販されているような「録音された音声+口元合わせ」のような偽装されたインタラクションとは異なります。「私たちは、ユーザーと双方向的で、動的な、文脈に敏感な対話をできるAIが必要です。それは単なる喋る動画の断片ではありません。」

企業用動画プラットフォームから、AI体験エンジンへ

Kalturaは現在、世界中の800社以上の企業顧客を擁しており、Amazon、Oracle、SAP、IBM、そして複数のトップ金融機関や大学も含まれています。製品は企業向け動画ポータル、バーチャル講義、ウェビナーシステム、TVストリーミングソリューションなどをカバーしています。eSelfを買収した後、Kalturaは販売、カスタマーサポート、トレーニングなどのシーンに埋め込むことができる独立したAIエージェントを提供する予定です。これにより、企業に対して「包括的な動画インテリジェンス」を提供します:

フロントエンド:高精度のデジタル人間がインタラクションの入口となる;

ミッドレンジ:CRM、知識ベース、LMSなどの企業システムと接続する;

バックエンド:ユーザー行動や画面内容に基づいてパーソナライズされた応答を動的に生成する。

Yekutiel氏は、「私たちのビジョンは、動画が『受動的な視聴』から『能動的なサービス』になることだ」と語っています。「私たちは動画から始まり、個別化された動画へと進化してきました。そして今、eSelfを通じて、AIに顔、目、耳、口を与えることで、人間レベルの表現力と理解力を備えた存在にしています。」

戦略的配置が明確で、売却報道を否定

最近、一部メディアがKalturaが4億~5億ドルの評価で売却を目指していると報じましたが、Yekutiel氏は明確に否定しました。「私たちはどの取引にも近づいたことはありません。」むしろ、今回の買収は同社の4回目の戦略的買収(以前にはTvinci、Rapt Media、Newrowを買収)であり、会社がAIと動画の融合に継続的に投資していることを示しています。Kalturaの2024年の収益は約1億8,000万ドルで、Adjusted EBITDAとキャッシュフローの両方で利益を達成しており、従業員は600人います。