カートェシア社は最新の音声AIエンジン「Sonic-3」を発表しました。この製品は現在市場で最も高速かつ自然なリアルタイム音声会話モデルとして宣伝されています。Sonic-3の主な目的は、非常に自然で迅速な音声インタラクション体験を提供することです。これにより、AIがほぼゼロの遅延で会話をし、人間の感情、トーン、笑い、そして感情の変化を模倣できるようになります。その結果、コミュニケーションの現実感と表現力が大幅に向上します。
Sonic-3の画期的な性能は、従来のTransformerモデルではなく、新たに開発された「状態空間モデル(SSM)」アーキテクチャを使用していることによるものです。カートェシアによると、このSSMアーキテクチャは人間の思考をより効果的に模倣でき、会話のテーマや感情を記憶することができ、常に文脈を再分析する必要がありません。これにより、音声の自然さと低遅延性能がこれまでになく高いレベルに達しています。このモデルの遅延は100ミリ秒未満であり、リアルタイム音声インタラクション業界でリーダー的地位を確立しています。

機能および範囲において、Sonic-3は大きなグローバルな潜在力を示しています。42種類の言語をサポートしており、世界の95%の人口をカバーしています。これはインド語の9種類も含んでおり、さまざまな市場のニーズに対してネイティブレベルの音声モデルを提供できます。また、Sonic-3はスマートな文脈理解能力を持ち、NASAやFBIなどの略語や頭文字語を自動認識し、正しい読み方を可能にし、会話の滑らかさを著しく向上させます。さらに、このエンジンは音声クローン機能をサポートしており、ユーザーはわずか10秒でパーソナライズされた音声を生成できます。企業版では専門的な音声調整やブランド音色のカスタマイズサービスも提供されます。
Sonic-3の応用の可能性は広く、カスタマーサポート、バーチャルパートナー、医療、物流など多くの分野で利用可能です。感情的な音声により、カスタマーサービスの体験を顕著に向上させます。
Sonic-3のさらなる研究開発と拡大を支援するために、カートェシアは同時に1億ドルの資金調達を完了したことを発表しました。投資家にはKleiner Perkins、Index Ventures、Lightspeed、NVIDIAなどの有名企業が含まれています。カートェシアは、Sonic-3の登場によって、人機インタラクション分野で重要な突破が訪れると考えています。ユーザーはカートェシアの公式ウェブサイトにアクセスしてSonic-3をオンラインで体験できます。
住所:https://cartesia.ai/sonic
