2025年の科大訊飛1024開発者祭で、科大訊飛は正式にAIソフトウェアとハードウェアの統合ソリューションを発表しました。AIアルゴリズムとハードウェアアーキテクチャの深く融合することで、高ノイズや遠距離などの複雑な環境下でも正確な認識と理解が可能となりました。この突破は、音声と視覚のインテリジェンス統合分野における重要な進展と見なされています。

訊飛によると、従来のAI音声認識システムは騒音のある環境では精度が低下する傾向があります。これを解決するために、科大訊飛はソフトウェアとハードウェアの一体化設計において体系的なイノベーションを実施し、AIが「聞き取れる」だけでなく、「理解できる」ようにしました。

科大訊飛 (2)

このソリューションを基に、訊飛の多数のAIハードウェアのノイズキャンセリングおよび認識性能が著しく向上しています:

  • 訊飛スマートオフィス本 X5 は業界初の「上4下4環」8マイクアレイを搭載し、遠距離でノイズの高い環境での認識効果がiPhone17Proより優れています

  • 訊飛 AI 翻訳イヤホン は地下鉄や展示会など複雑な環境での認識精度が97.1%です。

  • 訊飛ダブルスクリーン翻訳機2.090dBの工場のうるささの環境でも98.69%の音声認識精度を達成しています。

訊飛側は、これらの成果は音声強化、音源定位、エコーキャンセル、マルチモーダル感知アルゴリズムに関する継続的な蓄積によるものだと語っています。

今回の開発者祭では、科大訊飛は星火音声大モデル多様な声の再現」技術も発表しました。ユーザーは一言の録音だけで任意の声質を高精度で再現でき、一度の指示で異なるスタイルの声を生成できます。

この技術の登場により、パーソナライズされた音声創作が普及段階に入ったことを意味します。これはデジタル人間、オーディオブック、映画の吹き替え、コンテンツ制作などの分野で広く応用され、誰もが簡単に自分だけの「AI声のコピー」を作り出すことができるようになります。