手作工房からスマート工場への産業アップグレードが、静かに音声コンテンツ産業で進行しています。
AI技術が図版や動画などあらゆるコンテンツ分野に深く影響を及ぼす中、音声業界はまだ自分たちの「突破口」を待っているように見えます。大量のネット小説や出版物IPが、従来の制作プロセスの高コスト・低効率によって長期的に「眠ったまま」になっている業界の課題に対して、音声コンテンツ産業全体が本格的なシステム的解決策を求めるようになっています。
現在、かつて国内トップの音声プラットフォーム「ラクニンティングシュウ(Lanren Tingshu)」のコアチームが設立した「ワンウェイ・サウンド(Wanxiang Yousheng)」は、1年以上の深い研究開発と数ヶ月の対象内側テストを経て、全業界に向けて公開テストを開始しました。
これは単なるAIボイスツールではなく、業界におけるコスト・効率・品質管理の「不可能な三角」を探索し、検証するものであり、生産モデルを「手作業工房」から「スマート化」へと進めるための包括的な音声創作プラットフォームです。

01 産業課題:繁栄する市場におけるコンテンツ供給の課題
中国の音声リーディングユーザーは6億人を超え、規模が継続的に拡大していますが、供給面には多くの課題があります。
一方で「聴読一体」が主流となり、ユーザーが「ラジオドラマレベル」の没入体験を強く求めています。もう一方では、従来の生産モデルが解消できない三大課題があります:
• 高コスト: プロの実演制作では1時間あたり数千元かかることがあり、上位の一部の優良IPのみカバーできます。
• 低効率: ツールチェーンが分断されており、遠隔での協力も複雑で、標準プロジェクトの立案から完成までの期間は通常30〜60日かかります。
• 品質管理困難: プロセスが不透明で、人工審査ではミスや疲労が起こりやすく、品質の安定性を保つのが難しい。
これにより、閱文などのプラットフォームでは膨大な中堅IPが迅速な収益化が困難な「堰塞湖」となっており、TMEなどの音声プラットフォームでは質の高いコンテンツの持続的な供給が難しい状況となっています。市場は、コストを制御でき、制作効率を向上させ、人間のようなラジオドラマ風の体験を提供できる工業化された解決策を急いでいます。
02 老舗再出発:十年の業界経験に基づくAIによる再構築
「ワンウェイ・サウンド(Wanxiang Yousheng)」の探求は、そのチーム独特の業界背景に根ざしています。
核心創始チームはすべて「ラクニンティングシュウ(Lanren Tingshu)」の元マネージメントチーム出身で、創業者兼CEO、製品VP、技術VP、コンテンツ制作責任者などを含んでいます。彼らは十数年の業界深耕経験を持ち、プラットフォームのゼロからの構築や騰訊音楽との買収を主導してきただけでなく、産業チェーンの各環節の実際の課題を深く理解しています。
このチームは、ラクニンティングシュウの長期的な運営を通じて、伝統的な制作プロセスがクリエイターに与える多くの制約、例えば煩雑な画本作成、長時間かかる対軌、混乱した協力関係、複雑な報酬計算などを感じ取ってきました。彼らは、AIの大規模モデルの突破が、業界経験をシステム化・アルゴリズム化してこれらの課題を体系的に解決する機会であると考えています。
そのため、このチームが提供するものは単なる技術の積み重ねではなく、業界の操作基準をアルゴリズムのルールに変換する能力です。彼らは、吹き替えにおける息継ぎ、停頓、感情のつながりなど、過去には経験に頼っていた曖昧な工程を、定量的で実行可能な正確なアルゴリズムに変換し、業界の認識を基盤とした知能プラットフォームを構築しています。
03 コアエンジン:“二軌制”で既存と新規の課題を解決
「ワンウェイ・サウンド(Wanxiang Yousheng)」の中心的な探求は、“二軌制生産エンジン”の提案です。これは、市場が専門的な高品質と大量生成の両方の需要に対応するためのものです。ユーザーは内容タイプや制作要件に応じて、どちらのモードを選択するか柔軟に選べます。
第一軌道:高品質を強化し、人間のクリエイターを支援
プロのスタジオや高品質PGCコンテンツ向けに、ワンウェイ・サウンドは有声制作の全工程を一貫してつなぐプラットフォームであり、クリエイターがこれまで抱えていたツール間の切り替えや多プラットフォーム利用の問題を解決しようと試みています。プラットフォームが提供するいくつかの主要なツールは、有声コンテンツの生産プロセスを再定義しています:
1. インテリジェントな画本: テキストの自動章立て・分割、キャラクター抽出と統一、人物紹介の自動生成、ナレーターの適切なマッチング、そして複数の読み方や珍しい漢字の発音、会話の感情などにも正確にマーキングします。
2. インテリジェントな対軌: プロのソフトウェアで録音された数時間の乾音を自動的に区切り、対応する台詞にミリ秒単位でマッチングし、従来の後期対軌効率を最大500%まで向上させることが可能です。
3. 録音編集一体化ワークステーション: ブラウザ内で動作する専門的なオーディオワークステーションで、稿を見ながら録音し、録音しながら編集することが可能で、録音と編集のシームレスな連携を実現しています。
4. インテリジェントな審音: AIを活用して細粒度の完全品質チェックを行い、従来の人間によるサンプリングチェックを置き換え、コンテンツ品質の全面的なカバーと制御を目指しています。
5. チーム協力: 可視化されたタスクフロー、オーダーシステム、自動化された報酬決済を通じて、完全なオンライン協働エコシステムを構築し、プロジェクト全体の透明な管理を目指しています。

第二軌道:生産力の飛躍、大量IPの生成
インターネット小説プラットフォームにある大量の中堅IPに対して、プラットフォームは完全自動化されたAIマルチナレーション音声ドラマ制作ワークステーションを提供します。電子書籍のインポート、インテリジェントな章分割、キャラクター分析、AI朗読、後処理まで、すべて自動化され、極めて低い限界コストで「ラジオドラマ風」の体験を持つ音声コンテンツを迅速に生成し、プラットフォームが即座にコンテンツギャップを埋めることを目的としています。
万象有声は出版機関、ネット小説プラットフォーム、短編ドラマ・マンガ機関などに標準化されたAPIインターフェースを提供しています。これらのインターフェースを通じて、パートナーはプラットフォームに簡単にアクセスし、大量のIPリソースを一括で自動的に音声コンテンツに変換することを試み、既存コンテンツの商業価値を解放することを目指しています。

04 深いエンジニアリング:本当の技術的壁の構築
「ワンウェイ・サウンド(Wanxiang Yousheng)」は、一般的な大規模モデルの「千人の工場」に依存するような方法ではなく、垂直分野の深い理解に基づいて、差別化されたエンジニアリング能力を構築しています:
• チーム協力のエンジニアリング: オフラインの高品質コンテンツ制作の標準化されたプロセスを完全に模倣し、知能的なタスク配分と流れのメカニズムを通じて、クリエイティブチームを複雑な調整管理から解放しようとしています。この「プロセスの標準化+プロセスの知能化」の組み合わせが、その体系的能力の一部となっています。
• 百万級の発音辞書: 幻想や修練系のネット小説において、膨大な珍しい漢字や多音字の統一された発音の問題を解決することを目的としています。
• キャラクターの一貫性アルゴリズム: 百万文字の連載コンテンツにおいて、同一キャラクターの声色と性格特徴が常に統一されていることを確保することを目的としています。
• インテリジェントなナレーション処理: 「言う」などの台本中のヒントワードを自動的に識別して削除し、聴衆の没入感を向上させることを目的としています。
• インテリジェントな再描画技術: 文稿の一部が修正された場合、AIは変更された部分のみを再生成し、推測されるAIの計算コストを最大90%まで低下させることができるようです。
05 商業設計:異なる創造ルートに合わせたカスタマイズ
音声コンテンツ制作シーンの多様性を解決するために、「ワンウェイ・サウンド(Wanxiang Yousheng)」プラットフォームは「SaaS(メンバーシップ購入)+PaaS(使用量に応じた支払い)+IaaS(インフラ拡張)」の三位一体の混合ビジネスモデルを採用しており、業界内の「一刀両断」の料金モデルがユーザーにとって不利になる可能性を避けています。
このモデルは主に3つの典型的な生産シーンをカバーし、異なるユーザー層の根本的なニーズに応じて差別化された設計を行っています:
• 純粋な人間による制作シーン: 対象ユーザーはスタジオや個人クリエイターであり、プロジェクトは純粋な人間による制作が主で、業界内の高品質な多人数音声ドラマは基本的にこの種の創作に該当します。ユーザーは会員登録のみが必要で、プラットフォームは無制限の文字数とプロジェクトのためのすべての協力ツールチェーンを提供します。会員内に付与されるポイントはAIインテリジェント画本、インテリジェント対軌、AI音響生成などに使用され、他の追加費用はほとんど必要ありません。
• 純粋なAIによる制作シーン: 対象ユーザーは著作権機関や音声プラットフォームであり、画本編集と声優の主にAIで行われ、市場の長編IPのマルチナレーション音声ドラマの主要な制作方法です。クリエイターは会員登録不要で、実際の使用量に応じてポイントを使用して制作します。大量のコンテンツの場合、プラットフォームが提供する創作サポートパックを通じてポイントを割引価格で購入することができます。全体的な価格は業界平均よりも顕著に低くなります。
• AI+人間の混合制作シーン: 現在業界で一般的な有声書の制作方法で、AIが画本の初稿を作成し、ナレーションはAIで行い、会話は人間が行います。「ワンウェイ・サウンド(Wanxiang Yousheng)」はこのようなシーンのために会員+サポートパック/安心パックの組み合わせ形式を提供しており、スタジオは周期内のプロジェクト数に応じて必要な計算能力を拡張することで、創作コストを大幅に節約できます。
ビジネス上の実現可能性から見ると、このモデルはサブスクリプションサービス、使用量に応じた消費、および必要に応じた拡張を相互に分離し、異なる創造習慣を持つユーザーに予測可能なコスト構造を提供し、プラットフォーム自身にはより多様な収入源を提供しています。内側テスト段階では、このモデルが多様な生産シーンをある程度サービスでき、異なるユーザー層のニーズを満たすことができることが確認されています。
06 内部テストの反応:効率と品質の両方の確認
プラットフォームは内部テスト期間中に2,000人以上の専門職業者が実際にアプリケーション検証を行いました。公開された内部テストデータによると、通常30日かかる有声書プロジェクトが、プラットフォームのツールの支援によって5〜7日に短縮されます。効率の向上は、元々分散していた画本、録音、対軌などの工程が同じ協力環境に統合され、これらのツールの知能化補助によって、ツール間のコミュニケーションと使用コストが減少したためです。
複数の有名ラジオドラマに声を担当したベテランCVの先生は、「以前は画本、録音、対軌、後処理が別のソフトウェアで行われ、コミュニケーションコストが非常に高かったが、今では一つのプラットフォームで処理しているため、コミュニケーションの損失が大幅に減り、効率が具体的に感じられる。生産力はほぼ倍になった」と述べました。
閱米文化の創業者李吉は著作権プラットフォームからのフィードバックとして、「ワンウェイ・サウンド(Wanxiang Yousheng)」のAIナレーションは感情の伝え方がすでに人間に近いと語りました。「それにインテリジェントな画本と自動対軌能力を組み合わせれば、私たちはB+以上レベルの高品質な有声書の安定した供給能力を持っている。私たちのコンテンツチームにとっては、この能力の安定性が単なる速度の向上よりも重要だ」と述べました。
07 公開テストの開始:業界と一緒になって音声の未来を築く
「ワンウェイ・サウンド(Wanxiang Yousheng)」は、半年以上にわたる対象内側テストを終えた後、正式に公開テストを開始し、コンテンツクリエイター、声優、音声スタジオ、ネット小説プラットフォーム、音声プラットフォームなどを対象に登録を開放しました。
