Google は最近、アフリカで新たに「WAXAL」という音声データセットを正式に公開しました。このプロジェクトには、アチョリ語、ハウサ語、ルワンダ語、ヨルバ語など21のアフリカ言語が含まれており、AIシステムにおけるアフリカ言語の識別精度が低く、エラーが多いという長年の「生存性の問題」を解決することを目的としています。

このプロジェクトの主要な突破点は次の通りです:

  • データの主権の返還:従来の巨大企業がデータを独占するスタイルとは異なり、WAXALデータセットの所有権はGoogleではなく、アフリカの現地機関に完全に帰属しています。

  • 大規模で専門的なデータ:データセットには1.1万時間以上の音声と約200万件の録音が含まれています。そのうち約1,250時間分の音声は転写されており、テキストから音声への変換(TTS)に使用できる高品質なオーディオも含まれています。

  • 地元のイノベーションの支援:プロジェクトは柔軟なライセンス方式によりオープンソース化されており、商用利用が許可されています。現在、ガーナ大学などの機関がこれらのデータを活用して、母子健康などの地域固有のAIアプリケーションの研究を進めています。

語彙の複雑さやアクセント記号の欠如といった技術的課題にもかかわらず、WAXALの公開はアフリカが単なるデータ収集者から技術インフラの保有者へと変わっていることを示しています。Googleは今後、対応言語を27種類に拡大し、アフリカのAI発言力の向上をさらに推進する予定です。