最近、Uberはインドで新サービスを開始し、シェアドライバーおよび配達ドライバーが空き時間を利用してアプリケーションを通じてデータ分類や情報収集の作業に参加できるようにしました。このニュースは、Uber AIソリューションのグローバル責任者であるメガ・イエタダカ氏がLinkedInに投稿したものです。彼女は、ドライバーが日常の仕事の中で空き時間が生じるか、または夜間に追加収入を得たいと考えている可能性があると述べました。
この新しい業務には、写真の確認、物の数え上げ、テキストの分類、音声の録音、領収書のデジタル化などの形式があります。イエタダカ氏は、これらのタスクがUberのグローバル企業顧客をサポートするために使用され、生成型AIモデルや消費者向けアプリの開発に役立つと述べました。

イエタダカ氏はさらに、「これまでこれらのタスクは、アプリケーション外で個人請負業者が行っていた。初期の結果は非常に好ましく、このサービスをさらに拡大することを期待している」と述べました。彼女が投稿した動画では、このサービスが世界中で展開される可能性が示されています。
Uberインディアおよび南アジアの社長であるプラブジート・シン氏は、現在これらの新しいタスクが12の都市で導入されており、「何万人ものドライバー」がUberが「デジタルタスク」と呼ぶものを開始したと語りました。
UberのCEOであるダラ・コスロワシャヒ氏は、8月の決算電話会議で、デジタルタスクの導入はUberが世界中の収入を得る人々にタスクを割り当てることができる核心的な能力を持っているためだと述べました。「あなたは、世界で注目すべきAIの発展に貢献する異なるタイプの収入を得る人々を見ることになるだろう」とコスロワシャヒ氏は語りました。
また、Uberはその日のうちに、350PB(ペタバイト)のデータレイクを運営しており、データ保護ツールである「HiveSync」というツールを開発していることを発表しました。Uberエンジニアチームの公告によると、以前はUberのデータインフラストラクチャが2つのデータセンター領域間で動作していたことで冗長性を確保していましたが、これは第2の領域が実際には使用されておらず、不必要な費用を生じさせていました。
そのため、Uberは「単一領域計算(SRC)」計画を開始し、すべてのバッチ処理タスクを単一の領域内で実行し、その後HiveSyncを使用してデータを第2の領域に複製します。HiveSyncは2016年にUberが開発を開始したもので、現在約300PBのデータを管理しており、80万のHiveテーブルに格納され、毎日8PBのデータが複製されています。
Uberは、この複製サービスをオープンソース化することを計画しており、ますます増加する拡張性と低遅延のニーズに対応する新しい機能の開発を続けていく予定です。HiveSyncは、Uberがバッチ分析と機械学習トレーニングシステムをGoogle Cloudに移行する過程で重要な役割を果たしています。
ポイント:
🌟 Uberはインドでドライバーによるデータ分類の新しいタスクを開始し、AIモデルの発展を支援しています。
👥 数多くのドライバーがこの「デジタルタスク」に参加しており、12の都市で利用可能です。
💾 Uberは同時に350PBのデータレイクを公開し、データ保護ツールであるHiveSyncをリリースしました。
