近日,Uber 在印度推出了一項新服務,允許其共享乘車和外賣司機利用空閒時間,通過應用程序參與數據分類和信息收集的工作。這一消息由 Uber AI 解決方案全球負責人 Megha Yethadka 在 LinkedIn 上發佈,她表示,司機在日常工作中可能會有空閒時間,或者希望在晚上賺取一些額外收入。

這項新的工作任務包括審查照片、計數物體、分類文本、錄製音頻以及數字化收據等多種形式。Yethadka 提到,這些任務將用於支持 Uber 全球的企業客戶,幫助他們開發生成式人工智能模型或消費應用。

Yethadka 進一步表示:“到目前爲止,這些任務一直是由獨立承包商在應用程序外完成的。初步結果非常可喜,我們期待將這項服務進一步擴展。” 在她發佈的視頻中,提到了這項服務有可能在全球範圍內推廣。

Uber 印度及南亞的總裁 Prabhjeet Singh 表示,目前這些新任務已經在12個城市推出,且 “數以萬計的司機” 已開始參與 Uber 所稱的 “數字任務”。

Uber 首席執行官 Dara Khosrowshahi 在8月份的財報電話會議上提到,數字任務的推出是因爲 Uber 公司擁有將任務分配給全球賺取者的核心能力。“你將看到一種不同類型的賺取者,他們將爲全球令人興奮的 AI 發展工作。”Khosrowshahi 表示。

此外,Uber 還在同一天宣佈,他們正在運營一個350PB(拍字節)的數據湖,並開發了一種名爲 “HiveSync” 的工具來保護這些數據。Uber 工程團隊的公告解釋說,以前 Uber 的數據基礎設施在兩個數據中心區域之間運行以確保冗餘,但這使得第二個區域在運行時沒有實際使用,產生了不必要的費用。

因此,Uber 啓動了 “單區域計算”(SRC)計劃,將所有批量計算任務在單一區域內運行,然後通過 HiveSync 將數據複製到第二個區域。HiveSync 是 Uber 在2016年開始開發的,現已管理約300PB 的數據,存儲在80萬張 Hive 表中,每天覆制8PB 的數據。

Uber 表示,他們計劃開源這一複製服務,並將繼續開發新功能,以滿足日益增長的可擴展性和低延遲的需求,HiveSync 在 Uber 將批量數據分析和機器學習訓練系統遷移到谷歌雲過程中也發揮着重要作用。

劃重點:  

🌟 Uber 在印度推出司機數據分類新任務,幫助 AI 模型發展。  

👥 數以萬計的司機已參與這一 “數字任務”,可在12個城市中使用。  

💾 Uber 同時發佈了一個350PB 的數據湖,並推出數據保護工具 HiveSync。