隨着AI公司走向成熟,高質量數據的爭奪已經成爲整個行業最激烈的戰場之一,催生了Mercor、Surge等公司,其中最引人注目的是Alexandr Wang創立的Scale AI。但如今Wang已經轉身執掌Meta的AI業務,許多投資人看到了機會,願意爲那些在訓練數據收集方面擁有令人信服新策略的公司提供資金。
Y Combinator畢業生Datacurve就是這樣一家公司,專注於爲軟件開發提供高質量數據。週四,該公司宣佈完成1500萬美元A輪融資,由Chemistry的Mark Goldberg領投,來自DeepMind、Vercel、Anthropic和OpenAI的員工參與投資。此前該公司還完成了270萬美元種子輪融資,前Coinbase首席技術官Balaji Srinivasan參與了投資。

Datacurve採用賞金獵人系統來吸引熟練的軟件工程師完成最難獲取的數據集。公司爲這些貢獻付費,迄今已分發超過100萬美元的賞金。
但聯合創始人Serena Ge表示,最大的動力並非金錢。對於軟件開發這樣的高價值服務來說,數據工作的報酬總是遠低於傳統僱傭關係,因此公司最重要的優勢是積極的用戶體驗。
Ge說,我們把這當作一個消費產品來對待,而不是數據標註操作。他們花了大量時間思考如何優化,讓他們想要的人感興趣並進入平臺。
這一點在訓練後數據需求變得更加複雜的當下尤爲重要。早期模型在簡單數據集上訓練,而今天的AI產品依賴複雜的強化學習環境,這些環境需要通過特定和戰略性的數據收集來構建。隨着環境變得更加複雜,數據要求在數量和質量上都變得更加嚴苛,這一因素可能會讓Datacurve這樣的高質量數據收集公司獲得優勢。
作爲一家早期公司,Datacurve目前專注於軟件工程領域,但Ge表示這種模式同樣適用於金融、營銷甚至醫學等領域。
Ge解釋說,他們現在正在做的是爲訓練後數據收集創建一個基礎設施,吸引並留住各自領域的高水平人才。
在AI模型訓練進入新階段的背景下,數據質量的重要性正在超越數據數量。Scale AI曾經憑藉規模化的數據標註服務佔據市場主導地位,但隨着Wang離開去Meta擔任要職,市場格局開始鬆動。Datacurve的賞金獵人模式和消費產品思維,爲這個競爭激烈的賽道帶來了新的可能性。從投資陣容來看,來自頂級AI實驗室員工的參與,本身就是對Datacurve數據質量和戰略方向的最好背書。這場圍繞高質量訓練數據的爭奪戰,纔剛剛進入新的回合。
