亞馬遜週一發佈了Nova Act,這是一款能夠控制網絡瀏覽器並獨立執行簡單操作的通用AI代理。同時推出的還有Nova Act SDK,允許開發人員使用Nova Act構建代理原型。
Nova Act由亞馬遜在舊金山新設立的AGI實驗室開發,這也將爲該公司即將推出的Alexa+(亞馬遜語音助手的生成式AI增強版)提供關鍵功能。不過目前發佈的Nova Act版本被定位爲"研究預覽版",開發人員可通過nova.amazon.com網站訪問Nova Act工具包。

這一產品是亞馬遜與OpenAI的Operator和Anthropic的Computer Use競爭的明確舉措。多家科技巨頭都認爲,能爲用戶導航網絡的AI代理將大幅提升當前AI聊天機器人的實用性。雖然亞馬遜並非該領域的先行者,但通過Alexa+,它的覆蓋範圍可能成爲最廣泛的。
據亞馬遜介紹,開發人員使用Nova Act SDK可實現爲用戶自動執行基本操作,如網上訂餐或預訂。該工具包支持整合多種功能,讓AI代理瀏覽網頁、填寫表格或在日曆上選擇日期。
亞馬遜聲稱Nova Act在內部測試中表現優於競爭對手。在ScreenSpot Web Text評估中,Nova Act得分94%,超過了OpenAI的CUA(88%)和Anthropic的Claude3.7Sonnet(90%)。然而,亞馬遜並未使用WebVoyager等更常見的代理評估對Nova Act進行基準測試。
Nova Act是由前OpenAI研究員David Luan和Pieter Abbeel共同領導的AGI實驗室的首個公開產品。兩人都曾創立自己的AI創業公司——Luan創辦了Adept,Abbeel共同創辦了Covariant——去年被亞馬遜聘請領導其AI代理工作。
Luan告訴TechCrunch,他認爲代理是創建超級智能AI系統的關鍵一步,他將AGI定義爲"能夠幫助完成人類在計算機上所做一切的AI系統"。他表示團隊設計Nova Act SDK的目標是可靠地自動執行簡短任務,並讓開發人員能夠精確定義何時需要人工干預工作流程。
早期AI代理面臨的主要挑戰是跨領域可靠性。在的測試中,現有系統普遍速度慢、難以長時間獨立運行,且容易犯人類不會犯的錯誤。市場將很快看到亞馬遜是否突破了這些限制,或者其代理是否也存在困擾競爭對手的同樣問題。
