在人工智能領域,微軟研究院 AI Frontiers 實驗室近日發佈了全新的 Fara1.5系列智能體模型。這一系列專爲瀏覽器場景設計,旨在提升計算機使用的智能化水平。Fara1.5系列涵蓋了三個不同參數規模的版本,分別是4B、9B 和27B。
這款智能體模型與 MagneticLite 沙盒瀏覽器界面配合使用,能夠直接讀取瀏覽器的截圖,並通過模擬鼠標和鍵盤操作,自動完成各種網頁任務。Fara1.5的工作流程基於 “觀察 — 思考 — 行動” 的循環,每一步都結合歷史對話和最近的三張瀏覽器截圖,以此生成推理內容和後續動作。

在性能方面,Fara1.5-27B 在 Online-Mind2Web 基準測試中取得了72% 的任務成功率,顯著高於 OpenAI 的 Operator(58.3%)和 Gemini2.5Computer Use(57.3%)等競品。而即使是 Fara1.5-9B 版本,其成功率也達到了63.4%。這種高效的表現讓 Fara1.5系列在衆多智能體中脫穎而出。
Fara1.5的訓練採用了約200萬條樣本進行微調,其中60% 來自網頁軌跡,12.8% 來自合成環境,12.5% 與用戶交互有關,8.8% 爲事實錨定,4.9% 則來源於視覺問答。這種豐富多樣的訓練數據大大提升了模型的適應性和智能水平。
爲了確保用戶的安全與隱私,Fara1.5在以下三種情況下會主動停止操作並詢問用戶:缺少個人信息、任務描述不清晰以及即將執行未經批准的不可逆操作。此外,所有操作記錄都將存儲在 MagneticLite 沙盒中,確保智能體與用戶設備之間的安全邊界。
隨着技術的不斷進步,微軟的 Fara1.5系列無疑爲用戶帶來了更加智能和便捷的瀏覽體驗,展示了人工智能在日常計算機使用中的巨大潛力。
劃重點:
🌟 Fara1.5系列模型任務成功率高達72%,超越 OpenAI 等競品。
🖥️ 該模型通過沙盒瀏覽器界面完成網頁任務,操作方式直觀易用。
🔒 強調用戶安全,主動詢問模糊任務與個人信息保護,確保隱私安全。
