微軟的 Bing 團隊近日宣佈開源其最新的詞嵌入模型 “Harrier”。該模型在多語言 MTEB v2 基準測試中表現優異,支持超過 100 種語言,爲用戶提供了更爲強大的語言處理能力。Harrier 的訓練數據包括超過 20 億個示例以及來自 GPT-5 的合成數據,採用了 32,000 個詞元的上下文窗口,使其在多語言任務中具備更高的準確性和靈活性。

Bing,必應,new Bing,搜索引擎,微軟,AI,人工智能,chatGPT

在參數配置上,Harrier 擁有一個完整的 27 億參數版本,此外還推出了兩個更小的版本,分別爲 0.6 億參數和 2.7 億參數,旨在爲低性能硬件的用戶提供可行的解決方案。這三款模型均已在 Hugging Face 平臺上以 MIT 許可證發佈,方便開發者進行使用和集成。

嵌入模型在人工智能系統中扮演着至關重要的角色,尤其是在搜索、信息檢索和數據組織等任務中。隨着 AI 技術的發展,嵌入模型的需求愈加迫切,能夠幫助 AI 代理獨立處理更復雜的多步驟任務。因此,微軟表示,Harrier 的發佈將推動 AI 技術在各個領域的應用。

未來,微軟計劃將 Harrier 技術集成到 Bing 搜索引擎中,以及用於新一代 AI 代理的基礎服務。這一戰略將進一步提升 Bing 在 AI 領域的競爭力,滿足用戶對高效信息處理的需求。

劃重點: 

🌍 Harrier 模型支持超過 100 種語言,具備強大的多語言處理能力。  

💡 該模型採用超過 20 億個示例及 GPT-5 數據訓練,確保了高準確性。  

🚀 微軟計劃將 Harrier 集成到 Bing 及新一代 AI 代理服務中,提升搜索引擎性能。