微軟近日發佈了一款名爲 UserLM-8b 的新型“陪練夥伴”模型,其核心功能是評估和細化 AI 助手的性能。該模型通過模擬真實用戶進行多輪對話,旨在預測 AI 助手在面對實際用戶時的表現和可靠性。

UserLM-8b 旨在突破傳統測試模型的侷限,能夠模擬出更接近真實人類的交互行爲。給定一個核心任務意圖後,它可以生成不同風格和措辭的開場白。在後續交流中,該模型不會一次性透露所有需求,而是能像真實用戶一樣根據上下文逐漸釋放信息,並繼續提問。

QQ20251010-112132.png

該模型具有顯著的類人化語言風格,使用口語化或略帶非正式的表達。此外,UserLM-8b 還能圍繞核心任務添加相關主題,模擬真人聊天中**“詢問想到的任何內容”**的自由風格。

UserLM-8b 的另一項關鍵能力是能在適當的時候主動結束對話。當它確定對話目標已實現或無法繼續時,模型會生成一個特殊的 <|endconversation|> token 來終止會話。

通過 UserLM-8b 提供的逼真且富有變化的對話數據,微軟可以更高效、更精準地評估其 AI 助手的魯棒性和實用性,進一步提升 AI 產品的用戶體驗。

地址:https://huggingface.co/microsoft/UserLM-8b