人工智能初創公司 Liquid AI 今日正式發佈並開源了全新的端側大模型LFM2.5-8B-A1B。該模型專爲消費級硬件的工具調用和複雜指令遵循而設計,在保持極低計算成本的同時,顯著提升了端側設備的推理與推理性能。

在架構上,該模型採用了稀疏混合專家(MoE)設計,總參數量爲 8.3B。得益於這種稀疏性,模型在每個 Token 生成時僅激活 1.5B 參數,這使得它能夠流暢地在手機及筆記本電腦等本地設備上運行。

image.png

長文本擴展與推理能力升級

相比前代產品,LFM2.5 將上下文窗口從 32K 大幅擴展至 128K 詞元,預訓練數據量也從 12T 提升至 38T。作爲一款純推理模型,它會在輸出最終答案前生成顯式的思維鏈,且其高壓縮率的詞表能更高效地處理中文、阿拉伯文等九種語言。

爲了解決長推理中的邏輯死循環與幻覺問題,開發團隊在訓練中引入了兩階段強化學習(RL)。其中,偏好優化有效減少了長鏈路推理中的“死循環”,而專門的防幻覺獎勵機制則讓模型在面對超出知識庫的問題時能夠主動拒絕回答。

端側性能強勁與生態全面兼容

在性能表現上,LFM2.5 實現了爆發式增長,其在邏輯推理與反幻覺基準測試中的得分大幅超越前代,甚至在指令遵循上媲美更大參數量的模型。在工具調用方面,模型默認輸出高效的 Python 函數調用,並支持在系統提示詞中無縫切換爲 JSON 格式。

該模型在發佈首日便獲得了主流推理生態的全面支持,包括 llama.cpp、MLX、vLLM 和 SGLang。在硬件實測中,它在 M5 Max 芯片上的解碼速度高達每秒 253 字節,而在手機端也能達到每秒約 30 字節,完美兼顧了端側運行的私密性與高效率。