在當前快速發展的人工智能領域,開發者和組織面臨着多種實際挑戰,例如高計算需求、延遲問題以及缺乏真正靈活的開源模型等。這些問題常常限制了進展,許多現有的解決方案需要昂貴的雲基礎設施,或者過大,無法在設備上應用,因此迫切需要高效且靈活的模型來填補這一空白。

QQ_1741747624441.png

爲此,Reka AI 推出了 Reka Flash3,這是一款從零開始構建的推理模型,擁有21億個參數。該模型旨在支持一般對話、編碼輔助、指令跟隨,甚至函數調用,成爲各種應用的實用基礎。其訓練過程結合了公開獲取的數據集和合成數據集,並通過精心的指令調優及 REINFORCE Leave One-Out(RLOO)方法進行強化學習。這種周密的訓練方法旨在在能力與效率之間取得平衡,使 Reka Flash3在衆多同類模型中脫穎而出。

在技術層面上,Reka Flash3具備多項特性,使其既靈活又資源高效。一個顯著特點是其可以處理最多32k 個令牌的上下文長度,方便處理較長的文檔和複雜任務,而不會造成過大壓力。此外,該模型還引入了 “預算強制” 機制,通過特定的 < reasoning > 標籤,使用戶能夠限制模型的思維過程步驟,從而保證在不增加計算開銷的情況下保持一致的表現。同時,Reka Flash3非常適合在設備上部署,完全精度大小爲39GB(fp16),通過4位量化可以進一步壓縮至11GB。這種靈活性使得在本地部署時更爲流暢,相比更大且資源密集的模型更具優勢。

評估指標和性能數據進一步印證了該模型的實用性。例如,雖然 Reka Flash3在 MMLU-Pro 的得分爲65.0,表現中等,但結合網絡搜索等額外知識源,其競爭力依然不容小覷。此外,Reka Flash3的多語言能力在 WMT’23的 COMET 得分達到83.2,顯示出其對非英語輸入的合理支持,儘管其主要集中於英語。這些結果,加上其相對於 QwQ-32B 等同行的高效參數數量,突顯了其在實際應用中的潛力。

QQ_1741747656664.png

綜上所述,Reka Flash3代表了一種更爲可接近的人工智能解決方案。通過在性能和效率之間的巧妙平衡,該模型爲一般聊天、編碼和指令任務提供了一種穩健且靈活的選擇。其緊湊的設計、增強的32k 令牌上下文窗口及創新的預算強制機制,使其成爲適合設備部署和低延遲應用的實用選項。對於尋求既有能力又可管理模型的研究人員和開發者而言,Reka Flash3無疑提供了一個令人期待的基礎。

介紹:https://www.reka.ai/news/introducing-reka-flash

模型:https://huggingface.co/RekaAI/reka-flash-3

劃重點:  

🌟 Reka Flash3是由 Reka AI 推出的開源推理模型,擁有21億參數,適用於多種應用場景。  

💻 該模型支持32k 令牌的上下文處理,適合處理複雜任務,且可在設備上高效運行。  

📈 性能數據表明,Reka Flash3在多語言能力和實際應用中表現出色,是一種可接近的 AI 解決方案。