Reka AI 發佈全新開源模型 Reka Flash 3：21 億參數的通用推理模型

在當前快速發展的人工智能領域，開發者和組織面臨着多種實際挑戰，例如高計算需求、延遲問題以及缺乏真正靈活的開源模型等。這些問題常常限制了進展，許多現有的解決方案需要昂貴的雲基礎設施，或者過大，無法在設備上應用，因此迫切需要高效且靈活的模型來填補這一空白。

爲此，Reka AI 推出了 Reka Flash3，這是一款從零開始構建的推理模型，擁有21億個參數。該模型旨在支持一般對話、編碼輔助、指令跟隨，甚至函數調用，成爲各種應用的實用基礎。其訓練過程結合了公開獲取的數據集和合成數據集，並通過精心的指令調優及 REINFORCE Leave One-Out（RLOO）方法進行強化學習。這種周密的訓練方法旨在在能力與效率之間取得平衡，使 Reka Flash3在衆多同類模型中脫穎而出。

在技術層面上，Reka Flash3具備多項特性，使其既靈活又資源高效。一個顯著特點是其可以處理最多32k 個令牌的上下文長度，方便處理較長的文檔和複雜任務，而不會造成過大壓力。此外，該模型還引入了 “預算強制” 機制，通過特定的 < reasoning > 標籤，使用戶能夠限制模型的思維過程步驟，從而保證在不增加計算開銷的情況下保持一致的表現。同時，Reka Flash3非常適合在設備上部署，完全精度大小爲39GB（fp16），通過4位量化可以進一步壓縮至11GB。這種靈活性使得在本地部署時更爲流暢，相比更大且資源密集的模型更具優勢。

評估指標和性能數據進一步印證了該模型的實用性。例如，雖然 Reka Flash3在 MMLU-Pro 的得分爲65.0，表現中等，但結合網絡搜索等額外知識源，其競爭力依然不容小覷。此外，Reka Flash3的多語言能力在 WMT’23的 COMET 得分達到83.2，顯示出其對非英語輸入的合理支持，儘管其主要集中於英語。這些結果，加上其相對於 QwQ-32B 等同行的高效參數數量，突顯了其在實際應用中的潛力。

綜上所述，Reka Flash3代表了一種更爲可接近的人工智能解決方案。通過在性能和效率之間的巧妙平衡，該模型爲一般聊天、編碼和指令任務提供了一種穩健且靈活的選擇。其緊湊的設計、增強的32k 令牌上下文窗口及創新的預算強制機制，使其成爲適合設備部署和低延遲應用的實用選項。對於尋求既有能力又可管理模型的研究人員和開發者而言，Reka Flash3無疑提供了一個令人期待的基礎。

介紹:https://www.reka.ai/news/introducing-reka-flash

模型：https://huggingface.co/RekaAI/reka-flash-3

劃重點:
🌟 Reka Flash3是由 Reka AI 推出的開源推理模型，擁有21億參數，適用於多種應用場景。
💻 該模型支持32k 令牌的上下文處理，適合處理複雜任務，且可在設備上高效運行。
📈 性能數據表明，Reka Flash3在多語言能力和實際應用中表現出色，是一種可接近的 AI 解決方案。

Reka AI 發佈全新開源模型 Reka Flash 3：21 億參數的通用推理模型

相關推薦

年薪55.5萬美元！OpenAI 急招安全防範負責人，挑戰AI風險！

阿里巴巴推出新款 Qwen 模型，三秒音頻即可克隆聲音

亞馬遜 AGI 部門換帥:雲業務老將接棒，力求終結 AI “落後局勢”

機器人界的GitHub誕生！Tnkr平臺上線，讓造機器人像寫代碼一樣簡單

谷歌搜索測試“+”按鈕:允許用戶上傳圖片文檔，利用 Gemini AI 進行深度分析

​Reka AI 發佈全新開源模型 Reka Flash 3：21 億參數的通用推理模型

相關推薦

年薪55.5萬美元！OpenAI 急招安全防範負責人，挑戰AI風險！

阿里巴巴推出新款 Qwen 模型，三秒音頻即可克隆聲音

亞馬遜 AGI 部門換帥:雲業務老將接棒，力求終結 AI “落後局勢”

​機器人界的GitHub誕生！Tnkr平臺上線，讓造機器人像寫代碼一樣簡單

谷歌搜索測試“+”按鈕:允許用戶上傳圖片文檔，利用 Gemini AI 進行深度分析

Reka AI 發佈全新開源模型 Reka Flash 3：21 億參數的通用推理模型

機器人界的GitHub誕生！Tnkr平臺上線，讓造機器人像寫代碼一樣簡單