今日,小米公司正式對外發布具身大模型MiMo-Embodied,並宣佈該模型將全面開源。這一動作標誌着小米在通用具身智能研究領域邁出了重要一步。

小米具身大模型MiMo-Embodied正式發佈:全面開源

隨着具身智能在家居場景的逐步落地以及自動駕駛技術的規模化應用,機器人與車輛如何更好地實現認知與能力互通,室內作業智能與室外駕駛智能能否相互促進,成爲行業內亟待解決的關鍵問題。小米此次發佈的MiMo-Embodied模型,正是針對這些挑戰而研發,它成功打通了自動駕駛與具身智能兩大領域,實現了任務統一建模,從“垂直領域專用”向“跨域能力協同”實現了關鍵跨越。

小米具身大模型MiMo-Embodied正式發佈:全面開源

MiMo-Embodied模型具有三大核心技術亮點。首先,它具備跨域能力覆蓋,同步支持具身智能的三大核心任務,即可供性推理、任務規劃、空間理解,以及自動駕駛的三大關鍵任務,即環境感知、狀態預測、駕駛規劃,爲全場景智能提供了有力支撐。其次,該模型驗證了室內交互能力與道路決策能力的知識轉移協同效應,爲跨場景智能融合提供了新的思路。最後,MiMo-Embodied採用“具身/自駕能力學習CoT推理增強RL精細強化”多階段訓練策略,有效提升了模型在真實環境中的部署可靠性。

在性能表現上,MiMo-Embodied在涵蓋感知、決策與規劃的29項核心基準測試中確立了開源基座模型的性能新標杆,全面優於現有的開源、閉源及專用模型。在具身智能領域,該模型在17個基準測試上取得SOTA成績,重新定義了任務規劃、可供性預測及空間理解的能力邊界;在自動駕駛領域,它在12個基準測試上表現卓越,實現了環境感知、狀態預測與駕駛規劃的全鏈路性能突破。此外,在通用視覺語言領域,MiMo-Embodied也展現了卓越的泛化性,在夯實通用感知與理解能力的同時,進一步在多項關鍵基準上實現了顯著的性能躍升。

開源地址:

  • https://huggingface.co/XiaomiMiMo/MiMo-Embodied-7B