2026年1月29日,商湯科技正式宣佈開源其多模態自主推理模型 SenseNova-MARS,並同步提供8B 和32B 兩個版本。這款模型的發佈,標誌着多模態大模型在自主推理領域邁出了關鍵一步。
技術突破:首個 Agentic VLM 模型
SenseNova-MARS在技術架構上實現了顯著創新,是行業內首個將動態視覺推理與圖文搜索深度融合的 Agentic VLM(智能體視覺語言模型)。
自主推理:模型不僅能理解圖像內容,更具備類似智能體的自主規劃與推理能力。
深度融合:通過將實時搜索能力融入視覺理解過程,模型能夠處理需要外部知識支撐的複雜視覺任務。
行業影響與意義
商湯此次選擇雙版本開源,旨在爲全球開發者提供更具靈活性的研究工具:
8B 版本:兼顧性能與效率,適合在端側設備或有限算力環境下部署。
32B 版本:提供更強大的邏輯推理上限,滿足複雜行業應用的需求。
