大模型評測平臺Compass Arena新增多模態大模型競技版塊

上海人工智能實驗室司南 OpenCompass 團隊與魔搭 ModelScope 最近宣佈，他們的大模型評測平臺 Compass Arena 進行了重要更新，推出了全新的多模態大模型競技版塊 Compass Multi-Modal Arena。這一新版塊爲用戶提供了一個平臺，可以體驗和比較多款主流多模態大模型的效果，幫助用戶找到最適合自己需求的模型。

微信截圖_20240813080725.png

Compass Multi-Modal Arena 的官網和 ModelScope 頁面已向公衆開放，提供了一個簡單易用的界面，用戶可以上傳圖像並輸入問題，系統會安排兩個匿名的多模態大模型根據輸入內容生成答案。用戶基於生成內容的質量進行主觀評估，選擇他們認爲表現更出色的模型。評估完成後，用戶可以看到每個模型的名稱。

微信截圖_20240813080734.png

平臺還內置了特色題庫，方便用戶在不便上傳圖像時使用，題庫側重於主觀視覺問答任務，如迷因理解、藝術品賞析和攝影作品賞析等類型。這一設計旨在評估多模態大模型在主觀任務上的性能和用戶體驗。

Compass Multi-Modal Arena 官網

https://opencompass.org.cn/arena?type=multimodal

ModelScope 頁面:

https://modelscope.cn/studios/opencompass/CompassArena

HuggingFace 頁面

https://huggingface.co/spaces/opencompass/CompassArena

OpenCompass 多模態評測工具開源鏈接:

https://github.com/open-compass/VLMEvalKit

Airbnb CEO Brian Chesky進軍AI:計劃成立全新人工智能實驗室

Airbnb正計劃成立全新人工智能實驗室，探索下一代AI產品與交互方式。該消息由CEO Brian Chesky透露，已獲知情人士證實。儘管Airbnb已在內部使用AI編程工具，但Chesky認爲當前大語言模型尚未完全成熟，因此公司尚未與任何模型廠商達成深度合作。

雲從科技的多模態大模型獲全球認可，登頂 OpenCompass 榜單

近日，雲從科技自主研發的多模態大模型 “從容 V2.0” 在全球知名的 OpenCompass 多模態榜單上以高達80.7分的優異成績脫穎而出，榮登榜首。這一成就標誌着中國在人工智能領域的進一步突破，尤其是在視覺感知、認知理解和跨領域應用等專業領域的表現令人矚目。“從容 V2.0” 模型的成功不僅得益於其在技術上的創新，更是雲從科技在多模態人工智能研究領域多年耕耘的成果。該模型能夠處理和分析多種形式的數據，包括圖像、文本和音頻，展現出強大的跨媒體理解能力。這種能力使其在

智元機器人開源全球首個百萬真機數據集AgiBot World

近日，上海機器人初創公司智元機器人聯合上海人工智能實驗室、國家地方共建人形機器人創新中心以及上海庫帕思，正式開源百萬真機數據集AgiBot World，旨在支持泛化和通用的機器人大模型訓練。據悉，這是全球首個基於全域真實場景、全能硬件平臺、全程質量把控的百萬真機數據集。AgiBot World數據集誕生於智元自建的大規模數據採集工廠與應用實驗基地，空間總面積超過4000平方米，包含3000多種真實物品，復刻了家居、餐飲、工業、商超和辦公五大核心場景，收錄了80多種日常生活中的

重磅：中國開源首個百萬級機器人數據集，具身智能迎來ImageNet時刻

智元機器人攜手上海人工智能實驗室等機構，重磅發佈AgiBot World數據集，這是全球首個基於真實場景的百萬級機器人數據集。相較谷歌的Open X-Embodiment，其長程數據規模提升10倍，場景覆蓋擴大100倍，數據質量達到工業級標準。這個被譽爲具身智能領域"ImageNet時刻"的開源項目展現了令人驚歎的機器人能力。從客廳插花到廚房做飯，從超市收銀到工廠分揀，AgiBot World涵蓋了家居、餐飲、工業、商超和辦公五大核心場景，收錄了八十餘種日常生活技能。在硬件配置上，機器人配備了360度環繞式

大模型評測平臺Compass Arena新增多模態大模型競技版塊

相關推薦

Airbnb CEO Brian Chesky進軍AI:計劃成立全新人工智能實驗室

Yann LeCun 直言 Meta 新 AI 負責人缺乏經驗，扎克伯格引發變革

雲從科技的多模態大模型獲全球認可，登頂 OpenCompass 榜單

智元機器人開源全球首個百萬真機數據集AgiBot World

重磅：中國開源首個百萬級機器人數據集，具身智能迎來ImageNet時刻