一張照片,一部手機,你就能在AI造的世界裏漫步。
4月27日,螞蟻靈光App正式上線“體驗世界模型 ”功能,成爲業界首個可在移動端體驗世界模型的AGI產品。用戶只需上傳一張圖片,即可在手機上最長60秒探索3D世界,並且用手遊操控視角,像玩遊戲一樣在裏面走動探索,從觸發指令到開始探索,僅需秒級。這是業內首次實現在端側跑起世界模型,分鐘級的長時一致性、實時可交互的體驗再一次引領了AGI產品。靈光一直致力於探索智能的邊界,在此之前靈光上線“閃應用”功能,率先實現在手機端30秒生應用引領全民Wish Coding。

(圖說:手機上打開靈光APP,點擊左下角「➕」號上傳圖片,點擊「生成圖中世界」,即可體驗世界模型)
世界模型被視爲通向AGI(通用人工智能)的重要路徑之一,是連接數字世界與物理世界的重要橋樑。此次靈光App“體驗世界模型 ”功能背後接入了螞蟻靈波LingBot-World-Fast世界模型,該模型也已經開源。
靈光App爲用戶提供了便捷的世界模型體驗入口。打開靈光App,在對話框上傳一張圖片後,系統會智能推薦操作指令,用戶選擇“生成圖中世界”。或者,直接輸入“幫我用第一人稱視角探索這個世界”這類自然語言,系統會自動進入世界模型生成流程。從觸發指令到開始探索,僅需秒級。
進入世界模型體驗頁面後,靈光App針對移動端用戶的操作習慣進行了精心設計,創新性地引入了手遊搖桿操控方式,讓用戶以最熟悉的方式探索AI即時生成的3D世界。具體而言,屏幕左側搖桿負責控制角色在3D場景中的位移,用戶可前後左右自由行走;右側搖桿則負責控制視角旋轉,實現全方位環顧探索。這一操控邏輯與主流3D手遊高度一致,玩家無需額外學習,即可上手操控,真正做到“零門檻沉浸”。
世界模型的移動端部署,是行業裏公認的難題。算力需求大、延遲控制難、終端性能參差不齊,每一條都是實際的工程挑戰。靈光團隊採用高效、低延遲的流式傳輸技術,實現了百毫秒級的響應延遲,用戶從觸發指令到開始探索3D世界僅需秒級,打破了此前世界模型“高門檻、高算力、難落地”的刻板印象。
靈光App負責人蔡偉表示,“體驗世界模型功能是靈光在探索智能邊界的又一實踐。此前靈光推出的"閃應用"功能可實現自然語言30秒生應用,也是把原本專業開發者的Coding能力給到普通用戶。靈光希望不斷探索智能的邊界,挖掘用戶未被滿足的需求,把好的AI體驗給到所有人。”
目前,用戶可在各大應用商店下載靈光App,直接體驗世界模型功能。
