Jan團隊發佈Jan-v2-VL-Max！30B多模態模型專攻長週期Agent任務，長序列執行穩超Gemini 2.5 Pro

在AI智能體（Agent）向複雜、多步任務演進的關鍵階段，開源社區迎來一員新銳猛將。Jan團隊今日正式發佈 Jan-v2-VL-Max——一款300億參數的多模態大模型，專爲長週期、高穩定性自動化執行場景打造，在關鍵指標上已超越谷歌Gemini2.5Pro與DeepSeek R1，爲開源Agent生態注入強勁動力。

聚焦“誤差累積”難題，專治多步執行“失焦”

當前多模態Agent在執行長序列操作（如自動化UI操作、跨應用任務流）時，常因中間步驟微小偏差導致後續任務全面偏離，即“誤差累積”問題。Jan-v2-VL-Max針對性引入 LoRA-based RLVR(Reinforced Long-horizon Vision-Language Reasoning)技術，在保持Qwen3-VL-30B基座能力的同時，顯著提升推理鏈的一致性與抗干擾能力，確保任務在數十步操作後仍精準執行。

“幻象遞減回報”測試登頂，定義Agent新基準

該模型在全新評測基準 “幻象遞減回報”（Hallucination-Decay Return， HDR）中表現突出。該基準專門衡量Agent在任務長度延伸過程中，因幻覺或邏輯斷裂導致回報率下降的速度。Jan-v2-VL-Max在長序列任務中維持高回報穩定性，超越Gemini2.5Pro與DeepSeek R1，驗證其在真實自動化場景中的可靠性。

即開即用，支持本地高效部署

爲降低使用門檻，Jan團隊提供:

- 網頁端直接交互界面，用戶可上傳圖像、輸入指令，測試多步自動化流程;

- vLLM優化本地部署方案，支持在消費級GPU上高效運行，便於開發者集成至自研Agent系統。

開源社區的“長思考”突破

Jan-v2-VL-Max雖在長序列執行上相較基座模型僅實現“小幅提升”，但在Agent領域，每1%的穩定性提升都意味着可用性質變。這一成果標誌着開源社區正從“單步響應”邁向“長程規劃”，爲UI自動化、機器人控制、多工具協同等高價值場景提供可落地的開源基座。

AIbase認爲，當大模型競爭從“誰更聰明”轉向“誰更可靠”，Jan團隊此次聚焦執行穩定性的技術路徑，恰逢其時。在Agent即將成爲AI主交互範式的浪潮下，Jan-v2-VL-Max或將成爲開發者構建“永不掉鏈子”智能體的關鍵拼圖。

DeepSeek V4 正式版疑定檔 8 月 3 日：硅基流動漲價露馬腳，API 已能答對新題

DeepSeek V4正式版自7月中旬灰度測試後一度跳票，官方至今未公佈發佈時間。但硅基流動平臺通知自8月3日起，將DeepSeek V4 Pro的緩存命中價格從每百萬Token 0.1元大幅上調至1.0元。這一突兀漲價被外界視爲DeepSeek V4正式版即將上線的重要信號，8月3日或成爲發佈節點。

DeepSeek-V4-Flash API公測上線 Agent能力全面爆發

科技圈迎來效率革命，字節跳動旗下Seed團隊發佈Seedance2.5音視頻聯合生成模型，主打一鏡成片。單次生成時長從15秒延至30秒，並支持多輪無縫延長，讓複雜情節更連貫。模型深度優化材質、光影與膚質，有效消除塑料感，實現逼真實拍質感，賦能多個產業場景。

韓國最大 AI 模型問世：LG 發佈 7500 億參數 K-EXAONE 2.0，Apache 開源直面中國模型

LG AI研究院7月31日在Hugging Face發佈K-EXAONE 2.0模型，爲韓國主權AI項目第二代。採用混合注意力MoE架構，總參數7500億、激活參數370億，規模是初代3倍以上，系韓國最大AI基礎模型。模型以Apache 2.0完全開源，在韓國AI發展史中頗爲罕見。

Jan團隊發佈Jan-v2-VL-Max！30B多模態模型專攻長週期Agent任務，長序列執行穩超Gemini 2.5 Pro

相關推薦

DeepSeek V4 正式版疑定檔 8 月 3 日：硅基流動漲價露馬腳，API 已能答對新題

我國人工智能迎來全產業鏈突破，將加快《人工智能法》立法

DeepSeek-V4-Flash API公測上線 Agent能力全面爆發

韓國最大 AI 模型問世：LG 發佈 7500 億參數 K-EXAONE 2.0，Apache 開源直面中國模型

DeepSeek-V4-Flash正式版上線，130億激活參數撬動Agent戰場