以OpenClaw爲代表的自主執行智能體爆火,標誌着AI應用已從“對話交互”向“任務執行”加速演進。企業在加速擁抱的同時,也面臨着算力浪費、安全合規等多重挑戰。如何讓智能體真正實現規模化、可持續地落地,成爲產業界共同關注的核心議題。

3月26日,在中關村論壇未來產業創新發展論壇中,螞蟻數科大模型技術創新部總經理章鵬在演講中表示,OpenClaw的爆發將帶來企業級AI範式革命,推動大模型在產業場景的落地從‘參數競賽’走向“Token效能競爭’。”

image.png

圖說:螞蟻數科大模型技術創新部總經理章鵬在中關村論壇演講

OpenClaw類智能體的快速普及,反映了市場對自主執行型智能體的需求,但在真實產業環境中,其落地面臨顯著挑戰:由於缺乏對行業規則、業務流程的深度理解,智能體在執行復雜任務時往往反覆調用工具,導致Token消耗遠高於有效產出。據瞭解,在一些高頻調用場景中,OpenClaw的Token消耗成本可達集成式Agent成本的數十倍甚至百倍,這種高投入低產出的模式,讓其在產業規模化應用中面臨可持續性難題。

“大模型產業落地的下半場,核心命題不是模型參數規模的競爭,而是單位Token效能的持續提升。”章鵬認爲,企業應結合實際場景與需求,選擇大小模型結合的AI解決方案,以更低算力成本實現更高業務價值。

以金融場景爲例,該領域每天需處理海量高頻低時延的任務——快速識別意圖、提取關鍵信息、檢索排序等等,這些任務具備高併發、快響應、高精準要求,傳統行業推理大模型能力強大,但在這些場景就像“殺雞用牛刀”,成本高昂,響應偏慢,資源浪費。

“產業真正需要的是,在確保專業、嚴謹與合規的前提下,實現最優性價比與響應速度的AI解決方案。”章鵬表示。他認爲,大參數模型在複雜推理與深度分析方面表現效果更優,小參數模型則在高頻小任務場景的擁有更低延遲與更高性價比,產業需要大小模型相結合的方案,才能更高效低成本地解決真實場景問題。

在中關村論壇上,螞蟻數科發佈了輕量級金融專用模型Ling-DT-Fin-Mini-2.5,這是Ling DT系列大模型的首款模型。據介紹,Ling DT Fin Mini 2.5是一款輕量級MoE模型,基於Ling2.5最新的混合線性注意力架構,針對金融領域高併發、低時延的任務場景進行優化,在保持專業深度的同時,可將推理成本壓縮至可規模化部署的水位。它相比業界主流的同能力通用模型,推理速度快100%,處理相同任務量的硬件成本顯著降低,爲金融機構帶來切實的降本增效價值。

事實上,當AI智能體加速滲透產業核心場景、執行真實任務後,大小模型相結合已經成爲行業趨勢。近期,OpenAI便相繼推出兩款小模型GPT‑5.4mini與nano,主打低延遲與高性價比,作爲執行層子智能體主力。

章鵬表示,技術發展終將回歸產業對效率的理性要求,下一階段的競爭中,Token效能將成爲衡量企業級AI價值的核心指標。螞蟻數科將持續深耕企業級AGI,進一步推出百靈企業版Ling DT大模型及其行業版,加速智能體在企業級複雜場景的規模化落地。