拒絕Token無效消耗螞蟻數科推出百靈企業版金融大模型：更快、更輕、更好

以OpenClaw爲代表的自主執行智能體爆火，標誌着AI應用已從“對話交互”向“任務執行”加速演進。企業在加速擁抱的同時，也面臨着算力浪費、安全合規等多重挑戰。如何讓智能體真正實現規模化、可持續地落地，成爲產業界共同關注的核心議題。

3月26日，在中關村論壇未來產業創新發展論壇中，螞蟻數科大模型技術創新部總經理章鵬在演講中表示，OpenClaw的爆發將帶來企業級AI範式革命，推動大模型在產業場景的落地從‘參數競賽’走向“Token效能競爭’。”

圖說:螞蟻數科大模型技術創新部總經理章鵬在中關村論壇演講

OpenClaw類智能體的快速普及，反映了市場對自主執行型智能體的需求，但在真實產業環境中，其落地面臨顯著挑戰:由於缺乏對行業規則、業務流程的深度理解，智能體在執行復雜任務時往往反覆調用工具，導致Token消耗遠高於有效產出。據瞭解，在一些高頻調用場景中，OpenClaw的Token消耗成本可達集成式Agent成本的數十倍甚至百倍，這種高投入低產出的模式，讓其在產業規模化應用中面臨可持續性難題。

“大模型產業落地的下半場，核心命題不是模型參數規模的競爭，而是單位Token效能的持續提升。”章鵬認爲，企業應結合實際場景與需求，選擇大小模型結合的AI解決方案，以更低算力成本實現更高業務價值。

以金融場景爲例，該領域每天需處理海量高頻低時延的任務——快速識別意圖、提取關鍵信息、檢索排序等等，這些任務具備高併發、快響應、高精準要求，傳統行業推理大模型能力強大，但在這些場景就像“殺雞用牛刀”，成本高昂，響應偏慢，資源浪費。

“產業真正需要的是，在確保專業、嚴謹與合規的前提下，實現最優性價比與響應速度的AI解決方案。”章鵬表示。他認爲，大參數模型在複雜推理與深度分析方面表現效果更優，小參數模型則在高頻小任務場景的擁有更低延遲與更高性價比，產業需要大小模型相結合的方案，才能更高效低成本地解決真實場景問題。

在中關村論壇上，螞蟻數科發佈了輕量級金融專用模型Ling-DT-Fin-Mini-2.5，這是Ling DT系列大模型的首款模型。據介紹，Ling DT Fin Mini 2.5是一款輕量級MoE模型，基於Ling2.5最新的混合線性注意力架構，針對金融領域高併發、低時延的任務場景進行優化，在保持專業深度的同時，可將推理成本壓縮至可規模化部署的水位。它相比業界主流的同能力通用模型，推理速度快100%，處理相同任務量的硬件成本顯著降低，爲金融機構帶來切實的降本增效價值。

事實上，當AI智能體加速滲透產業核心場景、執行真實任務後，大小模型相結合已經成爲行業趨勢。近期，OpenAI便相繼推出兩款小模型GPT‑5.4mini與nano，主打低延遲與高性價比，作爲執行層子智能體主力。

章鵬表示，技術發展終將回歸產業對效率的理性要求，下一階段的競爭中，Token效能將成爲衡量企業級AI價值的核心指標。螞蟻數科將持續深耕企業級AGI，進一步推出百靈企業版Ling DT大模型及其行業版，加速智能體在企業級複雜場景的規模化落地。

拒絕Token無效消耗螞蟻數科推出百靈企業版金融大模型：更快、更輕、更好

相關推薦

大模型智能體告別盲目堆疊！港中文團隊發佈SLIM框架，動態管理外部技能生命週期

打破大模型協議壁壘！開源網關GodeX發佈全新迭代版本

財務數據大危機！ChatGPT表格插件爆發嚴重安全漏洞

英偉達發佈全新Vera芯片專爲智能代理打造，OpenAI與SpaceX成首批擁抱者

AI狂飆帶火“算力金屬”！精煉錫半年暴漲40%面臨枯竭危機

拒絕Token無效消耗 螞蟻數科推出百靈企業版金融大模型：更快、更輕、更好

相關推薦

大模型智能體告別盲目堆疊！港中文團隊發佈SLIM框架，動態管理外部技能生命週期

打破大模型協議壁壘！開源網關GodeX發佈全新迭代版本

財務數據大危機！ChatGPT表格插件爆發嚴重安全漏洞

英偉達發佈全新Vera芯片專爲智能代理打造，OpenAI與SpaceX成首批擁抱者

AI狂飆帶火“算力金屬”！精煉錫半年暴漲40%面臨枯竭危機

拒絕Token無效消耗螞蟻數科推出百靈企業版金融大模型：更快、更輕、更好