Cohere 近日發佈了其全新的語言模型 Command A Reasoning,旨在滿足商業環境中對高難度推理任務的嚴苛需求。該模型在處理代理工作流、構建端到端系統和分析大型文檔方面表現出色。
據Cohere介紹,Command A Reasoning在多項行業基準測試中表現卓越,其性能超越了其他私有模型,包括 BFCL-v3、Tau-bench 和 DeepResearch Bench。

該模型具有強大的技術能力,能夠在一個 H100或 A100GPU上運行,支持高達 128,000個令牌的上下文窗口;在多GPU配置下,上下文窗口可擴展至 256,000個令牌。企業可以靈活設置令牌預算,以有效控制成本和資源使用,實現不同工作負載的並行處理,而無需切換模型。
Command A Reasoning特別擅長處理複雜的研究任務。它可以驅動一個分層多智能體系統,將複雜的請求分解爲子任務,進行並行研究,並最終生成結構化的報告。在相關基準測試中,該系統在指令遵循和內容深度方面均獲得了最高分。
在模型可用性方面,Command A Reasoning目前以研究版本形式提供,其權重已開放,並遵循 CC-BY-NC-4.0許可證,可供非商業用途免費使用。對於商業部署,企業需要聯繫Cohere銷售團隊。
Cohere在開發過程中高度重視模型安全性,通過內部評估框架在嚴格的濫用預防(涵蓋兒童虐待、自殘、暴力、性內容和陰謀論等)和避免對合法請求的過度拒絕之間尋求平衡。Cohere表示,相較於競爭對手,Command A Reasoning在安全性和實用性方面實現了最佳平衡。
目前,Command A Reasoning已正式上線 Cohere 平臺和 Hugging Face。
