IBM 推出小型AI模型 Granite 3.2 ，強調高效推理與實用性

IBM 最近發佈了其最新的 Granite3.2大型語言模型，旨在爲企業和開源社區提供 “小巧、高效、實用” 的企業人工智能解決方案。該模型不僅具備多模態和推理能力，還提升了靈活性和成本效益，使得用戶更容易採用。

Granite3.2引入了視覺語言模型（VLM），用於處理文檔，進行數據分類和提取。IBM 聲稱，這一新模型在一些關鍵基準測試中，性能達到或超過了更大型的模型，如 Llama3.211B 和 Pixtral12B。此外，Granite3.2的8B 模型在標準數學推理基準測試中，也顯示出能匹敵或超越更大模型的能力。

爲了提升推理能力，Granite3.2的某些模型還具備 “思維鏈” 功能，能夠闡明中間推理步驟。該功能雖然需要較大的計算能力，但用戶可以根據需求隨時啓用或禁用，以優化效率並降低整體成本。IBM AI 研究副總裁 Sriram Raghavan 在發佈會上表示，下一代人工智能的重點在於效率、整合與實際影響，讓企業在不超支的情況下實現強大的成果。

除了推理能力的提升，Granite3.2還推出了 “Granite Guardian” 安全模型的小型化版本，儘管體積縮減了30%，但性能仍然保持在前一代模型的水平。此外，IBM 還引入了一種名爲 “可言語化信心” 的能力，這種能力能夠更細緻地評估風險，並在安全監測中考慮不確定性。

Granite3.2是在 IBM 的開源 Docling 工具包上訓練的，該工具包允許開發者將文檔轉換爲定製的企業 AI 模型所需的特定數據。模型訓練過程中處理了8500萬份 PDF 文件以及2600萬個合成問答對，以增強 VLM 處理複雜文檔工作流的能力。

IBM 還宣佈推出下一代 TinyTimeMixers（TTM）模型，這是一種緊湊的預訓練模型，專注於多變量時間序列預測，具備最長可達兩年的長遠預測能力。

官方博客:https://www.ibm.com/new/announcements/ibm-granite-3-2-open-source-reasoning-and-vision

劃重點:
📊 Granite3.2引入視覺語言模型，提升文檔處理與數據提取能力。
💡 新模型具備思維鏈功能，能夠闡明推理過程，增強推理能力。
🔍 Granit Guardian 安全模型小型化30%，但性能未受影響，同時推出可言語化信心的風險評估功能。

IBM 推出小型AI模型 Granite 3.2 ，強調高效推理與實用性

相關推薦

OpenAI聯合創始人Andrej Karpathy宣佈加盟Anthropic，發力下一代LLM研發

日本科學家發佈“Sui”編程語言，宣稱能讓 LLM100% 準確編寫代碼

醫療AI新突破！南洋理工發佈首個電子病歷處理評測標準

MIT 推出新方法，顯著提升大型語言模型計算效率

OpenAI 推出 AI “懺悔”框架:旨在訓練模型承認不當行爲，提高誠實度

​IBM 推出小型AI模型 Granite 3.2 ，強調高效推理與實用性

相關推薦

OpenAI聯合創始人Andrej Karpathy宣佈加盟Anthropic，發力下一代LLM研發

日本科學家發佈“Sui”編程語言，宣稱能讓 LLM100% 準確編寫代碼

醫療AI新突破！南洋理工發佈首個電子病歷處理評測標準

MIT 推出新方法，顯著提升大型語言模型計算效率

OpenAI 推出 AI “懺悔”框架:旨在訓練模型承認不當行爲，提高誠實度

IBM 推出小型AI模型 Granite 3.2 ，強調高效推理與實用性