在 AI 辦公領域,許多人都有過類似的尷尬:讓 AI 生成一份報表,結果公式變成了死數字;讓它修改 PPT 模板,結果排版亂成一團。針對“生成內容不可用”的行業頑疾,大模型廠商 MiniMax(稀宇科技)近日宣佈正式開源其生產級辦公文檔引擎 Office Skills。這套基於 MIT 協議的代碼,旨在讓 AI 生成的 Word、Excel、PPT 和 PDF 真正達到“直接交付”的標準。

image.png

底層重構:繞過“平庸”庫,追求高保真控制

MiniMax 在技術選型上表現得相當硬核。爲了解決傳統 Python 庫在處理複雜格式時的“靜默丟棄”問題,他們放棄了易用但受限的常用方案:

  • Excel(xlsx): 摒棄了 openpyxl,選擇直接在 XML 層面進行“手術級”操作。通過解壓、修改特定節點再重包的方式,確保原有的數據透視表、VBA 宏和複雜公式原封不動。

  • Word(docx): 棄用輕量級的 python-docx,轉而採用微軟官方維護的 .NET OpenXML SDK,實現了對嵌套表格、頁眉頁腳及修訂追蹤的完美支持。

  • PDF 與 PPT: 採用了“雙引擎”拆分策略,例如 PDF 的封面由 HTML+CSS 渲染以保證設計感,正文則由 ReportLab 負責穩定性;PPT 則預設了四套視覺“配方”,確保風格全局統一。

自循環進化:能自我糾錯的“數字員工”

除了工具鏈的開源,MiniMax 還分享了名爲 Execute → Evaluate → Fix 的自進化機制。這意味着這套 Skill 並不只是靜態的代碼,它擁有一套自動評測框架。當 AI 生成文檔失敗時,系統會自動捕捉結構、公式或版式上的錯誤,並將其沉澱爲修復案例進行迭代。

這種機制讓 Office Skills 在處理真實辦公場景時越跑越穩。無論是高端 Omakase 的日料菜單,還是投行級別的金融報表,AI 不再只是給出一個“Demo”,而是交付一個邏輯閉環、格式合規的最終成品。隨着這套能力的開源,辦公 Agent 賽道或許將告別“草臺班子”時代,正式邁向專業化交付。