2024 年值得關注的 6 大生成式 AI 趨勢


蘋果最新發布的多模態AI模型“Manzano”,成功將視覺識別與文本生成圖像功能結合,實現“雙修”能力。該模型不僅能精準理解圖像內容,還能根據文本生成高質量圖片,標誌着AI技術的重要突破,有望滿足行業對多功能模型的需求。
Nvidia發佈小型語言模型Nemotron-Nano-9B-v2,擁有9億參數,較原版12億大幅縮減,旨在單臺A10GPU高效運行。該模型採用混合架構,適應實際部署需求,推動小型模型發展。
英偉達發佈小型語言模型Nemotron-Nano-9B-V2,參數量90億,專爲高效推理設計。該模型在多項基準測試中表現優異,部分測試達到同類產品最高水平,旨在與麻省理工和谷歌的小型AI模型競爭,適用於智能手錶和手機等設備。
騰訊發佈多模態AI模型X-Omni,突破圖像生成與理解技術瓶頸。該模型創新採用強化學習框架,整合多種評估工具,顯著提升文字渲染準確率。X-Omni通過語義圖像分詞器實現生成與理解功能統一,在長文本渲染、圖像生成和視覺理解任務中均超越主流模型。特別是不依賴分類器自由引導技術仍保持高質量輸出,驗證了離散自迴歸模型在多模態領域的潛力。該技術爲AI輔助內容創作開闢了新路徑。
據科技媒體 Business Insider 報道,蘋果公司可能正在考慮通過一項數百億美元的交易,來提升其在人工智能(AI)領域的競爭力。前 OpenAI 首席技術官 Mira Murati 所創立的 Thinking Machines Lab 成爲了蘋果的潛在收購目標,該團隊匯聚了超過30名來自 OpenAI、Meta 和 Google DeepMind 的頂尖專家,專注於開發多模態 AI 模型。目前,蘋果在 AI 戰略上採取了一種 “平臺 + 自研” 的混合模式,既爲前沿 AI 產品提供 iOS 運行環境,又通過 Apple Intelligence 開發自有功能。然而,與微軟和谷歌等企業級 AI 服務的競爭對