2024 年值得關注的 6 大生成式 AI 趨勢


Nvidia發佈小型語言模型Nemotron-Nano-9B-v2,擁有9億參數,較原版12億大幅縮減,旨在單臺A10GPU高效運行。該模型採用混合架構,適應實際部署需求,推動小型模型發展。
英偉達發佈小型語言模型Nemotron-Nano-9B-V2,參數量90億,專爲高效推理設計。該模型在多項基準測試中表現優異,部分測試達到同類產品最高水平,旨在與麻省理工和谷歌的小型AI模型競爭,適用於智能手錶和手機等設備。
騰訊發佈多模態AI模型X-Omni,突破圖像生成與理解技術瓶頸。該模型創新採用強化學習框架,整合多種評估工具,顯著提升文字渲染準確率。X-Omni通過語義圖像分詞器實現生成與理解功能統一,在長文本渲染、圖像生成和視覺理解任務中均超越主流模型。特別是不依賴分類器自由引導技術仍保持高質量輸出,驗證了離散自迴歸模型在多模態領域的潛力。該技術爲AI輔助內容創作開闢了新路徑。
據科技媒體 Business Insider 報道,蘋果公司可能正在考慮通過一項數百億美元的交易,來提升其在人工智能(AI)領域的競爭力。前 OpenAI 首席技術官 Mira Murati 所創立的 Thinking Machines Lab 成爲了蘋果的潛在收購目標,該團隊匯聚了超過30名來自 OpenAI、Meta 和 Google DeepMind 的頂尖專家,專注於開發多模態 AI 模型。目前,蘋果在 AI 戰略上採取了一種 “平臺 + 自研” 的混合模式,既爲前沿 AI 產品提供 iOS 運行環境,又通過 Apple Intelligence 開發自有功能。然而,與微軟和谷歌等企業級 AI 服務的競爭對
人工智能初創公司 Cohere 的非營利研究實驗室本週發佈了一款多模態 “開放” AI 模型 ——Aya Vision。該實驗室聲稱,該模型在行業內處於領先地位。Aya Vision 能夠執行多項任務,包括撰寫圖片說明、回答與照片相關的問題、翻譯文本以及生成23種主要語言的摘要。Cohere 表示,他們通過 WhatsApp 免費提供 Aya Vision,希望能讓世界各地的研究人員更方便地獲取技術突破。Cohere 在其博客中指出,儘管人工智能已經取得了顯著進展,但在不同語言之間的模型表現仍存在很大差距,尤其是在涉及文本和