全球開發者目光再次聚焦中國!在備受矚目的全球開發者大會(GDC)上,阿里雲魔搭社區重磅宣佈,首發上線階躍星辰最新開源的兩款多模態模型,包括

圖源備註:圖片由AI生成,圖片授權服務商Midjourney

全球開發者目光再次聚焦中國!在備受矚目的全球開發者大會(GDC)上,阿里雲魔搭社區重磅宣佈,首發上線階躍星辰最新開源的兩款多模態模型,包括

圖源備註:圖片由AI生成,圖片授權服務商Midjourney
近日,魔樂社區(Modelers)正式上線了由階躍星辰研發的 Step-Video 和 Step-Audio 兩款開源多模態大模型。這兩款模型分別用於視頻生成和語音交互,旨在爲開發者和企業用戶提供更強大的 AI 工具。Step-Video 模型的全名爲 Step-Video-T2V,這是一款參數量高達300億的全球最大開源視頻生成模型。該模型能夠直接生成204幀、540P 分辨率的高質量視頻,並在指令遵循、運動平滑性、物理合理性以及美感等方面,表現超越了市場上現有的頂尖開源視頻模型。另一方面,Step-Audio 則是業內首款能夠生成多種情
今日,階躍星辰與吉利汽車集團宣佈,聯合開源兩款階躍Step系列多模態大模型——Step-Video-T2V視頻生成模型和Step-Audio語音模型。其中,階躍Step-Video-T2V視頻生成模型在參數量和性能上均處於全球領先水平。該模型擁有300億參數量,能夠直接生成204幀、540P分辨率的高質量視頻,確保生成內容信息密度高、一致性強。評測結果顯示,Step-Video-T2V在指令遵循、運動平滑性、物理合理性、美感度等方面均表現出色,顯著超越市面上既有的最佳開源視頻模型。
百度旗下的文心智能體平臺宣佈全面接入DeepSeek模型,並向所有用戶免費開放。文心智能體平臺是百度推出的基於文心大模型的智能體構建平臺,旨在幫助用戶快速創建和部署智能體應用。
日本人工智能初創公司Sakana AI宣佈推出“AI CUDA工程師”(AI CUDA Engineer),這一創新性的AI智能體系統旨在自動化生產高度優化的CUDA內核,顯著提升機器學習操作的運行效率。根據X平臺上的最新消息,該系統通過進化的大型語言模型(LLM)驅動代碼優化技術,將常見PyTorch操作的運行速度提高了10至100倍,標誌着AI技術在GPU性能優化領域的重大突破。Sakana AI表示,CUDA內核作爲GPU計算的核心,直接編寫和優化通常需要深厚的專業知識和高技術門檻,而現有框架如PyTorch雖然使用便捷,但在性能上往
Ovis2 是阿里巴巴國際化團隊提出的Ovis系列模型的最新版本。與前序1. 6 版本相比,Ovis2 在數據構造和訓練方法上都有顯著改進。它不僅強化了小規模模型的能力密度,還通過指令微調和偏好學習大幅提升了思維鏈(CoT)推理能力。此外,Ovis2 引入了視頻和多圖像處理能力,並增強了多語言能力和複雜場景下的OCR能力,顯著提升了模型的實用性。