阿里雲魔搭首發上線階躍星辰最新開源的兩款多模態模型

全球開發者目光再次聚焦中國!在備受矚目的全球開發者大會（GDC）上，阿里雲魔搭社區重磅宣佈，首發上線階躍星辰最新開源的兩款多模態模型，包括 全球參數量最大的開源視頻生成模型 Step-Video-T2V，以及 業界首款產品級開源語音交互模型 Step-Audio。這一消息瞬間引爆全球AI開源社區，再次彰顯中國在人工智能領域的強勁創新實力。

作爲中國最大的AI模型社區，阿里雲魔搭社區此次發佈的這兩款重磅模型，無疑是近期全球多模態領域最受矚目的開源成果。 Step-Video-T2V 以其巨大的參數規模，一舉刷新了開源視頻生成模型的記錄，預示着更高質量、更精細化的視頻內容創作即將成爲現實。而 Step-Audio 則突破了傳統語音模型的侷限，成爲業界首個產品級開源語音交互系統，意味着更自然、更智能的語音交互技術將加速普及應用。

音頻聲波智能語音

圖源備註：圖片由AI生成，圖片授權服務商Midjourney

據官方介紹，截至目前，阿里雲魔搭社區已匯聚超過 4萬個開源模型，全面覆蓋了包括大語言模型（LLM）、對話系統、語音技術、文生圖、圖生視頻等多個前沿領域，穩坐中國最大AI模型社區的頭把交椅。此次選擇在魔搭社區開源這兩款極具分量的模型，不僅是對魔搭社區平臺實力的肯定，也體現了階躍星辰對開源生態建設的積極貢獻。

在GDC這一全球開發者矚目的舞臺上發佈如此重要的開源成果，無疑向世界展示了中國AI技術的蓬勃發展態勢和開放合作姿態。這兩款模型的開源，將極大地降低AI技術的使用門檻，加速全球人工智能技術的普及和發展。

華爲昇騰攜手階躍星辰推出開源多模態模型，進軍 AI 新領域

近日，魔樂社區（Modelers）正式上線了由階躍星辰研發的 Step-Video 和 Step-Audio 兩款開源多模態大模型。這兩款模型分別用於視頻生成和語音交互，旨在爲開發者和企業用戶提供更強大的 AI 工具。Step-Video 模型的全名爲 Step-Video-T2V，這是一款參數量高達300億的全球最大開源視頻生成模型。該模型能夠直接生成204幀、540P 分辨率的高質量視頻，並在指令遵循、運動平滑性、物理合理性以及美感等方面，表現超越了市場上現有的頂尖開源視頻模型。另一方面，Step-Audio 則是業內首款能夠生成多種情

效果最佳！階躍星辰開源Step-Video-T2V 視頻生成模型

今日，階躍星辰與吉利汽車集團宣佈，聯合開源兩款階躍Step系列多模態大模型——Step-Video-T2V視頻生成模型和Step-Audio語音模型。其中，階躍Step-Video-T2V視頻生成模型在參數量和性能上均處於全球領先水平。該模型擁有300億參數量，能夠直接生成204幀、540P分辨率的高質量視頻，確保生成內容信息密度高、一致性強。評測結果顯示，Step-Video-T2V在指令遵循、運動平滑性、物理合理性、美感度等方面均表現出色，顯著超越市面上既有的最佳開源視頻模型。

Freepik 率先推出 Veo 2，開啓 AI 視頻生成新篇章

北京時間，2025 年 2 月 21 日：知名創意平臺 Freepik 宣佈，其已正式在其平臺上推出 Google DeepMind 研發的最新 AI 視頻生成模型 Veo 2。這一舉措不僅標誌着 Freepik 成爲全球首家整合 Veo 2 的平臺，更打破了地域限制，讓非美國居民也能使用這一尖端技術。據 Freepik 官方消息，Veo 2 擁有無與倫比的真實感、精準度和流暢的動畫效果，被認爲是目前最先進的 AI 視頻生成模型。此次與 Google 的合作，使 Freepik 在 AI 創意工具領域再次走在前沿。此前，Veo 2 的使用主要侷限於特定地區，而 Freepik 的這一步

華人學者引領AI創新，Grok 3在App Store一鳴驚人

近日，xAI 公司推出的最新人工智能模型 Grok3在美國 App Store 上迅速攀升至榜首，成爲用戶熱議的焦點。這一成就的背後，除了 Grok3的強大功能外，還有兩位華人學者的出色貢獻。他們分別是多倫多大學的助理教授 Jimmy Ba 和 xAI 的聯創吳懷宇（Tony Wu）。值得注意的是，吳懷宇不僅是團隊中唯一的95後，而且他的學術背景和開發經歷更是引人矚目，曾參與了 AlphaGeometry 和 AlphaStar 的核心開發。在剛剛結束的發佈會上，Grok3展示了其在推理、數學、編碼等多個領域的卓越能力。xAI 的官方博客稱其

騰訊手遊《和平精英》將接入DeepSeek 2月25日開啓灰測