正文

字節聯合高校出品！STAR 模型：提升視頻清晰度和分辨率

發布於AI新閒資訊

時間 :Jan 9, 2025

閱讀 :1分鐘

近日，南京大學的研究團隊與字節跳動、西南大學聯合推出了一項創新技術 ——STAR（Spatial-Temporal Augmentation with Text-to-Video Models），旨在利用文本到視頻模型，實現真實世界視頻的超分辨率處理。該技術結合了時空增強方法，能夠有效提高低分辨率視頻的質量，尤其適用於在視頻分享平臺上下載的低清晰度視頻。

爲了方便研究者和開發者使用，研究團隊已經在 GitHub 上發佈了 STAR 模型的預訓練版本，包括 I2VGen-XL 和 CogVideoX-5B 兩種型號，以及相關的推理代碼。這些工具的推出標誌着在視頻處理領域的一次重要進展。

使用該模型的過程相對簡單。首先，用戶需要從 HuggingFace 下載預訓練的 STAR 模型，並將其放入指定目錄。接着，準備待測試的視頻文件，並選擇適合的文本提示選項，包括無提示、自動生成或手動輸入提示。用戶只需調整腳本中的路徑設置，便可輕鬆進行視頻超分辨率的處理。

該項目特別設計了兩種基於 I2VGen-XL 的模型，分別用於不同程度的視頻降質處理，確保能夠滿足多種需求。此外，CogVideoX-5B 模型專門支持720x480的輸入格式，爲特定場景提供了靈活的選擇。

該研究不僅爲視頻超分辨率技術的發展提供了新的思路，還爲相關領域的研究者們開闢了新的研究方向。研究團隊對 I2VGen-XL、VEnhancer、CogVideoX 和 OpenVid-1M 等前沿技術表示感謝，認爲這些技術爲他們的項目奠定了基礎。

項目入口:https://github.com/NJU-PCALab/STAR

劃重點:
🌟 新技術 STAR 結合文本到視頻模型，實現視頻超分辨率，提升視頻質量。
🛠️ 研究團隊已發佈預訓練模型和推理代碼，使用過程簡單明瞭。
📩 提供聯繫方式，鼓勵用戶與研究團隊進行交流與探討。

字節跳動大模型研究員因泄密被開除！曾頻繁在知乎曝光機器人研發細節，公司重拳整治信息安全

字節跳動大模型團隊研究員任某某因多次泄露公司保密信息被辭退。他在知乎擁有8萬粉絲，曾頻繁發佈內部研發細節，引發關注並導致公司紀律審查。高調分享最終釀成職業危機。

Nov 13, 2025

135.9k

字節推出 InfinityStar 框架，視頻生成速度提升至 58 秒！

字節跳動發佈InfinityStar框架，視頻生成效率大幅提升，5秒720p視頻僅需58秒。該框架統一支持圖像生成、文本生成視頻、視頻續寫等多種視覺任務，基於對視頻數據本質的深入理解，採用創新的時空分離設計，突破傳統3D數據塊處理方式。

Nov 11, 2025

138.7k

字節火山引擎啓動高薪招聘，實質性進軍“人形具身機器人”賽道

字節跳動通過火山引擎高薪招聘具身智能算法專家，月薪9.5萬至12萬元，顯示其正聚焦人形機器人研發，實質性佈局前沿科技賽道。

Nov 5, 2025

134.9k

字節跳動 AI 編程工具 Trae 下架 Claude 模型，Pro 會員獲補償

字節跳動AI編程工具Trae宣佈，因服務中斷將停止支持Claude模型。爲補償Pro會員，平臺將在2026年1月31日前，每月額外提供50%快速請求額度，使會員每月可享300次快速請求。此舉旨在緩解服務調整帶來的影響。

Nov 4, 2025

263.3k

中國科大與字節發佈 MoGA 長視頻生成模型:分鐘級多鏡頭短片一鍵生成

中科大與字節跳動聯合推出端到端長視頻生成模型，能直接生成分鐘級、480p分辨率、24fps的高質量視頻，支持多鏡頭切換。核心創新是底層算法MoGA，這是一種全新注意力機制，專攻長視頻生成難題，標誌着國產視頻生成技術實現關鍵突破。

Oct 24, 2025

255.8k

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご