快手72B代碼模型開源登頂：KAT-Dev橫掃SWE-Bench，國產AI編程迎來突破

國產AI在代碼生成領域再次取得重大突破。快手旗下Kwaipilot團隊近日正式開源KAT-Dev-72B-Exp模型，這款擁有720億參數的實驗性大語言模型憑藉在軟件工程基準測試中的出色表現，登頂開源代碼模型排行榜，標誌着國產AI在編程助手領域實現了里程碑式進展。

KAT-Dev-72B-Exp在權威的SWE-Bench Verified基準測試中表現驚豔，採用嚴格的SWE-agent腳手架評估標準，斬獲74.6%的準確率。這一成績不僅超越了此前所有開源模型，還被業內視爲對標頂級閉源模型的標誌性表現。SWE-Bench作爲軟件工程領域的權威評測體系，專注於真實代碼庫的修復和優化任務，該模型的高分證明了其在處理複雜編程場景時具備遠超預期的穩定性和實用價值。

業內分析認爲，這一成績的取得源於模型在實際開發任務中的端到端能力，涵蓋代碼補全、漏洞修復和系統級重構等多個維度。與傳統代碼生成工具相比，該模型更注重完整的軟件工程流程，幫助開發者從單純的寫代碼向構建系統轉型。

KAT-Dev-72B-Exp的核心優勢在於其訓練架構的創新設計。團隊引入了大規模強化學習機制，結合全新訓練引擎，實現了共享前綴軌跡和熵塑優勢策略，有效解決了強化學習訓練中的探索崩塌問題。

共享前綴軌跡技術通過複用高頻代碼序列的前綴路徑，讓模型能夠高效積累經驗，減少冗餘計算，顯著提升訓練穩定性。熵塑優勢則借鑑信息論原理，動態調節探索與利用之間的平衡，防止模型陷入局部最優，確保在複雜任務中保持強大的泛化能力。

這一創新不僅大幅降低了訓練成本，還爲後續模型迭代提供了寶貴的實驗平臺。作爲KAT-Coder系列的強化學習預覽版，該模型專爲研究社區開放，目前已在Hugging Face平臺上線，鼓勵全球開發者下載使用並貢獻反饋。

快手的這一舉措爲全球開源AI生態注入了新的活力。KAT-Dev-72B-Exp的發佈不僅降低了高端代碼AI的使用門檻，還爲中小型開發團隊提供了免費高效的工具鏈。快手StreamLake平臺已上線KAT Coder的在線試用服務，每日提供免費訪問，讓更多用戶能夠即時體驗其強大性能。

隨着國產模型在參數規模和任務適應性上持續突破，AI編程助手正從輔助工具演變爲核心生產力。快手Kwaipilot團隊表示，將繼續推動KAT系列的商業化落地，爲全球開發者社區提供更強大的技術支持。

在中美AI競爭日益激烈的背景下，KAT-Dev-72B-Exp的橫空出世展現了國產開源的實力。這一突破提醒業界，技術創新不僅在於規模擴張，更在於對實際痛點的精準解決。該模型已在Hugging Face官方倉庫開放下載，感興趣的開發者可以前往體驗這一代碼生成領域的新標杆。

地址:https://huggingface.co/Kwaipilot/KAT-Dev-72B-Exp

快手72B代碼模型開源登頂：KAT-Dev橫掃SWE-Bench，國產AI編程迎來突破

相關推薦

近七成美國民衆渴望共享AI紅利！呼籲設立主權財富基金

Claude Code再進化！內置瀏覽器讓AI自主“刷網頁”

AI日報：GPT5.6系列模型發佈 Codex消失;騰訊擬接盤Manus成最大股東；MiniMax創始人宣佈零薪酬直至實現AGI

Meta 發佈新旗艦模型 Muse Spark 1.1，升級多代理自動化功能

三星殺回PC芯片戰場：自研AI專用芯片GAIA已送測聯想惠普， 2027 年量產

快手72B代碼模型開源登頂：KAT-Dev橫掃SWE-Bench，國產AI編程迎來突破

相關推薦

近七成美國民衆渴望共享AI紅利！呼籲設立主權財富基金

​Claude Code再進化！內置瀏覽器讓AI自主“刷網頁”

AI日報：GPT5.6系列模型發佈 Codex消失;騰訊擬接盤Manus成最大股東；MiniMax創始人宣佈零薪酬直至實現AGI

​Meta 發佈新旗艦模型 Muse Spark 1.1，升級多代理自動化功能

三星殺回PC芯片戰場：自研AI專用芯片GAIA已送測聯想惠普， 2027 年量產

Claude Code再進化！內置瀏覽器讓AI自主“刷網頁”

Meta 發佈新旗艦模型 Muse Spark 1.1，升級多代理自動化功能