正文

智源研究院發佈代碼生成訓練數據集 TACO

aibase

發布於AI新閒資訊

時間 :Dec 25, 2023

閱讀 :1分鐘

智源研究院發佈了名爲 TACO 的代碼生成訓練集，旨在爲代碼生成模型提供更具挑戰性的訓練數據和評測基準。TACO 在數據規模、質量和評測方案上具有優勢，包括更大規模的訓練集和測試集，多樣化的解題答案，以及細粒度的標籤。實驗結果顯示，當前流行的代碼生成模型在 TACO 評測中與 GPT-4 存在顯著差異，說明該領域仍有提升空間。TACO 不僅是一個挑戰性的測試方法，還可用作改進模型性能的訓練數據，促進代碼生成領域的發展。

相關推薦

月之暗面發佈新模型K2.6：長程任務與智能體能力實現新突破

月之暗面發佈並開源Kimi K2.6模型，在代碼生成與智能體領域取得突破。該模型在基礎性能、長程任務處理和Agent集羣協同方面表現突出，測試數據顯示其在多項關鍵指標上競爭力強。

xAI 創始團隊幾乎“團滅”：馬斯克親率特斯拉援軍接管

馬斯克旗下AI公司xAI正經歷嚴重人事動盪。聯合創始人馬努埃爾·克羅伊斯離職後，三年前共同創辦公司的11位初始核心成員僅剩一人留任。今年以來，包括吳宇懷、吉米·巴在內的多位頂尖科學家相繼出走，初創團隊近乎“全員撤退”，引發外界對公司內部管理與技術路線的擔憂。

Gemini 3.5 “Snow Bunny” 泄露：一鍵生成3000行代碼，碾壓GPT-5.2

谷歌Gemini系列AI模型“Snow Bunny”內部泄露，該模型被描述爲革命性檢查點，能一次性構建完整應用，其強大功能引發業界關注。

深度求索計劃於2月中旬發佈 DeepSeek-V4，代碼生成能力大幅提升

深度求索計劃於2月中旬推出新一代旗艦模型DeepSeek-V4，重點提升代碼生成和長代碼上下文處理能力。該模型在內部測試中表現已超越Claude和GPT系列，尤其在長代碼提示處理方面優勢明顯。

北京版幻方重磅開源！40B 參數大模型打破 AI 界限，僅需 3090 顯卡！

九坤投資推出AI大模型IQuest-Coder-V1系列，具備強大代碼生成與理解能力。該系列提供7B、14B和40B三種參數版本，其中40B版本在SWE-Bench Verified榜單上表現突出，以81.4%的成績超越Claude Opus-4.5和GPT-5.2等知名模型，引發科技界關注。

AIBase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2026AIBase