相關推薦
字節開源全新代碼大模型評估基準“FullStack Bench”
12月5日,字節豆包大模型團隊推出了最新的代碼大模型評估基準——FullStack Bench,涵蓋了超11類真實場景,支持16種編程語言,幷包含3374個問題。這一基準相比之前的評估標準,在更廣泛的編程領域中能更準確地評估大模型的代碼開發能力,推動了模型在現實世界編程任務中的優化。目前的主流代碼評估基準,如HumanEval和MBPP,通常集中在基礎和高級編程問題,而DS-1000則專注於數據分析和機器學習任務,且僅支持Python。xCodeEval則側重於高級編程和數學領域,存在較大的應用場景和語言覆蓋限
DeepSeek 發佈開源代碼大模型 DeepSeek Coder
["DeepSeek(深度求索)發佈了開源代碼大模型 DeepSeek Coder","DeepSeek Coder 是一個智能代碼助手,可以生成各種代碼","DeepSeek Coder 已經在 Hugging Face 和 GitHub 上開源","DeepSeek Coder 在國際權威數據集的測試中表現出色","DeepSeek 致力於探索 AGI 的本質,將推出更多研究成果"]
以色列 AI 公司 AI21Labs 澄清與英偉達無交易協議
AI21Labs CEO澄清與英偉達交易傳聞,稱雙方未達成具體協議。公司雖與包括英偉達在內的多方洽談合作,但討論仍在進行中。此前媒體曾報道其估值達20-30億美元。
小米大模型 MiMo 公測延長,用戶可免費體驗至 2026 年!
小米宣佈將自研大模型MiMo-V2-Flash的公測限免期延長20天,至2026年1月20日。該模型參數量達3090億,激活參數150億,在推理和代碼生成方面表現優異。此舉旨在爲用戶提供更長的體驗時間,並展現小米在AI領域的持續投入與信心。
印度數據中心迅猛發展,但實施進展緩慢
印度數據中心行業增長迅速,但面臨落實挑戰。卡納塔克邦等新興地區政策推進緩慢,而孟買、欽奈等成熟市場仍佔主導。行業瓶頸包括政策碎片化、電力限制、人才短缺及基礎設施不足,制約了資本密集型項目的進一步發展。
