最近,商湯聯合上海AI實驗室等機構發佈了大語言模型InternLM-123B。在全球51個評測集的測試中,它的12項成績排名第一,綜合實力位居全球第二,部分指標超越GPT-4。這主要得益於商湯在數據處理方面的強大能力,以及龐大的SenseCore算力基礎。在技術迭代速度上,商湯也領先同行,半年時間就將InternLM-104B升級至123B。可以說,InternLM-123B的強勁表現拉近了中國與國外在大模型領域的差距。如果商湯能繼續保持技術迭代的速度,很可能會成爲首個達到GPT-4水平的國產大模型。
相關推薦
視頻會議巨頭“跨界”登頂,Zoom 憑藉聯邦 AI 刷新全球最難 AI 考試紀錄
視頻會議巨頭Zoom在頂級AI基準測試中刷新世界紀錄,以48.1%的成績超越谷歌等巨頭,其成功關鍵在於採用聯邦式AI路徑,而非直接訓練底層模型。
Jan 16, 2026
158.2k
百度文心 ERNIE-5.0-0110 正式發佈,數學能力全球第二
百度發佈新一代文心大模型ERNIE-5.0-0110,在LMArena全球文本排行榜中以1460分位列第八,是唯一進入前十的中國國產大模型。其數學處理能力尤爲突出,已升至全球第二,僅次於GPT-5.2-High。
Jan 15, 2026
204.2k
光雲科技澄清AI業務:未自研大模型,相關收入佔比小,未來貢獻存不確定性
光雲科技澄清AI業務佈局,公司僅接入第三方大模型,未自主研發底層技術,AI產品收入佔比小,尚未形成規模回報。
Jan 13, 2026
140.4k
深度求索計劃於2月中旬發佈 DeepSeek-V4,代碼生成能力大幅提升
深度求索計劃於2月中旬推出新一代旗艦模型DeepSeek-V4,重點提升代碼生成和長代碼上下文處理能力。該模型在內部測試中表現已超越Claude和GPT系列,尤其在長代碼提示處理方面優勢明顯。
Jan 12, 2026
208.9k
GPT-5.2超越人類!ARC-AGI-2新紀錄引爆“能力過剩”時代:AI的瓶頸不在模型,而在人
GPT-5.2在ARC-AGI-2測試中以75%準確率超越人類平均水平(60%),標誌AI通用智能取得關鍵突破,但同時也凸顯了模型在測試與落地應用間的性能差距問題。
Jan 12, 2026
583.7k
