最近,商湯聯合上海AI實驗室等機構發佈了大語言模型InternLM-123B。在全球51個評測集的測試中,它的12項成績排名第一,綜合實力位居全球第二,部分指標超越GPT-4。這主要得益於商湯在數據處理方面的強大能力,以及龐大的SenseCore算力基礎。在技術迭代速度上,商湯也領先同行,半年時間就將InternLM-104B升級至123B。可以說,InternLM-123B的強勁表現拉近了中國與國外在大模型領域的差距。如果商湯能繼續保持技術迭代的速度,很可能會成爲首個達到GPT-4水平的國產大模型。
相關推薦
阿里雲大模型價格腰斬!通義千問3-Max調用費直降50%,緩存命中僅收10%費用
阿里雲百鍊宣佈自2025年11月13日起,通義千問3-Max模型核心調用費用減半,並優化緩存計費策略,大幅降低企業AI應用成本。此舉旨在降低大模型使用門檻,加速中小企業數字化轉型。
Nov 14, 2025
156.3k
字節跳動大模型研究員因泄密被開除!曾頻繁在知乎曝光機器人研發細節,公司重拳整治信息安全
字節跳動大模型團隊研究員任某某因多次泄露公司保密信息被辭退。他在知乎擁有8萬粉絲,曾頻繁發佈內部研發細節,引發關注並導致公司紀律審查。高調分享最終釀成職業危機。
Nov 13, 2025
152.6k
GPT-5.1正式發佈!不光更聰明,還會“共情”:新增6種人格風格,AI首次納入情感依賴安全評估
OpenAI發佈GPT-5.1,標誌AI競賽進入"情商融合"新階段。模型重點強化情緒價值、個性化交互與人性化表達,解決用戶反饋的"AI冰冷"問題。採用雙模型架構:Instant模式快速響應,Thinking模式深度思考。全球分批推送中,付費用戶3個月內可繼續使用GPT-5過渡。
Nov 13, 2025
163.9k
月之暗面開源AI代理新框架Kosong!異步編排+插件化設計,開發者自由度拉滿
月之暗面開源AI代理框架Kosong,以輕量靈活特性助力下一代智能體開發。該框架通過統一抽象層解決工具碎片化問題,簡化開發流程,旨在打通大模型與實際應用場景,引發開發者社區廣泛關注。
Nov 11, 2025
152.6k
騰訊雲大模型升級公告:DeepSeek-V3/ DeepSeek-R1模型將於24日正式下線
騰訊雲宣佈將於2025年11月24日下線DeepSeek-V3和DeepSeek-R1模型,屆時停止所有接入服務。官方建議用戶遷移至最新穩定版本,以配合大模型技術持續升級。
Nov 10, 2025
163.0k
