近日,位於杭州的 AI 公司 DeepSeek 發佈了其最新的大型語言模型 ——V3。這款開源模型在多項基準測試中的表現接近於 OpenAI 的4o 和 Anthropic 的 Claude3.5Sonnet,這讓業界刮目相看。與美國同行動輒數億美元的投資相比,DeepSeek 的 V3模型總成本僅爲560萬美元,這一巨大的差異讓人矚目。

圖源備註:圖片由AI生成,圖片授權服務商Midjourney
DeepSeek 的首席執行官梁文峯表示,資金從來不是他們面臨的問題,儘管 V3是基於 H800芯片訓練的,但 DeepSeek 的團隊依然能夠在資源有限的情況下展現出強大的研究與工程能力。
AI 領域的先驅 Andrej Karpathy 對此評價道,DeepSeek 的投資預算 “真是個笑話”,然而最終呈現的成果卻是 “在資源約束下的高度令人印象深刻的研究與工程”。
AGI 被視爲 AI 研究的 “聖盃”,能夠在解決問題和執行任務上超越人類,相關專家預測,一旦技術成熟,首個實現 AGI 的國家將在經濟、科學和安全上佔據巨大的優勢。
