11月4日,美國研究機構 Nof1的首屆 AI 大模型真實投資比賽 Alpha Arena 正式落下帷幕。這場激烈的競賽旨在探索六大頂級人工智能大語言模型(LLM)在真實市場中的表現,結果顯示,阿里巴巴的通義千問 Qwen3-Max 以22.32% 的收益率成功奪冠,展現了其在量化交易領域的強大實力。

此次比賽的獨特之處在於,每個參賽模型都被賦予了1萬美元的起始資金,允許它們在 Hyperliquid 交易平臺上自主交易加密貨幣的永續合約,如比特幣(BTC)、以太坊(ETH)等。所有模型的決策只能基於數值市場數據,例如價格、成交量和技術指標,而無法參考新聞或其他外部信息。目標是最大化盈虧(PnL),並根據夏普比率評估其風險調整後的表現。

儘管所有模型在相同的條件下運作,但它們在交易風格、風險偏好和持倉時間等方面展現出顯著差異。有的模型在交易頻率上表現活躍,而有些則偏好長線持倉。此外,實驗團隊還發現,數據格式的敏感性對模型表現有直接影響,簡單調整提示的 “數據順序” 便能修復一些模型的錯誤解讀。
不過,研究人員也指出,此次實驗存在一定的侷限性,例如樣本數量有限和測試時間較短。團隊計劃在下一季引入更多的控制因素和特徵,以增強實驗的統計實力。
通過這次實驗,Nof1希望能夠推動 AI 研究從靜態的基準測試轉向更真實和動態的決策場景,探討大型語言模型在無特定微調的情況下能否有效地進行交易。這一成果不僅爲 AI 在金融領域的應用提供了新的視角,也揭示了現代模型在執行交易、風險管理和市場理解等方面所面臨的挑戰。
