11月4日、米国の研究機関Nof1が開催した初回のAI大規模モデルリアル投資コンペティション「Alpha Arena」は正式に終了しました。この激しい競技は、6つのトップ級人工知能大規模言語モデル(LLM)が実際の市場でどのように機能するかを探究することを目的としています。その結果、アリババグループの通義千問Qwen3-Maxが22.32%の収益率を記録し、優勝しました。これは、量的取引分野におけるその強力な実力を示しています。

今回のコンペティションの特徴は、各参加モデルに1万ドルの初期資金が与えられ、Hyperliquid取引プラットフォーム上で暗号通貨の永続契約(スワップ)を自主的にトレードできることです。例えばビットコイン(BTC)、イーサリアム(ETH)などです。すべてのモデルの意思決定は価格、取引量、テクニカル指標などの数値市場データに基づくものであり、ニュースや他の外部情報にはアクセスできません。目標は損益(PnL)を最大化することであり、シャープ比を用いてリスク調整後のパフォーマンスを評価します。

すべてのモデルが同じ条件下で動作しているにもかかわらず、それらはトレードスタイル、リスクの好み、保有期間などで顕著な違いを見せました。あるモデルはトレード頻度が高い一方で、別のモデルは長期保有を好む傾向がありました。また、実験チームはデータ形式の感度がモデルのパフォーマンスに直接的な影響を与えることを発見しました。単純にプロンプトの「データ順序」を調整することで、一部のモデルの誤った解釈を修正できることがわかりました。
しかし、研究者たちはこの実験に一定の制限があることを指摘しました。たとえば、サンプル数が限られており、テスト期間が短いことです。チームは次のシーズンにさらに多くの制御要因や特徴を取り入れ、実験の統計的力強さを高める予定です。
この実験を通じて、Nof1はAI研究が静的なベンチマークテストからより現実的で動的な意思決定シナリオへと進化することを願っています。特定の微調整なしで大規模言語モデルが効果的にトレードできるかどうかを探求することも目的です。この成果は、AIが金融分野での応用に新たな視点を提供するだけでなく、現代のモデルがトレード、リスク管理、市場理解などの面で直面する課題も明らかにしています。
