大規模モデルのアップデートは再び加速しました。アリババ・トンイー・Qwen3.7シリーズの2つのプレビュー版——**Qwen3.7-Max-Preview** と **Qwen3.7-Plus-Preview** ——が、Qwen ChatやArena AI(旧LMArena)に静かに公開され、5月20日のアリババクラウドカンファレンスで正式発表される見込みです。

今回の公開された2つのプレビュー版は、それぞれ明確な定位を持っています:

Qwen3.7-Max-Preview: エンジニア向けの「脳」のプレビュー版で、総合的な性能の限界を追求しており、現在は思考モードのみが利用可能で、検索やコードインタープリターなどのツール機能は今後開放されます。

Qwen3.7-Plus-Preview: 高性能でバランスの取れたプレビュー版で、推論および論理表現に焦点を当てており、ツールチェーンも後ほど開放されます。

image.png

まだ「プレビュー版」であるにもかかわらず、実際のパフォーマンスは注目を集めています。Arena AIのテキスト能力ランキングでは、Qwen3.7-Max-Previewは総合第13位となり、アリババ・トンイー・Qwenが同種のラボの中で世界第6位にランクインしました。細分化された分野でも目立ちます:数学的推論第7位、エキスパートレベルの応用第9位、ソフトウェアとIT分野第9位、プログラミング能力第10位と、多様なタスクへの汎化力の高さを示しています。

視覚能力においては、Qwen3.7-Plus-Previewは総合第16位となり、トンイー・Qwenが視覚分野のすべてのラボの中で第5位にランクインしました。また、エキスパート向けの「エキスパート競技場」では、Qwen3.7-Max-Previewは第9位を獲得し、これは高難易度・高精度のタスクにおいて安定性が第一線に近づいていることを示しています。

開発者や重度ユーザーにとって、今回のプレビュー版のリリースは、次世代モデルの能力を事前に体験するための窓口であり、またアリババクラウドが「小歩速走、迅速な反復」の戦略を通じて、大規模モデルの競争において重要な節目に継続的に進出しているというシグナルでもあります。