本日、Step3.7Flashが正式に登場しました。このオープンソースモデルは、エージェント時代の核心的な課題である効率性、信頼性、マルチモーダルな実行能力に直面し、オープンな重み(Apache2.0ライセンス)を通じて業界から注目を集めました。

ベースラインテストでリード、実践的な能力が優れている
Step3.7Flashは複数の重要な評価で突出した成績を収めています:
- ClawEval-1.1で第1位(67.1点)
- SimpleVQA Searchで第1位(79.2点)
- SWE-PROで第2位(56.3点)
- V* Pythonでは得点が95.3に達しています
これらの成績は、エージェントタスク、コード生成、ビジュアル検索などの複雑なシナリオにおいて、優れた競争力を持っていることを示しています。
コアパラメータ:速度、コスト、および能力のバランスの取れた製品
Agentic、コード、検索、マルチモーダルワークフロー専用のモデルとして、Step3.7Flashは速度と効率において顕著な突破を遂げています:
- 推論速度:400TPSに達しています
- 構造:198Bの疎なMoE構造で、アクティブパラメータは約11Bです
- コンテキスト長:256Kをサポートしています
- 推論レイヤー:3つの推論レベルを提供しています
高性能を維持しながら、実際の導入コストを大幅に削減し、開発者に効率的な選択肢を提供しています。
マルチモーダル理解 + 安全な実行、本当に「見えるものをできる」
Step3.7Flashの最大の特徴は、強力な感知 - 行動のクローズドループ能力です。UIインターフェース、グラフ、ドキュメント、画像などの視覚的コンテンツを理解し、それに基づいてコードを自動的に記述するか、ツールを呼び出して操作を行います。
拡張されたWeb+ビジュアル検索機能により、より多くの情報源にアクセスでき、深いクエリへの追跡が可能です。また、ツール呼び出しの信頼性が大幅に向上し、τ²-benchのすべての難易度レベルで98%以上の成功確率を達成しており、一般的なターゲットのずれやツール呼び出し失敗の問題を効果的に減少させています。
エコシステムの互換性とローカルデプロイメントの親切さ
モデルはClaude Code、KiloCode、Hermes Agent、OpenClawなどの主要なエージェントフレームワークおよびMCPなどのプロトコルと良好に互換性があります。同時に、Mac Studio M4Max、DGX Spark、AMD AI Max+395などのハードウェア上でローカルで動作することをサポートしており、ローカルデプロイメントやプライバシーが敏感なシナリオにおいて利便性を提供しています。
AIbaseコメント
