本日、Step3.7Flashが正式に登場しました。このオープンソースモデルは、エージェント時代の核心的な課題である効率性、信頼性、マルチモーダルな実行能力に直面し、オープンな重み(Apache2.0ライセンス)を通じて業界から注目を集めました。

⚡️ Step 3.7 Flash is here_ The new frontier is age.jpg

ベースラインテストでリード、実践的な能力が優れている

Step3.7Flashは複数の重要な評価で突出した成績を収めています:

  • ClawEval-1.1で第1位(67.1点)
  • SimpleVQA Searchで第1位(79.2点)
  • SWE-PROで第2位(56.3点)
  • V* Pythonでは得点が95.3に達しています

これらの成績は、エージェントタスク、コード生成、ビジュアル検索などの複雑なシナリオにおいて、優れた競争力を持っていることを示しています。

コアパラメータ:速度、コスト、および能力のバランスの取れた製品

Agentic、コード、検索、マルチモーダルワークフロー専用のモデルとして、Step3.7Flashは速度と効率において顕著な突破を遂げています:

  • 推論速度:400TPSに達しています
  • 構造:198Bの疎なMoE構造で、アクティブパラメータは約11Bです
  • コンテキスト長:256Kをサポートしています
  • 推論レイヤー:3つの推論レベルを提供しています

高性能を維持しながら、実際の導入コストを大幅に削減し、開発者に効率的な選択肢を提供しています。

マルチモーダル理解 + 安全な実行、本当に「見えるものをできる」

Step3.7Flashの最大の特徴は、強力な感知 - 行動のクローズドループ能力です。UIインターフェース、グラフ、ドキュメント、画像などの視覚的コンテンツを理解し、それに基づいてコードを自動的に記述するか、ツールを呼び出して操作を行います。

拡張されたWeb+ビジュアル検索機能により、より多くの情報源にアクセスでき、深いクエリへの追跡が可能です。また、ツール呼び出しの信頼性が大幅に向上し、τ²-benchのすべての難易度レベルで98%以上の成功確率を達成しており、一般的なターゲットのずれやツール呼び出し失敗の問題を効果的に減少させています。

エコシステムの互換性とローカルデプロイメントの親切さ

モデルはClaude Code、KiloCode、Hermes Agent、OpenClawなどの主要なエージェントフレームワークおよびMCPなどのプロトコルと良好に互換性があります。同時に、Mac Studio M4Max、DGX Spark、AMD AI Max+395などのハードウェア上でローカルで動作することをサポートしており、ローカルデプロイメントやプライバシーが敏感なシナリオにおいて利便性を提供しています。

AIbaseコメント