MiroMindチームは、オープンソースでbAgentモデルMiroThinker v1.0をリリースしました。このモデルは256Kのコンテキストウィンドウと一度に600回のツール呼び出し能力を提供し、初めて「ディープインタラクションScaling」フレームワークを提案しました。このフレームワークは、従来のパラメータスタックパスに代えて、頻繁な環境とのインタラクションとリアルタイムフィードバックによって、エージェントの自己進化を実現することを主張しています。

このモデルには検索、Linuxサンドボックス、コード実行、音声変換、翻訳などのツールチェーンが統合されており、数時間以内に複雑なタスクフローを自主的に完了できます。公式の例では、MiroThinkerは600ラウンドの呼び出しを使ってレシピを収集し、レシピをシミュレーションし、カロリーを計算し、スイートナーの比率を反復して調整し、最終的に栄養分析とコスト比較を含む低糖質スイーツの解決策を出力しました。このプロセス中は一切人間の介入がありませんでした。

MiroMind 団隊が新しいオープンソースのbAgentモデル:MiroThinker v1.0を発表しました。その最も.jpg

MiroMindによると、性能指標は「性能∝インタラクションの深さ×反省の頻度」という式に従っており、ツールとフィードバックのループが多いほど戦略空間は指数関数的に拡大します。現在、モデルの重みとコードはGitHubとHugging Faceで公開されており、24GBのVRAMでローカルにデプロイ可能です。またLangChainやLlamaIndexのフレームワークにも対応しています。開発者はカスタムツールセットを作成し、独自の進化エージェントを構築できます。

チームは、次のステップとしてツールエコシステムを千回の呼び出し規模まで拡張し、百万レベルのコンテキストを持つ「生涯学習」バージョンの探索を行う予定です。業界の専門家は、オープンソース戦略がエージェントの軍備競争を引き起こす可能性があると考えており、長期的な相互作用能力は次世代の大規模モデルの重要なトレンドになるかもしれません。