Google が所有する Gemini3Deep Think が本日、大きなアップグレードを実施しました。このモデルは深層的な推論を特徴とし、プログラミング分野では「世界王者レベル」の実力を発揮しており、科学研究やハードウェアエンジニアリング分野でも多くの目標を刷新しました。これにより、AIの推論能力は新たな次元に進化しました。

image.png

Gemini3Deep Think の主要な実績:

プログラミングで頂点に立つ: アルゴリズムコンテストプラットフォーム Codeforces で 3455Elo の驚異的なスコアを記録しました。これは人類の最上位クラスに位置するものであり、現在世界中でこのモデルに勝てる人間はわずか7名しかいません。比較すると、1年前の最高性能の o3 モデルのスコアは2727でした。

研究分野の最強脳: このモデルは非常に厳密な論理構成を持ち、高難度の物理数学論文において、人間の査読者さえ見落とした小さなバグを発見しました。また、「Erdős予想」に関するいくつかの難問も成功裏に証明しました。

スケッチから実物へ: エンジニアリング分野において、手書きのスケッチを分析し、高精度な3Dモデルファイル(例えばノートパソコン用スタンド)に変換することができます。これにより、物理的な部品のモデリング効率が10倍になりました。

ベンチマーキングで全面突破: 「人間最後の試験」と呼ばれる HLE で48.4% のスコアを達成し、ARC-AGI-2ベンチマークで84.6% の高い正確率で首位を維持しています。

現在、Google は AI Ultra 無料体験版ユーザーに対して新バージョンの利用を開始しており、一部の研究者および企業向けに初めて API を開放しました。今回の Gemini の画期的な進化は、競合の推論モデルに対する強力な反撃として注目されています。