最近、YouTubeのテクノロジーチャンネル「Fully Buffered」は、非常に衝撃的なハードウェアテストを実施しました。2006年に発売されたIntel Pentium 4 641プロセッサ上で、Metaが最新にリリースしたLlama 3.2 3Bという大規模モデルを成功裏に動作させたのです。
このテストでは、現代の人工知能技術と20年前の古いハードウェアを意図的に「衝突」させました。これはLLM(大規模言語モデル)が持つ基本的な互換性の限界を示すだけでなく、多くのネットユーザーが感嘆するように、「モアの法則」がAI時代においてこのような形で時空を超えた「握手」を果たしたのです。
ハードウェアの「考古学」:極限的な構成で現代の演算力を動かす
このテストのために、Fully Bufferedチームは2006年の主流なオーバークロッカーのハードウェアの最高性能を再現しました:
コアの心臓: Intel Pentium 4 641(3.2GHz、単コア、2MB L2キャッシュ)。
メモリ配列: サス・P5WDH Deluxeマザーボードに4本の2GB DDR2-800メモリを搭載し、合計8GBのメモリ容量を確保。
ソフトウェア環境: 古いアーキテクチャがAVX2命令セットをサポートしていないことを考慮し、No-AVXモードに対応した推論環境を特別に調整しました。
遅延した推論:1秒あたり0.21トークンの「長征」
テスト中にシステムがLlama 3.2 3Bに「What's a Pentium 4?」と質問を投げかけると、この20年前の単コアプロセッサはすぐに「最悪の負荷状態」に陥りました。
生成効率: 最終的に生成速度はわずか0.21トークン/秒にとどまりました。
時間コスト: 完全な回答を得るために、Pentium 4は約33分間
現代のAIアプリケーションが「ミリ秒単位」の反応を求める中、33分間の待ちは「崩壊レベル」の体験です。しかし、NetBurstアーキテクチャ時代に生まれたこのプロセッサにとって、これはAIの原理が古き硅片上での20年にも及ぶ「論理的長距離走」でした。
意味は実用を超えている:AIの互換性の限界を証明
なぜこんな古い機械でAIを動かす必要があるのでしょうか?テストチームは、このテストが実用性を追求するためではなく、重要な2つの境界を検証することを目的としていたと述べています。
No-AVX命令セットの生存空間: 現代の大規模モデルはほぼすべてAVX命令セットを前提としていますが、特定の推論モードを用いることで、これらの命令セットがなくてもAIは推論を行うことができます。
メモリの「基盤」としての役割: 30億パラメータを持つ3Bモデルが8GBのDDR2メモリに「丁度収まる」ことから、メモリが十分であれば、極めて低性能な単コアCPUでも現代のLLMを動かすことが可能であることが証明されました。これはGPUの高性能な演算力に頼る必要がないことを示しています。
終わり:NetBurstアーキテクチャの「AI晩年」
2006年、IntelのPentium 4はまだ主周波数競争の狂気の中で、「高主周波数・低効率」のNetBurstアーキテクチャを追い求め続けていました。当時のエンジニアたちが未来がプロセッサの時代になることを予見していたことは間違いありませんが、彼らが想像したのは、このアーキテクチャが20年後にこれほど困難な形で、自分の歴史を理解し説明することができることとは、到底思いもよらなかったでしょう。
このテストはAIハードウェアエコシステムに極端な参考ケースを提供しました:演算力が反応速度を決定しますが、命令セットの互換性とメモリの支えが、大規模モデルの動作における根本的な生命線です。 ペンティウム4が最終的に画面にゆっくりと自分自身の説明を打ち出すとき、これは単なる推論の成功ではなく、コンピュータサイエンス史上におけるロマンチックな別れの儀式だったのです。
