4000億パラメータを生で処理に成功！iPhone 17 Proが巨大モデルのローカル実行に挑戦　しかし速度は0.6トークン

スマートフォンの演算能力の限界はどこにあるのか。アップルの最新フラッグシップモデルiPhone17Proが、驚きと少し恥ずかしさを伴った答えを示した。

3月23日、4000億パラメータを持つ大規模言語モデルがiPhone17Proで成功裏に動作しました。このモデルは通常、量子化圧縮後でも少なくとも200GBのメモリが必要ですが、iPhone17Proのハードウェア構成はわずか12GBのLPDDR5Xメモリです。

技術的な「ブラックテクノロジー」: フラッシュ転送と混合エキスパートモデル

メモリ容量が極めて不足している状況下で、この「不可能なタスク」を実現するためには主に2つの技術経路に頼りました:

SSDによる「拡張」: Flash-MoEというオープンソースプロジェクトを利用して、デバイスが直接SSDからGPUへデータをストリーミングし、物理的なメモリの上限を超えることができました。

MoEアーキテクチャの利点: 「MoE」とは混合エキスパートモデル（Mixture of Experts）を意味し、これは各単語を生成する際に4000億のパラメータの一部のみを呼び出すことで、全体をロードしないことを意味します。

速度の欠点: 2秒ごとに1語ずつ表示

「動作した」ことは確かですが、実際の体験は「使える」ものとは大きなギャップがあります。テスト結果によると:

生成速度: たったの0.6Token/秒です。つまり、約1.5〜2秒ごとに1語しか生成できません。

消費電力の問題: このような高負荷のローカル計算はスマートフォンのバッテリー寿命を急速に減らし、発熱も無視できません。

業界への示唆: ローカルの大規模モデルの「特異点」が迫る?

現在の生成速度は「イライラ」させますが、今回のデモの象徴的な意味合いは実用価値よりもはるかに大きいです。スマホでトップレベルの大規模モデルをローカルで動作させることが不可能ではないことを証明しました。

プライバシーの防衛線: ローカルで動作するため、データをクラウドにアップロードする必要がなく、非常に高いプライバシー保護が可能です。

オフラインでの実現可能性: インターネット接続がない環境でも、最上位のAIの返答を得ることが可能になります。

業界関係者はこう述べています。「動くこと」と「スムーズに使えること」は別物です。しかし、アルゴリズムの最適化とハードウェアの進化が進むにつれて、0.6トークンが60トークンに進化するとき、スマートフォンは本格的に「自分の脳」として進化するでしょう。

コデックスの自己蒸留プレイが人気！OpenAIの従業員が効率的で時間を節約できるAIアシスタントのヒントを明らかにする

OpenAIのプログラマーVB氏が、Codexの自己蒸留テクニックを公開。簡単なプロンプトで履歴をスキャンし、繰り返しの手動作業を特定して再利用可能なツールに変換し、効率を大幅に向上させる。ユーザーからのフィードバックを受け、VB氏はプロンプト2.0版を迅速にリリースし、機能をさらに最適化した。....

OpenAIの推論モデルが80年間の難問を自力で解決：研究アシスタントから科学発見者へ

OpenAIの汎用推論モデルは人間の指導なしに、組み合わせ幾何学分野で80年以上学界を悩ませてきたエルデシュ単位距離予想を独立して解決しました。この問題は1946年に数学者エルデシュによって提示され、平面上のn個の点の間に最大何ペアの距離が1になるかを探究するものでした。

OpenAIの広告ビジネスの転換：豪華クラブから離れ、中小企業を抱きしめる

OpenAIはChatGPTの広告事業で戦略転換。当初はAdobeやFoxなどの大手ブランドに限り、最低20万ドルのVIP戦略を取っていたが、一般向けで効果重視のモデルへ移行。広告参入障壁を大幅に下げ、誰でもセルフサービスで利用可能に。これにより、GoogleやMetaなど大手との本格競争に突入。....

820万ドルの評価を受けるデータマイナー：Human Archiveがインドでロボットトレーニングの金鉱を掘る方法

Human Archiveはシリコンバレーのスタートアップで、インドのギグワーカーにカメラを装着させ、一人称視点の動画データを収集し、AI研究所のロボット訓練に希少な現実世界の行動データを提供する。最近、トップAI投資家からの資金調達を完了し、物議を醸すが潜在性の高い分野に賭けている。....

音声創作に新たな飛躍！Stability AIがStable Audio 3を発表：長時間音声の秒単位生成

Stability AIは、新世代の音声大モデルStable Audio3を発表し、一部の重みをオープンソース化しました。このモデルは潜在拡散技術に基づいており、高品質なステレオ出力をサポートしており、生成速度が著しく向上しています。さまざまな仕様のバージョンを提供し、音楽制作やサウンド効果の作成などのニーズに対応し、変動する長さの音声生成もサポートしています。