大メモリ時代からさようなら！Sakana AI、超軽量プラグインを発表。大規模モデルが膨大なドキュメントを瞬時に内部化

大規模モデルが長文を処理する際の「メモリの不安」は今や過去のものとなる見込みです。東京を拠点とするAIスピンオフ企業であるSakana AIは、2つの画期的な技術：Text-to-LoRA（T2L）とDoc-to-LoRA（D2L）を発表しました。これらの技術は、イノベーションな「スーパーネットワーク」アーキテクチャを用いて、大規模モデルを再トレーニングすることなく、1秒未満で超長文書や新しいタスクを学ぶことが可能です。

長い間、AI開発者たちは二択に追われていました。つまり、長文をダイアログボックスに詰め込む（反応が遅くなり、メモリを大量に消費する）か、モデルを微調整するために高いコストを払うかのどちらかでした。Sakana AIは第三の選択肢を提示しました。それは、「一度限りの支払い」による事前学習を通じて、非常に小さな重みプラグイン（LoRA）を生成し、低コストかつ高効率なモデル適応を実現するものです。

Doc-to-LoRA：12GBのメモリ要件を50MBに低下

今回の発表の中で最も注目すべき技術です。従来の方法で12.8万トークン（約十万文字）のドキュメントを処理する場合、モデルは12GB以上のVRAMを使用して情報を記録していました。しかしD2L技術を使えば、モデルはそれらの情報を50MB未満のプラグインに直接「消化」できます。

驚くほど速い: 従来の技術ではドキュメントを消化するのに40〜100秒かかりますが、D2Lは1秒未満
上限を打ち破る: この技術により、モデルは元の窓口よりも4倍長いテキストを処理でき、また「針の山から針を探す」テストにおいてほぼ完璧な正確性を維持します。

Text-to-LoRA：日常言語でAIをカスタマイズ

Text-to-LoRAは、モデルをより従順にします。ユーザーはただ自然言語でタスクを説明すれば（例えば「複雑な数学コンテストの問題を解決してください」）、システムは専用のパフォーマンス向上プラグインを自動的に生成します。実験によると、この方法で生成されたアダプターは数学や論理的推論のタスクにおいて、特定のタスクに特化して訓練された独立したモデルよりも優れた性能を示しています。

画期的な技術：テキストモデルでも「画像を見る」ことができる

研究者は予期せぬ驚きも見出しました。D2Lには強力なマルチモーダル能力があります。視覚情報が純粋なテキストモデルのパラメータにマッピングされ、画像を見たことのないテキストモデルが、**75.03％**の正確さで画像を分類できるようになったのです。

Sakana AIのこれらの成果は、個人や企業にとってプライベートAIモデルをカスタマイズするための障壁を大幅に下げており、さらに軽量で知能が高い汎用人工知能（AGI）の実現に向けて新たな道を開きました。

論文:https://arxiv.org/pdf/2602.15902

梁文鋒が200億を投じる！DeepSeekは500億円の記録的な資金調達を開始、V4.1は6月にリリース

国内の大規模モデル分野で資本の風が吹き荒れ、DeepSeek（ディープクエス）は初めての大規模資金調達を開始しました。目標金額は500億元に達し、成功すれば業界の記録を更新することになります。注目すべきは、リード投資家がベンチャーキャピタルやインターネット大手ではなく、創業者である梁文鋒自身であることです。彼の出資額が最高であり、会社に対する強い自信を示しています。

国内の計算力の新しい突破！ハイクンDCUとテナント・ミックス・ユーンHy3大規模モデルが深く互換性を達成

国内の大規模モデルと計算基盤の協調発展が重要な時期を迎える中、海光情報は深算3号DCUがテンセントの混元Hy3preview大規模モデルとの深い適応を完了したと発表。これは国産高性能計算力が超大規模複雑論理推論モデルを支える上で重要な突破口を示している。....

ステップスターレイヤーが「StepAudio 2.5 Realtime」を発表：大規模モデルに人のように感情と知性を付与

階躍星辰が次世代リアルタイム音声大規模モデルStepAudio 2.5 Realtimeを発表。テキスト対話からリアルタイム感情交流への質的進化を実現し、音声対話の自然さと知能化を大幅に向上。国産大規模モデルの音声分野での新たな高みを示す。....

中国が1日あたりのトークン呼び出し量で140兆を突破、2年間で1000倍以上に増加

2026年3月までに、中国のAI産業規模が爆発的に拡大し、1日あたりのトークン呼び出し量が140兆回を突破（前年比10万％超増加）。大規模モデルの応用が研究開発から本格導入へ移行し、高性能モデルの急速な進化とAIエージェントの普及が基盤となる計算需要を活性化、計算力レンタル市場の加熱が続いている。....

世界初のAI大規模モデル株式会社が北京に進出：智譜AIが3億6100万元で2万2700平方メートルの本社ビルを購入

智譜AIは最大3億6100万元（うち8162万元が株式買収、2億7890万元が債務受継ぎ）の総コストをもって北京紅鑽科技を100％子会社化し、中関村ソフトウエアパークのダイヤモンドタワーの不動産を取得しました。このビルは海淀区東北旺西路上にあり、面積は約2万2700平方メートルで、周辺には百度や騰訊、联想などのテクノロジー企業があります。これは智譜AIの本社物件が正式に確定したことを示しています。