DeepSeek、NSA技術を発表：長文脈の学習と推論を加速

人工知能分野において、DeepSeekチームは最近、NSA（Native Sparse Attention）と呼ばれる革新的なスパースアテンション機構を発表しました。この技術の主要な目的は、特に最新のハードウェア向けに最適化することで、長文脈のトレーニングと推論の速度を向上させることです。これにより、トレーニングと推論の効率が大幅に向上します。

NSA技術の導入により、人工知能モデルのトレーニングに大きな変化がもたらされました。まず、最新の計算ハードウェアの特性を考慮した設計最適化により、推論速度が大幅に向上し、事前トレーニングのコストが効果的に削減されました。さらに重要なのは、速度とコストの向上を維持しながら、NSAは高いレベルのモデル性能を維持し、様々なタスクにおけるモデルのパフォーマンスに影響を与えないことです。

DeepSeekチームは、その研究において階層的なスパース戦略を採用し、アテンション機構を圧縮、選択、スライディングウィンドウの3つのブランチに分割しました。この設計により、モデルはグローバルコンテキストとローカル詳細を同時に捉えることができ、長文の処理能力が向上します。さらに、NSAはメモリアクセスと計算スケジューリングの最適化により、長文脈トレーニングの計算遅延とリソース消費を大幅に削減します。

一連の一般的なベンチマークテストにおいて、NSAはその優れた性能を示しました。特に長文脈タスクと指示ベースの推論において、NSAのパフォーマンスは完全アテンションモデルと同等か、場合によってはそれを上回りました。この技術の発表は、AIトレーニングと推論技術の飛躍的な進歩を示しており、将来の人工知能の発展に新たな動力をもたらすでしょう。

NSA論文（https://arxiv.org/pdf/2502.11089v1）。

要点：
🌟 NSA技術の導入により、長文脈トレーニングと推論の速度が大幅に向上し、事前トレーニングコストが削減されました。
🛠️ 階層的なスパース戦略を採用し、アテンション機構を圧縮、選択、スライディングウィンドウに分割することで、モデルの長文処理能力が向上しました。
📈 複数のベンチマークテストにおいて、NSAは優れた性能を示し、場合によっては従来の完全アテンションモデルを上回りました。

千万元の年収でDeepSeekの核心メンバーを引き抜く！小米はAGI競争に本格参入、MiMo大モデルに重要な戦力が加わる

小米は高額な年収でDeepSeekの核心メンバーである Luo Fuli を引き抜き、 Lei Jun が直接推進してAGIの展開を加速させている。Luo Fuli はチームを率いて汎用人工知能の構築に取り組む予定で、彼女の年収は千万元規模に達し、小米がAI人材に強い関心を持っていることを示している。小米は4月に推論型の大モデルMiMoをオープンソース化したものの、業界の競争を前にしてハイレベルな人材の導入を通じて戦略を強化している。

AI音楽創作がプログラマーの副業に：シングル曲の再生回数が200万を突破、著作権収入は数万元

2025年、AI音楽創作ツールが普及し、業界の構造を変える。1月、『原神』のプレイヤーがSunoで曲を作り640万再生を達成し、AIの創作能力について議論を巻き起こした。プログラマーが活発なグループとなり、3月にYapieが複数のツールを使って数時間でテーマ曲を完成させた。

Reflection AI 200億ドルの資金調達で米国のオープンソースAIの先駆者になり、DeepSeekに挑む

設立から1年しかないスタートアップ企業であるReflection AIは、200億ドルの資金調達を完了し、評価額は800億ドルとなり、7か月前と比べて15倍に増加した。同社は元グーグルDeepMindの研究者によって設立され、自らのコード生成エージェントからオープンソースAIの開発へと転向し、閉鎖的な研究機関であるOpenAIなどに挑戦し、中国のAI企業であるDeepSeekの対抗馬となることを目指している。

DeepSeek、NSA技術を発表：長文脈の学習と推論を加速

関連推奨

千万元の年収でDeepSeekの核心メンバーを引き抜く！小米はAGI競争に本格参入、MiMo大モデルに重要な戦力が加わる

DeepSeekの上級研究者による警告：人工知能は10年以内に大部分の人間の仕事を取り替える可能性がある

DeepSeekモデルが香港大学・米国株式取引コンペティションで優勝年間収益率10.61%、GPTやナスダックベースラインを大きく上回る

AI音楽創作がプログラマーの副業に：シングル曲の再生回数が200万を突破、著作権収入は数万元

Reflection AI 200億ドルの資金調達で米国のオープンソースAIの先駆者になり、DeepSeekに挑む

DeepSeek、NSA技術を発表：長文脈の学習と推論を加速

関連推奨

千万元の年収でDeepSeekの核心メンバーを引き抜く！小米はAGI競争に本格参入、MiMo大モデルに重要な戦力が加わる

DeepSeekの上級研究者による警告：人工知能は10年以内に大部分の人間の仕事を取り替える可能性がある

DeepSeekモデルが香港大学・米国株式取引コンペティションで優勝 年間収益率10.61%、GPTやナスダックベースラインを大きく上回る

AI音楽創作がプログラマーの副業に：シングル曲の再生回数が200万を突破、著作権収入は数万元

​Reflection AI 200億ドルの資金調達で米国のオープンソースAIの先駆者になり、DeepSeekに挑む

DeepSeekモデルが香港大学・米国株式取引コンペティションで優勝年間収益率10.61%、GPTやナスダックベースラインを大きく上回る

Reflection AI 200億ドルの資金調達で米国のオープンソースAIの先駆者になり、DeepSeekに挑む