月の暗面がKimi Linearモデルをリリース：長文の処理速度が2.9倍に向上

人工知能生成コンテンツ（AIGC）分野において、月の暗面チームが開発したKimi Linearモデルは顕著な技術的進歩を遂げました。このイノベーティブなモデルは、長文の文脈処理における速度が2.9倍に向上し、デコード速度は6倍に改善され、従来のソフトマックスアテンションメカニズムの性能の限界を突破しました。Kimi Linearは、混合線形アテンションアーキテクチャを採用しており、特に文脈処理や強化学習などの複数のシナリオで、一般的に使用されているソフトマックスアテンションメカニズムを上回る性能を示しています。

従来のTransformerモデルはソフトマックスアテンションメカニズムを使用しており、計算複雑度はO(n²)に達しており、これにより長文の処理時に計算量とメモリ消費量が指数関数的に増加し、モデルの実際的な応用に大きな影響を与えています。一方で、線形アテンションの導入により、この複雑度はO(n)に低下し、処理効率が大幅に向上しました。しかし、初期の線形アテンションでは性能が不十分であり、特に長系列の記憶管理において制限がありました。

Kimi Linearモデルのコア革新は、Kimi Delta Attention（KDA）です。これは細粒度のゲートメカニズムを導入し、モデルの記憶管理能力を改善します。KDAは入力に応じて動的に記憶状態を調整でき、情報の忘れ方と保持を効果的に制御することができ、長期的なインタラクション中の情報をより良く処理できます。

また、Kimi LinearはMoonlightアーキテクチャを採用し、KDAと全アテンション層を混合し、3:1の比率で構成することで、計算効率とモデルの能力のバランスを取っています。この設計により、Kimi Linearは長文の処理において優れた性能を示し、計算コストも効果的に低減されています。

一連の実験によって確認された結果によると、Kimi Linearはさまざまなタスクにおいて優れたパフォーマンスを示しており、特に繰り返し文や複数クエリ関係記憶タスクなど、長文の記憶が必要なタスクでは、前世代モデルを大きく上回る正確性を示し、細粒度制御の利点を示しています。

ポイント:
🌟 Kimi Linearモデルは長文処理の速度が2.9倍に向上し、デコード速度は6倍に改善されました。
🔍 Kimi Delta Attention（KDA）という革新的なメカニズムを採用し、記憶管理と情報の忘れ方を最適化しています。
📈 3:1の混合アーキテクチャによる設計により、計算効率とモデル性能のバランスを取っており、実験結果から卓越した能力を示しています。

Moonshot AIがKimi Linearをリリース：線形アテンションアーキテクチャは6倍高速、オープンソースのKDAコアも同時リリース

中国チームのMoonshot AIがKimi Linearアーキテクチャの技術報告を発表し、完全なアテンションメカニズムに代わるハイブリッド型線形アーキテクチャを提案しました。このアーキテクチャはスピード、メモリ効率、長文処理の3つの面で突破を遂げ、KVキャッシュの使用を顕著に軽減し、効率とパフォーマンスの両方の利点を備えているとされ、エージェント時代におけるアテンションメカニズムの新たな起点と呼ばれています。

元バイトダンス剪映AI製品責任者である廖謙が起業し、マーケティングマルチモーダルエージェントを発表

元バイトダンス剪映AI製品責任者の廖謙が「極限的なコンテキスト」という会社を設立し、マーケティングマルチモーダルエージェントの開発に注力しています。AIGC分野での豊富な経験を活かし、彼は数百万ドル規模の初期資金調達を迅速に完了しました。廖謙は以前はテンセントやバイトダンスで勤務し、2019年からAIGC技術に関わっており、業界から注目を集めています。

视觉中国は複数のAI会社と協力して商用可能な視覚大モデルを開発：アリババやマイクロソフ트などの注文を獲得

Visual Chinaはオンライン会議でAIビジネスの進展を明らかにし、複数のAIGC企業と協力して商用可能かつトレーサブルなビジョナルクリエイティブ大規模モデルを開発し、アリババやマイクロソフトなどのコンプライアンスデータサービスの注文を獲得した。同社はAIモデルのトレーニングに高品質で著作権に準拠したデータリソースを提供することを定位しており、ビジュアルトレーニングに使用するために7億を超えるコンテンツデータを保有している。

ビジュアルチャイナは7億の規制に適合したデータを保有し、アリババやマイクロソフトなどのトップAI企業からモデルトレーニング注文を獲得

ビジュアルチャイナは複数のAIGCトップ企業と協力し、「商用可能で追跡可能な」視覚的創造業界の大規模モデルを構築し、AIがクリエイティブ領域で健全かつ高品質な応用および著作権の合規を推進しています。世界的な豊富なリソースを活かし、会社のデータサービス事業はアリババやマイクロソフトなどの国内外の大規模モデル会社を引きつけ、規制に適合したデータを提供し、強力な市場魅力を示しています。

月の暗面がKimi Linearモデルをリリース：長文の処理速度が2.9倍に向上

関連推奨

月の暗面が新種のハイブリッド線形アテンションアーキテクチャを発表 KIMI Linear

Moonshot AIがKimi Linearをリリース：線形アテンションアーキテクチャは6倍高速、オープンソースのKDAコアも同時リリース

元バイトダンス剪映AI製品責任者である廖謙が起業し、マーケティングマルチモーダルエージェントを発表

视觉中国は複数のAI会社と協力して商用可能な視覚大モデルを開発：アリババやマイクロソフ트などの注文を獲得

ビジュアルチャイナは7億の規制に適合したデータを保有し、アリババやマイクロソフトなどのトップAI企業からモデルトレーニング注文を獲得