記事本文

マスク氏が「いいね」！Kimiの論文が大規模モデルの伝統的な基盤を揺さぶる：同じ計算能力で効率が25%向上

公開AI二ュ-ス

時間 :Mar 19, 2026

読む :1分

同じ計算力とデータでも、なぜ一部のモデルはより良い効果を発揮するのでしょうか。月の暗面（Moonshot AI）は、根本的な論理に直接答える答えを提示しました。

3月16日、Kimiが重要な技術報告書 『Attention Residuals』（注目残差） を発表しました。この研究は、2015年以来ほとんど変更されていない大規模モデルの「基盤」として知られる「残差接続（Residual Connections）」を完全に再構築しています。実験の結果、同じ計算力で新方法で訓練されたモデルの効果は、ベースラインモデルが 1.25倍 の計算力を要した場合と同じであることが証明されました。

この突破はすぐにシリコンバレーのAI界を揺るがし、ソーシャルメディアでは「Kimiからの印象深い仕事（Impressive work from Kimi）」と公開的に評価されました。

Jerry Tworek（OpenAI o1の主な開発者）: これを「ディープラーニング2.0」の始まりと呼びました。

Andrej Karpathy（元OpenAI共同創設者）: 行業が「Attention is All You Need」の理解にはまだ掘り下げの余地があると感嘆しました。

なぜ「伝統的な地盤」を動かす必要があるのか?

従来の残差接続は、深層ネットワークのトレーニングが難しい問題を解決しましたが、「等しい重みで加算」する方法はあまりにも単純すぎました。ネットワークが深くなるにつれて、各層が新たに貢献する情報は膨大な蓄積情報に埋もれてしまい、多くの中間層が「無駄に働く」存在となってしまいます。

Kimiの「エレガントな回転」:

チームは、深さ方向の情報喪失とRNNの時間方向での忘却が数学構造において非常に一致していることに気づきました。そのため、文字列処理に使われていた「注目メカニズム」を横に90度回転させ、縦方向の深さ方向に応用しました。

これにより、各層は情報を受け入れるだけではなく、微小な「クエリベクトル」を通じて、前段のどの層からどれだけの情報を抽出するかを積極的かつ選択的に決定するようになりました。大規模なトレーニングにおけるメモリコストを解決するために、チームはまた独自の Block AttnRes 方案を提案しました。ネットワークをいくつかのブロックに分割することで、パフォーマンスを確保しながら、推論遅延の増加を 2% 以内に抑えることができました。

の実験では、このアーキテクチャは非常に高い汎化能力を示しました。GPQA-Diamond科学的推論タスクで 7.5% の飛躍を遂げ、数学およびコード生成タスクでもそれぞれ 3.6% と 3.1% の顕著な向上を達成しました。

創業者がGTC2026でのスピーチで述べたように、業界は徐々にScalingの限界に直面しており、オプティマイザーや残差接続などの基本的な構造を再構築する必要があります。多くの人が「上層部の改装」に集中している間、

国家標準委員会が『AI倫理セキュリティガイドライン1.0』を発表、大規模モデルの実装に安全ブレーカーを設置

全国网安标委会が「人工知能応用倫理安全ガイドライン1.0」を発表。アリババ、ファーウェイ、DeepSeekなどが共同起草し、AI倫理安全が「トップレベルの提言」から「技術基準の具体化」へ移行。原則的・参考的な技術文書で、AI産業チェーンの各主体に実行可能な倫理安全指針を提供する。....

May 25, 2026

763.7k

価格が75％も低下！DeepSeek V4が永久的な割引を発表し、世界のAIコストパフォーマンス第1位に輝く

DeepSeekはその旗艦大規模モデルV4-Proの価格を75％永久的に引き下げたことを発表しました。元々のタイムリーな2.5倍割引が永続的な価格に変更されました。第三者の評価では、このモデルが価格引き下げにより世界のAIコストパフォーマンス第1位に登頂し、性能で米系競合を圧倒しています。これにより、中国のAIがコストと効率において絶対的な優位性を示しています。

May 25, 2026

185.5k

グーグルCEOピチャイ：AI検索の転換に慎重な戦略を取り、プログラミング分野での遅れを率直に認める

グーグルCEOのピチャイはI/Oカンファレンス後のポッドキャストインタビューで、AI競争について率直に語った。彼はグーグルが全体的な知能とマルチモーダル能力ではリードしていることを認めつつ、エージェント型プログラミングや複雑な長期タスクにおいては遅れを認めた。また、検索モードの変化やAIの安全性についても言及し、AIレースにおける課題に直面しながらもオープンな姿勢を示している。

May 25, 2026

178.9k

強力な提携！テキサス州でAIの電力需要急増に対応する2.5ギガワットの原子力・ガス併用発電所建設が計画中

米国のエネルギー企業ブルー・エナジーはGE VERNOVAと提携し、テキサス州に2.5ギガワット規模の併用発電所を建設する計画を進めている。このプロジェクトでは原子力と天然ガス発電設備を同時に導入し、AIデータセンターの急増する電力需要に対応する。このプロジェクトは「ガス転換原子力」のモデルを初めて採用しており、天然ガスによる迅速な電力供給から段階的に原子力へと移行することで、従来の原子力発電所の承認や建設にかかる時間が長いという課題を効果的に解決する。高エネルギー消費産業に柔軟で安定した電力供給ソリューションを提供するものである。

May 25, 2026

187.2k

業界初のケース！有名声優・津田健次郎がTikTokにAIボイスの不正使用を提訴

日本の有名声優である津田健次郎がTikTok運営会社を相手に、声の著作権侵害を主張して提訴し、生成AIによる声紋の不正使用に対抗する業界初の事件となった。津田は『呪術返し』の吹き替えで知られており、その特徴的な声は彼の職業的資産とされている。灰色市場では不法に声紋を使い利益を得ており、1日で数万円の利益を得ているとされ、議論を呼んでいる。

May 25, 2026

163.9k

インテリジェントな未来、あなたの人工知能ソリューションシンクタンク

English 简体中文繁體中文にほんご

マスク氏が「いいね」！Kimiの論文が大規模モデルの伝統的な基盤を揺さぶる：同じ計算能力で効率が25%向上

関連推奨

国家標準委員会が『AI倫理セキュリティガイドライン1.0』を発表、大規模モデルの実装に安全ブレーカーを設置

価格が75％も低下！DeepSeek V4が永久的な割引を発表し、世界のAIコストパフォーマンス第1位に輝く

グーグルCEOピチャイ：AI検索の転換に慎重な戦略を取り、プログラミング分野での遅れを率直に認める

強力な提携！テキサス州でAIの電力需要急増に対応する2.5ギガワットの原子力・ガス併用発電所建設が計画中

業界初のケース！有名声優・津田健次郎がTikTokにAIボイスの不正使用を提訴