Sakana AIは、自然に触発されたアルゴリズムを専門とする人工知能研究ラボであり、最近、Transformer²(Transformer-squared)と呼ばれる革新的な適応型言語モデルを発表しました。このモデルは、高価な微調整なしで、推論中に動的に学習し、新しいタスクに適応できるため、大規模言語モデル(LLM)技術の重要な一歩を意味します。



Sakana AIは、自然に触発されたアルゴリズムを専門とする人工知能研究ラボであり、最近、Transformer²(Transformer-squared)と呼ばれる革新的な適応型言語モデルを発表しました。このモデルは、高価な微調整なしで、推論中に動的に学習し、新しいタスクに適応できるため、大規模言語モデル(LLM)技術の重要な一歩を意味します。


MiniMax M2モデルでは、グローバルアテンションメカニズムが採用され、線形またはスパースアテンション技術は使用されていない。開発チームは、これら後者の方が計算リソースを節約できるものの、グローバルアテンションが実際の応用においてより効率的で、モデルの性能を向上させると考えている。この決定は、実際に導入した場合の効果を最適化し、AI技術の発展を推進することを目的としている。
宇樹科技CEO王興興氏は虹橋フォーラムで、ロボット大規模モデルがまだ初期段階(ChatGPT発表前1-3年程度)と指摘。生成AIの言語・視覚分野の進展を評価しつつ、人型ロボット分野の更なる革新突破を強調。....
魔珐科技が世界初の3Dデジタルヒューマンオープンプラットフォーム「魔珐星云」を発表。AIがテキスト対話から表情・ジェスチャー・動作をリアルタイム生成する3Dデジタルヒューマンへ進化。3Dマルチモーダルエンジンにより、テキスト入力からミリ秒単位で音声と動作を同期出力し、多端末に対応。....
OpenAIはGPT-5を基盤としたスマートセキュリティアシスタントであるAardvarkをリリースしました。このツールは、毎年数万件に上る新しい脆弱性に対処する開発者やセキュリティチームを効率的に支援します。継続的にソースコードを分析し、バグを自動的に特定し、リスクを評価・優先順位付け、修復案を提供することで、ソフトウェアのセキュリティ保護効率を大幅に向上させます。
Metaとエディンバラ大学はCRV技術を共同開発し、大規模言語モデルの内部推論回路を分析して推論の正確性を予測・修正する。モデル活性化計算グラフを構築し、高精度で推論エラーを検出し、AIの信頼性を向上させる。....