
技術的な経路を振り返ると、楊氏は大規模モデルの進化を3つの時期に分けました。3年前の第一段階では、インターネットの自然データと少数の価値観の一致を考慮した人工ラベリングに依存していました。昨年の第二段階では、大規模強化学習に焦点を当て、研究者が高品質なタスクを選定してモデルの性能を向上させました。2026年に突入し、AIの研究開発方法には根本的な変化が生じ、研究者の役割は「AIの計算力調整者」へと変化しています。この新しい段階において、研究プロセスはAIが大量のTokenを使って新しいタスクや環境を独自に生成し、最も適切な報酬パラメータを定義するだけでなく、新たなネットワーク構造の探求にも深く関与します。
この傾向は、AIの研究開発効率が指数関数的に加速する時期に入るという予測を示しています。月の暗面は、そのコア製品
