人民大学の最新研究によると、データ拡張がコントラスト学習において複雑な役割を果たしていることが分かりました。正例を強く一致させることは必ずしも有利ではなく、より強力なデータ拡張は下流タスクの性能を向上させる一方で、一致性能を損なう可能性があります。
この研究では、情報理論とスペクトル解析の観点からデータ拡張戦略を提案しています。
Mistral AIはパリサミットで全面的な変革を発表し、モデル研究開発企業から計算能力、モデル、アプリケーションをカバーするフルスタックAIサプライヤーに進化。計算能力の自主権を確保するため、パリに40MWのデータセンターを建設し、グローバルな大規模モデル競争に対応するためインフラへの大規模投資を継続する計画。....
バイドゥが文心大モデルの派生モデルであるPaddleOCR-VL-1.6をリリースし、OmniDocBench v1.6評価で96.33%の正確率を記録し、Gemini-3-ProやGPT-5.2などの主流モデルを上回り、SOTAを更新しました。総合的なパフォーマンスは世界一です。このモデルは、複雑なドキュメント理解と現実的な場面での解析において、マルチモーダル大モデルにおける重要な進歩を示しています。100種類以上の言語認識をサポートし、ユーザーのカバー範囲は広範囲です。
Tencent Cloud智能エージェント開発プラットフォームは6月3日より、DeepSeek V4シリーズ大規模モデルの価格を大幅に引き下げ、主力モデルDeepSeek-V4-Proの推論入力・出力価格を75%削減し、企業と開発者のイノベーション障壁を低減し、日常の呼び出しコストを軽減することを目指しています。....
マスク氏のAI企業xAIは、多言語・音声対話技術の研究開発を加速し、最近、中国語AIトレーナーのグローバル募集を発表。リモートワーク対応で、主に大規模モデルGrokの音声対話と多言語処理能力の最適化を担当。米国での時給は35〜45ドルと競争力がある。....
NVIDIAは清華大学、トロント大学、Vector Instituteと共同で、複数のプレイヤーが仮想世界で同時に操作し相互に観察する複雑なシナリオを処理できるマルチエージェント世界モデル「Gamma-World」を発表しました。従来のシングルエージェント仮定のボトルネックを打破し、時間とクロスビュー情報の同期維持が核心的な課題で、ビデオ世界モデルをシングルからマルチプレイヤー協調へと根本的に変革します。....