リリースの予定に近づくにつれて、中国のAIリーダーであるDeepSeek V4のより詳細な技術情報が明らかになってきている。著名なリーク元Legitによると、DeepSeekは「sealion-lite(海獅ライト)」と呼ばれるV4のプレビュー版を閉門内側でテストしており、関係者は厳格な秘密保持契約に署名している。
V3モデルと比較して、DeepSeek V4は世代を超えた飛躍を遂げる。新しいモデルは多モード処理能力をネイティブに備え、文脈ウィンドウを直接100万トークンまで拡大する。これは、数冊の本や非常に長いコードベースを一度に「飲み込む」ことができ、深い論理的推論を行うことを意味する。初期のテストフィードバックによると、V4は複雑なSVGベクトルグラフィックなどの高難度タスクにおいて驚くべき効果を示し、現在のウェブおよびアプリケーション端末でのオンラインモデルよりも性能が顕著に優れている。
AIbaseが知ったところでは、DeepSeek V4は1兆パラメータ規模の巨大な基本モデルとなる見込みである。このモデル規模の指数的な増加により、トレーニング期間が長引いたため、発売日は当初計画より遅れた。注目すべき点は、DeepSeekが業界慣例を破り、英語系チップメーカーであるNVIDIAやAMDにプレビューを提供しなかったことである。代わりに、数週間前から中国のチップサプライヤーであるHuaweiなどにアクセス権を開放し、モデルを国内の計算力プラットフォーム上で深く適合・最適化することを目的としている。
一方で、DeepSeekのGitHubリポジトリも最近頻繁に更新されている。多くの変更はエンジニアの春休み後の通常のコード整理に過ぎないが、API統合に関連する多くの企業向けソリューションも含まれている。今週中にリリースされるという噂が広まっている中、世界中の開発者たちは、この「高コストパフォーマンス、高性能」で知られる中国企業が、DeepSeek V4を通じてどのように再び世界のAI競争構図を衝撃的に変えるかを待ちわびている。
要約:
🚀 パラメータ量の飛躍:DeepSeek V4は1兆パラメータ規模のモデルとして位置付けられ、百万レベルの長文入力をサポートし、ネイティブなマルチモーダル機能によってより強力な論理的および創造的な表現が可能になる。
🇨🇳 国内計算力優先:会社はHuaweiなどの中国チップサプライヤーに優先的に対応し、外部サプライチェーンへの依存を減らし、国内ハードウェアに対して深くパフォーマンスチューニングを行うことを目的としている。
🗓️ リリースが目前:軽量版の内側テストが静かに開始され、外資系メディアは来週にも正式に発表される可能性があると予測しており、この動きは世界のAIコミュニティおよび金融市場で高い注意を引いている。
