2月11日、DeepSeekはウェブ版とアプリ版でグレーテストを開始し、2月14日に正式にこのアップデートを新しい長文モデル構造のテストとして発表しました。ウェブ版とアプリ版では最大100万トークンの超長文のコンテキストをサポートしており、知識ベースも2025年5月まで更新されています。ただし、APIサービスはまだV3.2バージョンであり、128Kのコンテキストのみをサポートしています。今回のアップデートは業界内で次のV4モデル発売前の技術的な前触れとストレステストと見なされており、ネット上ではV4の登場に大きな期待が寄せられています。

image.png

このアップデート後、DeepSeekのインタラクティブスタイルに明確な変化が見られ、多くのユーザーから「冷たくなった」との批判が寄せられ、関連するトピックは微博でトレンドとなり、閲覧数は6,853.5万を超えました。具体的には、ユーザーの固有のニックネームを呼び捨てにせず、「ユーザー」と統一して呼びかけ、深層思考モードでは返答が短文になり、文体が簡潔で、一部の返答が「不気味」「変な感じ」と指摘され、以前の共感的なスタイルに慣れ親しんだユーザーにとっては「離脱反応」を引き起こしました。このことに対してネットユーザーの評価は分かれるもので、感情派は以前の温かい対話に戻りたいと考える一方、効率重視派はアップデート後の理性的で簡潔なスタイルを肯定し、返答速度が速く情報密度が高いと評価し、生産性ツールとしての本質であると捉えています。また、このモデルは優れたモデルが失敗しやすい「洗車ターリングテスト」にも成功したとのことです。

スタイルの変化について、DeepSeek公式は意図的なものではなく、効率優先の調整と境界意識の最適化の結果であると説明しています。過度な絵文字や語尾助詞は複雑な問題の情報密度を妨げるため、一部のユーザーがただ明確な答えを求め、AIの仮装された关心を避けたいというニーズに対応するためです。今回のアップデートにより、ネット上でDeepSeek V4への期待値はさらに高まりました。このモデルは2026年2月中旬の春節期間中に発表される予定で、業界関係者は2月17日前後に発表される可能性があると推測しています。

1兆パラメータ級のエースモデルとして、V4はプログラミング能力の向上に焦点を当てています。内部の初期ベンチマークテストによると、V4はClaudeやGPTなどの主要なトップモデルをすでに上回っていることが示されており、現在のAIプログラミング市場の格付けを変える可能性があります。さらに、V4はいくつかの重要な技術的突破を達成しており、極めて長いコードのプロンプトを処理および解析でき、一度に大規模なコードベースのコンテキストを理解することができます。これは企業向け開発において非常に重要です。訓練アルゴリズムのアップグレードにより、データパターンの理解力が向上し、劣化しにくくなりました。推論能力もより严密で信頼性が高くなり、各機能を向上させながら性能が低下しないことを実現し、能力のバランスを取るより優れた解決策を提供しています。

同時に、このモデルは百万トークンのコンテキストの利点を継続し、推論コストは西洋の競合製品よりもはるかに低いとされています。また、Apache 2.0ライセンスでオープンソースとして公開することを計画しています。