中国電信人工知能研究院(TeleAI)は、画期的な生成型ビデオ圧縮技術「GVC(Generative Video Compression)」を発表しました。この技術により、動画データの圧縮率は驚くべき0.02%にまで向上し、1GBの動画ファイルは理論上約200KBのデータ量で送信され、再生可能となり、画質も依然として明確です。

image.png

この技術のコアロジックは「計算で帯域を交換する」と呼ばれています。従来の動画コーディング(H.265やH.266など)が「ピクセルを移動する」ロジックに依存しているのとは異なり、GVCは完全な画像ピクセルを伝送せず、「どうやって画像を作成するか」という指示を伝えます。これらの非常に小さなデータパケットは「圧縮トークン」と呼ばれ、画像の意味情報(シーンや物体構造)と動き情報(動作トレンド)を含んでいます。

受信側では、事前に訓練された生成型モデルが「画家」の役割を果たします。これは受け取ったトークンの指示に基づき、自身が持つ膨大な世界知識(例えば、波浪やサッカーの視覚的特徴)を活用して、リアルタイムで連続的で現実的な動画画像を生成します。この方式は、従来技術が極めて低い帯域幅下で起こりがちな画像の崩壊やカクつきの問題を直接回避しています。

TeleAIが公開した技術報告書によると、GVCは権威あるデータセットでのテスト結果において従来のアルゴリズムを大幅に上回っています。同等の視覚品質を維持する場合、従来の方法はGVCの6倍以上の帯域幅を消費します。現在、このモデルはコンシューマー向けGPU(RTX4090など)でほぼリアルタイムの生成速度を実現しています。この技術は今後、遠洋通信、緊急救助、深宇宙探査などの極端なネットワーク環境で、高解像度動画の転送の燃え上がるような課題を解決する可能性があります。

    技術報告書のリンク:

    https://www.arxiv.org/abs/2512.24300

重要なポイント:

  • 📉 極限圧縮: 動画圧縮率を0.02%まで引き下げ、1GBの動画を200KBのデータ量で受信側で再構築可能です。

  • 🧠 論理の変化: 従来のピクセル移送モードを変更し、高次元の意味トークンを伝送し、エンドユーザーで生成型AIを使って動画を再作成します。

  • 応用範囲広い: 緩い帯域幅環境に特化し、衛星通信、遠洋航行、災害現場の救助など極端な信号状況で利用できます。