9月24日、アリババのAIエースアプリであるクォークは、新規のAIクリエイションプラットフォーム「造点(ゾウディアン)」を正式に発表しました。このプラットフォームはAIによる画像生成とAIによる動画生成の2つの主要な機能を統合しており、国内で初めて音声と映像の同期が可能な動画生成をサポートするプラットフォームとなりました。画像生成に関して、「造点」は世界で最も進んだ画像生成モデルであるMidjourney V7を導入しています。クォーク独自の技術と組み合わせることで、「造点」は画像と動画の両方を扱える一貫したクリエイション体験を提供します。

image.png

通義万相Wan2.5への統合はプラットフォームの大きな特徴です。最新のモデルの能力を活かして、「造点」は画面にマッチする声や効果音、バックグラウンドミュージックを生成できます。10秒間の動画生成をサポートし、一度の生成でより完成度の高いストーリーを実現できます。24フレーム/秒の1080Pハイクオリティ動画をサポートし、映画級のシーン作成に必要な画質を満たします。モデルは非常に強力な指示遵守能力を持ち、動画生成中にカメラワークなどの複雑な連続的な操作を実行できます。

AIによる画像生成において、「造点」はMidjourney V7の多くの核心機能を全面的にサポートしており、複数の画像参照、スタイルコード、パラメータの細かい制御などに対応しています。これはプロのクリエイターが構図、スタイル表現、詳細な仕上げに関する高次元のニーズを満たすために役立ちます。クォークの独自技術と組み合わせて、「造点」はアジア人像生成、中国語テキスト生成、中国風要素などにおいて特に優れています。これはEC、平面デザイン、映画ゲームなどのアプリケーションに適しています。

テスト期間中、「造点」は多くの専門的なAIGCクリエイターを引きつけ、例えば「中世の油絵合唱」「文物が月餅を食べる」「巨大な猫が旅行に行く」など、話題になった作品を生み出しました。動画では人物の口の動き、動作、表情、音楽が一気呵成です。あるクリエイターは、「Midjourneyで画像を生成し、それにWan2.5で動画を生成する。画質は細かく安定しており、今回の動画モデルのアップグレードにより、音声と動画を同時に出力できるようになったため、クリエイション効率が大幅に向上した」と述べました。

image.png

クォーク「造点」で制作されたクリエイティブなコンテンツ

現在、ユーザーは直接zaodian.quark.cnにアクセスするか、クォークPC版の「AI画像生成」から「造点」にアクセスできます。今月9月30日まで、すべてのユーザーが7日間無料で通義万相Wan2.5の動画生成機能を体験できます。

クォークアプリ内では、「造点」は軽量なクリエイション体験を提供し、より多くの一般ユーザーのニーズに応えます。ユーザーは「一文で画像編集」「AIクリエイティブビデオ」などのユニークな遊び方を実現でき、日常的な画像編集のニーズにも対応し、フィルター、美人顔、人の移動物の除去なども可能です。また、髪型の変更、背景の変更、スタイルの変換、3Dフィギュア生成などの人気のあるAIシナリオもサポートしています。