アリババクラウドが新世代の動作生成モデル「Wan2.2-Animate」をリリースし、全面オープンソース化しました！

最近、アリババクラウドは通義万相の新規な動作生成モデル「Wan2.2-Animate」のオープンソースを正式に発表しました。このモデルの登場により、動画コンテンツ制作、ダンステンプレート生成、アニメ制作などの分野で大きな利便性がもたらされます。ユーザーはGitHub、HuggingFace、魔搭コミュニティから簡単にモデルと関連コードをダウンロードでき、またアリババクラウドの百煉プラットフォームでAPIを呼び出したり、通義万相の公式サイトで直接このモデルの強力な機能を体験することもできます。

「Wan2.2-Animate」モデルは以前の「Animate Anyone」モデルを基盤として全面的なアップグレードを行った成果です。人物の一貫性や生成品質などにおいて大幅に向上しています。このモデルは主に2つの応用モードをサポートしています：動作模倣とキャラクター役割プレイ。動作模倣モードでは、ユーザーは1枚のキャラクター画像とリファレンス動画を入力するだけで、動画内のキャラクターの動作や表情をユーザーが提供した画像のキャラクターに移すことができ、キャラクターの動的な表現を実現します。一方、キャラクター役割プレイモードでは、元の動画の動作、表情、環境を保持した上で、動画内のキャラクターをユーザーが提供したキャラクターに置き換えることができます。

生成効果を向上させるために、通義万相チームは大規模な人物ビデオデータセットを構築し、話すこと、顔の表情、身体の動きなどの要素をカバーし、その後、通義万相図生ビデオモデルを使用してトレーニングを行いました。「Wan2.2-Animate」の設計により、キャラクター情報、環境情報、動作などが統一された形式に正規化され、両方の推論モードに互換性があります。身体の運動と顔の表情に対して、モデルはそれぞれ骨格信号と暗黙の特徴を用い、動作再方向化モジュールと組み合わせて、高精度な動作と表情の復刻を実現しています。さらに、完璧な照明効果を保証するために、チームは特別に独立した照明融合LoRAを開発しました。

実際の応用において、「Wan2.2-Animate」の性能も非常に目覚ましいものです。動画生成品質、主体の一貫性、知覚損失などの主要指標において、「Wan2.2-Animate」はStableAnimatorやLivePortraitなどの多くのオープンソースモデルを上回り、現在最もパフォーマンスの高い動作生成モデルとなっています。特に、ユーザーの主観評価においては、Runway Act-twoなどの非公開モデルをも上回る結果を示しています。

この新しいモデルのオープンソース化により、関連分野の発展が大きく促進され、クリエイターたちがより簡単に高品質な動的コンテンツを作成できるようになります。

ポイント：
🌟 ** 新モデルオープンソース **: アリババクラウドの「Wan2.2-Animate」モデルが正式にオープンソースとなり、ユーザーは複数のプラットフォームからダウンロードおよび体験できます。
🎭 ** 2つのモード **: 動作模倣とキャラクター役割プレイをサポートし、動的な表現力と置き換え能力を向上させます。
🚀 ** 性能優秀 **: 複数の主要指標において既存のオープンソースモデルを上回り、動作生成分野におけるトップモデルとなっています。

通義万相の新アクション生成モデルWan2.2-Animateが正式リリース

2025年9月19日、アリババクラウドは通義万相の新しいアクション生成モデルWan2.2-Animateを正式オープンソース化したことを発表しました。このモデルは人物やアニメキャラクターや動物の写真を駆動でき、短編動画制作、ダンステンプレート生成、アニメ制作などに広く応用されます。ユーザーはGitHub、HuggingFace、魔搭コミュニティからモデルとコードをダウンロードできます。また、アリババクラウド百煉プラットフォームでAPIを呼び出したり、通義万相の公式サイトで直接体験することも可能です。Wan2.2-Animate

スメードンドの未認可の百書を使用した AIの認可文設には戦ている

最近、マイクロソフトは多くの著名な作家から訴えを受けており、その中にはケイ・ボード、ジャック・トレントノ、ダニエル・オクレンツなどの氏が含まれる。彼らはニューヨーク連邦裁判所で、マイクロソフトが自身の作品の不正コピーされた電子書籍をAIモデル「メガトロン」の訓練に使用したことを指摘し、ユーザーのテキスト指示に応じて応答を生成するAIを作成したと主張している。この訴訟の核心的な争点は、AIの訓練過程において著作権を侵害しているかどうかである。

大反響！海螺AIが「主体参照」機能を発表　一枚の画像で映画級の動画制作が可能に

年末にかけて、中国の動画制作大手たちがしのぎを削っています！昨日、通義万相が漢字動画生成を初めて実現し、AIクリエイターたちを熱狂させました。そして今日、海螺AIは新たな「主体参照」機能を発表し、AI動画制作を新たなレベルへと引き上げました。ユーザーは画像を一枚アップロードするだけで、あらゆる登場人物を様々なシーンで自由に動かすことができ、高い再現性を保ちながら創造性を発揮できます。ソーシャルメディアでクリエイターたちが共有している作品を見れば、スパイダーマンがバイクで疾走したり、『ゲーム・オブ・スローンズ』のデナーリス・ターガリエンが森の中でオオカミの子と戯れたりするなど、その可能性の広がりが分かります。

通義万相2.1ビデオモデル、複雑な動作能力を大幅に向上

アリババ傘下の通義万相ビデオ生成モデルが先日、大幅なアップグレードを行い、新しい2.1バージョンをリリースしました。このバージョンは高速版とプロ版に分かれており、それぞれ効率的なパフォーマンスと優れた表現力に重点を置いており、AIビデオ生成に新たなブレイクスルーをもたらしました。今回のアップグレードで最も注目すべき点は、複雑な動き処理と現実の物理法則の再現における顕著な進歩であり、特にビデオの映画のような質感の向上と指示に従う能力の最適化において顕著です。新しいモデルにより、AIアート創作の可能性が大幅に向上し、ユーザーにより多くの創作空間を提供します。

阿里云通義万相、新しい画像編集モデルACEを発表　ワンクリックで画像編集を実現

今週、阿里云通義万相チームは新しい画像編集モデルACEを発表しました。ユーザーにより便利でスマートな画像生成と編集サービスを提供することを目的としています。ユーザーは簡単な口語的な指示だけで画像を生成または編集でき、画像編集の複雑さを大幅に簡素化します。このツールは、スタイル写真、分鏡制作、室内デザインなど、幅広い用途に対応しています。ACEモデルは、テキストから画像を生成する機能だけでなく、強力な画像編集機能も備えています。ユーザーは対話形式で制御可能なビジュアル編集や要素修正を行うことができます。

アリババクラウドが新世代の動作生成モデル「Wan2.2-Animate」をリリースし、全面オープンソース化しました！

関連推奨

通義万相の新アクション生成モデルWan2.2-Animateが正式リリース

スメードンドの未認可の百書を使用した AIの認可文設には戦ている

大反響！海螺AIが「主体参照」機能を発表 一枚の画像で映画級の動画制作が可能に

通義万相2.1ビデオモデル、複雑な動作能力を大幅に向上

阿里云通義万相、新しい画像編集モデルACEを発表 ワンクリックで画像編集を実現

大反響！海螺AIが「主体参照」機能を発表　一枚の画像で映画級の動画制作が可能に

阿里云通義万相、新しい画像編集モデルACEを発表　ワンクリックで画像編集を実現