新星の動画生成AI「Hailuo」:写真から鮮やかな動画へ、一貫性と高品質を実現
新しい動画生成AIサービス「Hailuo」(ハイルオ)が登場しました。このサービスは、静止画を短い動画に変換する「Image to Video」機能と、テキストプロンプトから動画を生成する「Text to Video」機能を提供しています。Hailuoは、既存のKLINGやViduに次ぐ3番目の動画生成AIサービスとなります。
KLINGやViduは、Image to Video以外にもさまざまな機能を追加していますが、Hailuoは現時点でText to VideoとImage to Videoのみを提供しています。しかし、実際に試してみると、日本人のキャラクターの一貫性はKLINGやViduに引けを取らない品質を保っています。生成された動画は720Pの25FPSで、ロゴが入ります。
Hailuoでは、20MBまでのJPEGやPNG形式の画像をアップロードでき、アスペクト比は2:5から5:2まで、短い方の辺が300ピクセル以上であれば利用可能です。ポートレートもサポートされているため、便利です。
例えば、FLUX.1 [dev] + LoRAで生成した画像をImage to Videoに変換すると、顔の向きを途中で変えても破綻せず、一貫性が保持されます。また、Runway Gen-3 Alpha TurboでのImage to Videoとの比較も行われています。
中国製のImage to Videoサービスは、アジア系のキャラクターの一貫性が高く、他のサービスではRunwayが及第点となっています。動きを最小限に抑えることで、誤魔化すことが必要ですが、Hailuoはその点で優れています。
実際の写真でも試してみました。母子の写真をHailuoで動かした結果、どちらも自然な動きを再現できました。特に、赤ちゃんの動きも上手く再現できており、MiniMax hailuo AIというロゴがなければ、本物の動画と見間違うほどです。
最後に、Sunoで作成した楽曲をBGMに、5本のHailuo動画(Image to Video)をまとめた動画も作成しました。現段階では、生成できる動画の数に制限は設けられていないようですが、商用利用やログの削除を考慮すると、有料サービスの提供が期待されます。基本性能は非常に高く、今後、Last Frameやモーションブラシ、カメラワークなどの機能追加が予定されているため、今後の展開が楽しみです。