1枚の画像からAIが動画を生成する、ランウェイ(Runway)社のサービス「Gen-2」が大きな話題になっている。
実際に自分でも見て、
ほんとにこれが合成なのかと思ってしまうくらいリアル。
これから映画も実写なのか、AIなのか分からなくなるのでは?とこんなの見せられると思ってしまう。
ランウェイは2018年創業のスタートアップ。
もともとStability AIと共同で開発を進めてみてらしいけど、現在は完全に独自のサービスを展開している。
今年6月には、Google、NVIDIA、セールスフォースなどから1億4100万ドル(約200億円)
の資金調達を受けるなど、生成AI企業のなかでも大きく注目を浴びています。
ほんとに進化している。
その証拠がこれだ。
1枚の画像を放り込み、2分ほどでこれくらいの動画が出てくるというのは驚き。
ほんとにすごい。
画像から動画を生成する「image to video」が追加された。
1コマ目の画像を指定できるようになり、狙った場面を作り出しやすくなった。
ただ現時点では、プロンプトを追加すると画像がほとんど無視される結果になってしまうので、
画像からどんな動画が生み出されるかはランダムに近い状態です。
それでも非常に品質の高く動きのあるショートクリップが作れるということで話題となっているという。
Gen-2が得意なのは、顔のアップや、波のような自然物。
奥行きを推定し、どのように動かすのか決めているのではないだろうか。
それと学習データにもよるのでしょうが、実写的なものの方が適正に動画が出る可能性が高い。
アニメ系の絵柄は得意ではなく、顔がつぶれてしまいがち。
3Dアバター(VRMデータ)画像では、別の顔になったりと、あまりうまく出ない傾向が高かった。
ただし浮世絵風の絵のように、鑑賞に耐えうる動画が出ることもあるのであなどれない。
Gen-2は、アカウントを作成すると20回まではお試しで生成可能です。
そこからは有料となり、月額15ドル(約2000円)のベーシックプランでは月50回生成できます。
さらに10ドル追加で50回の生成が追加可能という。
いま、AIによる動画生成はホットな分野です。
ランウェイは今年2月、動画生成に関する論文を発表しているけど、
ビデオクリップで独自に訓練した「モーション・モデリング・モジュール」という仕組みによって、首尾一貫した動画を生成可能にするという。
それがこれだ。↓↓↓
本物の可愛いらしい女性がいるのかと思うくらいリアルな画像。
そんななか、生成AI企業はクラウド型のサービスに力を入れはじめています。
個人向けのパソコンでは難しい動画生成などの環境を提供することで、
サブスクリプションモデルなどに移行してもらい、安定的な収益を生み出したいと考えているようだ。
たとえば、「スマホで写真を撮ってクラウドに放り込めば動画にして戻してくれる。
そして、それをそのままSNSに投稿する」といったサービスとして広がっていくことも考えられるという。
収益化できるなら、普通に搭載するサービスはどんどん出てくるはずです。
Gen-2以外にも、動画関連のAIサービスが次々に登場しつつあるという。
たとえば、実写映像を3DモデルにしてCGに置き換えるサービス「Wonder Studio」。
プロ向けに数十秒から数分程度の利用を想定していて、性能の拡充に力を入れてきてるというからすごい。
進化はどんどんすすんでいるのだ。
ここまでくると、AI生成による動画は良くも悪くも話題になってくると思われる。
また、大手がこの流れを放っておくわけもない。
問題は、どのくらいの速度でそうした変化が起きてくるか。
生成AIに触れた人なら恐らく、「予想よりも半年から1年早い」という感覚を持っているのではないだろうか。
すべてAI生成動画で作られた映画の登場も、そう遠くないと思う。
それだけリアルだし、映像技術も限りなく発展していく気がする。
コメント欄