SadTalkerという技術を用いることで、たった1枚の画像と音声データから、ここで紹介するような動画が簡単に作成できます。
今回は実際にやってみた結果の掲載になります。

※SadTalkerの使い方については、様々なブログに掲載されておりますので、ここではご紹介しません。

SadTalkerとは？

SadTalkertとは、音声データに合わせ、顔（頭）の角度や、表情を自動的に変化させた動画を生成できる技術です。
詳細は、ココに記載があります。

作成してみた難易度は？

めちゃくちゃ簡単でした。特に説明は不要だと思います。
Stable Diffusion WebUIの拡張機能も公開されているようです。

まず、話をさせたい画像を用意します。
私は、オリジナルモデルの「エリカ」の最高の1枚を用意しました。

上記画像から顔部分を正方形になるように、トリムします。とても可愛いです。

音声データを用意します。今回は「VOICEVOX」を利用しました。
その中でも「九州そら」さんのセクシーボイスを利用させていただきました。

これらを準備したら、あとは生成するのみです。

学習したモデルで実際に生成してみた結果

以下の投稿の動画が生成結果です。
いかがでしょうか？多少の違和感はありますが、たった1枚の画像と音声から、このレベルの動画ができるなんて感動しませんか？

OLエリカのご挨拶。
Greetings from OL Erika.#AIart #AIグラビア #AI美女 #AIgirl #AIphoto #AIArtworks #AI動画 #Erika

VOICEVOX:九州そら pic.twitter.com/sJpKPT4Xzx
— あらぶるま araburuma (@suan_mian) November 14, 2023

上記投稿以外にも、同じ音声で他に3つの動画を生成していますので、ここで公開させていただきます。

色々な使い方ができますね…

最後までご覧いただき、ありがとうございました。

フェチのためのブログ

著者SNS

Twitter / Instagram /

Twitterでは以下のようなAI写真を投稿しています。興味がございましたらご覧ください。

月	火	水	木	金	土	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30	31

SadTalkerでAI美女に好きな言葉を話してもらう

目次

SadTalkerとは？

作成してみた難易度は？

学習したモデルで実際に生成してみた結果

フェチのためのブログ

フェチのためのブログ