前回は童話「ミミの恩返し」も暫定版をYouTubeにアップしたところまで書いたが、確定申告などでしばらくこのBLOGを更新できなかった。
なお、前回アップした動画は暫定版と言う事で、状況説明のナレーションやBGMなどの音声関連も未設定でサイレントの状態。
そこで、今回はなんとか完成版まで持って行こうと思い、再度、暇を見てはぼつぼつと取り掛かっている。
まずはBGM。
BGMの作製を無料の音楽生成AIにお願いしようと思って色々と試してみたが、無料とうたっているにもかかわらず、いざ出来上がったデータを自分のパソコンに取り込もうとすると、この段階で課金されるものが多い。

あまりたくさんのツールを使ったので、どのツールで生成した音楽データをダウンロードしたか分からなくなってしまったが、多分、'udio'と言う音楽生成AIだったと思う。
とにかく、生成されたBGMのデータを無料でダウンロードできるツールを使った。

udio

「少年少女と1匹のウサギが登場する童話の動画用BGMを生成してください(Generate background music for a video of a fairy tale featuring a boy, a girl, and a rabbit.)」とプロンプトに入力するだけでBGMを作ってくれる。
ただし、この時、日本語で入力するよりも、英語で入力した方がよりこちらの意図がより反映されやすいので、ここも無料の翻訳ツール'DeepL'を使って日本語を英語に翻訳。

すると・・・瞬時にBGMが出来上がった。

次はナレーション。

物語の進行に合わせた状況説明と、それぞれのシーンに登場して来る人物(ウサギを含む)の会話のセリフを音声データとして作製し、これ等をパソコンに取り込まなければならない。
「アフレコ」と言って、動画を見ながら自分でナレーションを追加すると言う手もあるが、これだと、音声が自分の声だけになってしまって色気が無く、物語にそぐわない。

そこで使用したのが「音読さん」と言う読み上げツール。

ondoku

文章を打ち込むと、その文章を読み上げてくれて、読み上げた音声データを自分のパソコンに取り込む事ができると言う優れもの。

読み上げる時の声も男女何人かを選択でき、音の高さを調整することにより、大人っぽくも子供っぽくもできる。
が・・・イントネーションが「???」。

「音読さん」はただの読み上げツールでAIではないので、前後の文脈から語尾を上げるとか下げるとか、あるいはこの単語のイントネーションはここにアクセントが来るとかの判断はほぼ無いに等しい。
ただ、だらだらと読み上げるだけなのだ、その点に不満が残る。

とは言え、もう面倒になってきたので、無料と言う事で今回はこれで我慢。

ようやく音声データが揃ったので、改めて複数枚の静止画を連結して動画にし、BGMやナレーションを挿入して再度動画を編集しなければならない。

正直なところ、画像や音声データなどの部品を作るための手間は、AIに任せれば瞬時なのだが、画像編集に関してはまだ自動化はされていない。
そして、これが最も時間を要する作業。

プロンプトを入力して動画を作成するAIツールもたくさん世に出てきたが、それはあくまでも単体の動画を生成してくれるだけで、何篇もの動画をつなげてストーリー性のある長編動画を自動で生成してくれる動画作成AIにはまだお目にかかったことが無い。

暫定版は登場人物のセリフを画像に記入してしまってあったので、それをすべて消去して新たに静止画像を作成。
そして、動画編集時に画像に合わせてテロップと音声を挿入しなければならないので、これからが最も面倒な作業。

ここが自動化できると、動画編集者は楽をするだろうね。

私はプロの動画編集者ではないので、動画編集ソフトも無料版を使わせてもらっている。
'ShotCut'と言う無料ながらそこそこの機能を持った動画編集ソフトがあって、これで動画の変種をしているが、'ShotCut'の機能さえも使いきれていないので、まだ有料版の高機能ソフトなど必要ない。

一般の人には無縁な少し専門的な言葉や説明が多く、分かりにくかったかもしれないが、「動画を作製すると言う事はかなり手間がかかる」と言う事を分かっていただければありがたい。

僅か15秒や30秒のテレビのCMなども全て、撮影された動画や静止画を切り張りして音声データを追加し、動画編集ソフトで作製されている。
いくら素人造りの簡単な動画とは言え、工程はこれ等とほとんど変わらない。