Google AI Studioで講座用の解説動画を爆速でつくる方法

界隈では「nano banana」が話題沸騰中ですが。

XでGoogle AI Studioの実用的でおもしろい使い方を発見!!

これは9月にスタートするWordPress講座の解説動画にも応用できるのでは?と思いやってみたら、これがおもしろいほどうまくいきまして。

あ、これは私の投稿です(笑)↓

さすがにポン出しで、チョチョイのチョイとはいきませんが、それでもかなり使い勝手がよく、時間短縮になったので、今回はその方法と手順を解説していきます。

今回3分弱の動画でしたが、30分もかからずに制作できました(え?遅い?)。慣れれば15分くらいでいけそうです。

流れは以下。

  • 画面録画撮影(Filmora使用)
  • Google AI Studioで動画を分析してナレーションを出力
  • 内容をチェック(必要であれば修正)
  • Gemini Speech Generationでテキストから音声ファイルを生成
  • 動画を編集
  • 完成

それでは、詳しくみていきましょう!

クリックで飛べる目次

Google AI Studioに動画を分析してもらう

Google AI Studioにアクセスします。

Googleのアカウント作成は飛ばしますね。

Google AI Studioで講座用の解説動画を爆速でつくる方法

右上のモデル選択で「Gemini 2.5 Pro」を選びます。

Google AI Studioで講座用の解説動画を爆速でつくる方法

デフォルトの「Gemini 2.5 Flash image Previw」だと動画がアップロードできませんでした。

ナレーションをつけたい(分析したい)動画を放り込んで、「ナレーションを出力して」とお願いしましょう。

Google AI Studioで講座用の解説動画を爆速でつくる方法

今回は念のため、AIにどんな動画なのかを簡単に伝えたうえで、分析してもらいました。

Google AI Studioで講座用の解説動画を爆速でつくる方法

【Run】をクリックして、少し待つとナレーションが出力されます。すごくないですか??

Google AI Studioで講座用の解説動画を爆速でつくる方法

これ、私が動画内で話している内容を文字起こししている、とかじゃないんですよ?画面を録画しただけの動画からナレーションを生成しています。

ちなみに、分析してもらった元動画はこれ↓

しかも、ちゃんと補足もされているという徹底ぶり。

とはいえ、多少直したい部分があったので、ペンのアイコン(Edit)をクリックしてテキストを修正。

清書したテキストはこのあと使うので、コピーしておきましょう。

TTSでナレーションの音声ファイルを作成する

TTSとは?

TTS(Text To Speech) とは、「テキストを音声に変換する技術」のことです。
つまり、入力した文字をコンピュータが読み上げてくれる仕組みです。

具体的なイメージ

  • スマホでニュース記事を音声で読み上げてくれる機能
  • カーナビが「次の交差点を右です」と案内してくれる声
  • YouTubeやTikTokのナレーションを自動で生成する音声

テキストのコピーができたら、左メニューの【Generate media】を選択します。

Google AI Studioで講座用の解説動画を爆速でつくる方法

そうすると、以下の画面になるので【Gemini speech generation】を選択。

Google AI StudioのGemini speech generation画面

【Text】の部分にコピーしておいたテキストをペーストします。

Google AI Studioで講座用の解説動画を爆速でつくる方法

【Mode】は「Single-Speaker」と「Multi-Speaker」があるんですけど、今回は解説動画なので「Single-Speaker」を選びました。ラジオ番組みたいに、掛け合いにしたい場合は「Multi-Speaker」を選びます。

声の種類をプルダウンから選びます。

話しのピッチ(スピード)がそれぞれ違うので、いろいろ聴いてみてくださいね。

あとで、音声の追加をすること考えて、どの音声を使ったか、メモしておくことをおすすめします。

そして今回は使いませんでしたが【Style Instructions】にどんな話し方にしたいかを指示できます。

感情やトーンの指定

「whisper」「gentle」「excited」「sternly」「laughing」など自然な語り口で感情を指示できます。

  • “Speak in a gentle, comforting tone.”

これは「ささやくように」「やさしく」といったニュアンスを加えるのにぴったりです。

発話スタイルの調整

「pace」「pronunciation」「accent」などで話し方やリズムをコントロールできます。

  • “Read slowly and clearly, with deliberate pacing.”

言葉をはっきり伝えたい動画やチュートリアルコンテンツなどに有効です。

いろいろ試してみると面白いですよ!

声を選んだら【Run】をクリックして、ナレーションを生成しましょう!

しばらくすると、音声ファイルが生成されて勝手に再生されます。

確認して問題なければ、音声ファイルをダウンロード。

生成された音声ファイルがこちら↓

動画編集ソフトで編集して完成

Filmoraの編集画面

あとは、動画と生成した音声ファイルを使って動画編集ソフトで編集します。

私はFilmoraを使っています。

細かい編集に関しては割愛しますが、動画と音声をあわせるために、私はところどころでスナップショットを差し込んで調整しました。

以下の画像で紫色の部分がスナップショットを差し込んだ部分です。音声もカットしたりして微調整。

Filmoraの編集画面

赤枠は、あとから音声を追加したところです。足りないな、と思ったので補足をいれました。

実はこのときに、どの声を使ったのかメモしていなかったので探すのにちょっと時間がかかってしまいました(苦笑)そして、選択した声が違っていたのか、完成した動画はこの部分だけ違和感がありました。

まあ、でも許容範囲です。

調整が終わったら、テロップをつけていきます。これまた簡単。

すべてのオーディオを選択したら、

Filmoraの編集画面

「自動文字起こし」でテロップを一気に生成!設定はデフォルトのままです。

Filmoraの自動文字起こし

生成にはクレジットを消費するけど、これは課金して損はないと思っています。今回の講座用解説動画作成でめちゃくちゃ使いました。

どんどん生成されていく~。3分くらいですかね。

Filmoraの自動文字起こし

できました~!水色の帯がテロップです。

あとはこれを見やすいように調整していきます。

音声をAIで生成しているので、発音がクリアなためか認識もほぼ完璧でした。えー、とか、あーとかもないし、言い間違いもない(当然だけど)のでめちゃくちゃ楽です!

で、完成した動画がこちら!

参考までに、Filmoraでナレーションをつけたバージョンもおいておきますね。

Filmoraバージョン

ナレーションの内容が違うっていうのもありますが、冒頭を聴き比べるだけでも、Google AI Studioの「Gemini Speech Generation」がいかに優秀かわかります!

というわけで、Google AI Studioで講座用の解説動画を爆速でつくる方法を解説しました。

今回は画面録画をした動画でナレーションを生成しましたが、どんな動画でも放り込んで分析してもらえば、勝手にナレーションをつけてくれます。

今度は自分の声で音声を生成してみたいなあ!

Xでは、在宅ワークやブログのこと、AI画像、AI動画、AI音楽についてもポストしています。同じょうな方がいましたら、つながってもらえるとうれしいです!

この記事を書いた人

好き”も”仕事にしている3社掛け持ちの在宅パラレルワーカー。ブログ歴・在宅ワーク歴10年の猛者。多趣味で凝り性。無類の音楽好き。

クリックで飛べる目次