界隈では「nano banana」が話題沸騰中ですが。
XでGoogle AI Studioの実用的でおもしろい使い方を発見!!
📌Google AI Studioでナレーション作成方法(無料)
— ぽんず🐕 AIクリエイター (@ponzponz15) August 26, 2025
① 動画をGoogle AI Studioにアップロード
② ナレーション作成
③ Generate Media → Generate Speech をクリック
⑤ スタイル・声・人数設定してG pic.twitter.com/f6DtjUox3M
これは9月にスタートするWordPress講座の解説動画にも応用できるのでは?と思いやってみたら、これがおもしろいほどうまくいきまして。
あ、これは私の投稿です(笑)↓
あら!ぽんずさん、これやばいです😳
— さと|在宅パラレルワーカー (@sato_zaitaku) August 28, 2025
画面を録画した解説動画も問題なくいけました!
ちゃんと、動画内のテキストを読み取ってます😆
一応、動画分析の際に、WordPressのこれこれこういうプラグインの解説動画だよ~とはヒント出したけど。
Filmoraで編集は必要だとしても、これは楽しすぎる😂 https://t.co/Myhgu7GGfa pic.twitter.com/VP4Rcpv9Gg
さすがにポン出しで、チョチョイのチョイとはいきませんが、それでもかなり使い勝手がよく、時間短縮になったので、今回はその方法と手順を解説していきます。
今回3分弱の動画でしたが、30分もかからずに制作できました(え?遅い?)。慣れれば15分くらいでいけそうです。
流れは以下。
- 画面録画撮影(Filmora使用)
- Google AI Studioで動画を分析してナレーションを出力
- 内容をチェック(必要であれば修正)
- Gemini Speech Generationでテキストから音声ファイルを生成
- 動画を編集
- 完成
それでは、詳しくみていきましょう!
Google AI Studioに動画を分析してもらう
Google AI Studioにアクセスします。
Googleのアカウント作成は飛ばしますね。


右上のモデル選択で「Gemini 2.5 Pro」を選びます。


ナレーションをつけたい(分析したい)動画を放り込んで、「ナレーションを出力して」とお願いしましょう。


今回は念のため、AIにどんな動画なのかを簡単に伝えたうえで、分析してもらいました。


【Run】をクリックして、少し待つとナレーションが出力されます。すごくないですか??


これ、私が動画内で話している内容を文字起こししている、とかじゃないんですよ?画面を録画しただけの動画からナレーションを生成しています。
ちなみに、分析してもらった元動画はこれ↓
しかも、ちゃんと補足もされているという徹底ぶり。
とはいえ、多少直したい部分があったので、ペンのアイコン(Edit)をクリックしてテキストを修正。


清書したテキストはこのあと使うので、コピーしておきましょう。
TTSでナレーションの音声ファイルを作成する
TTS(Text To Speech) とは、「テキストを音声に変換する技術」のことです。
つまり、入力した文字をコンピュータが読み上げてくれる仕組みです。
具体的なイメージ
- スマホでニュース記事を音声で読み上げてくれる機能
- カーナビが「次の交差点を右です」と案内してくれる声
- YouTubeやTikTokのナレーションを自動で生成する音声
テキストのコピーができたら、左メニューの【Generate media】を選択します。


そうすると、以下の画面になるので【Gemini speech generation】を選択。


【Text】の部分にコピーしておいたテキストをペーストします。


【Mode】は「Single-Speaker」と「Multi-Speaker」があるんですけど、今回は解説動画なので「Single-Speaker」を選びました。ラジオ番組みたいに、掛け合いにしたい場合は「Multi-Speaker」を選びます。
声の種類をプルダウンから選びます。


話しのピッチ(スピード)がそれぞれ違うので、いろいろ聴いてみてくださいね。
そして今回は使いませんでしたが【Style Instructions】にどんな話し方にしたいかを指示できます。


感情やトーンの指定
「whisper」「gentle」「excited」「sternly」「laughing」など自然な語り口で感情を指示できます。
- “Speak in a gentle, comforting tone.”
これは「ささやくように」「やさしく」といったニュアンスを加えるのにぴったりです。
発話スタイルの調整
「pace」「pronunciation」「accent」などで話し方やリズムをコントロールできます。
- “Read slowly and clearly, with deliberate pacing.”
言葉をはっきり伝えたい動画やチュートリアルコンテンツなどに有効です。
いろいろ試してみると面白いですよ!
声を選んだら【Run】をクリックして、ナレーションを生成しましょう!


しばらくすると、音声ファイルが生成されて勝手に再生されます。


確認して問題なければ、音声ファイルをダウンロード。
生成された音声ファイルがこちら↓
動画編集ソフトで編集して完成


あとは、動画と生成した音声ファイルを使って動画編集ソフトで編集します。
私はFilmoraを使っています。
細かい編集に関しては割愛しますが、動画と音声をあわせるために、私はところどころでスナップショットを差し込んで調整しました。


以下の画像で紫色の部分がスナップショットを差し込んだ部分です。音声もカットしたりして微調整。


赤枠は、あとから音声を追加したところです。足りないな、と思ったので補足をいれました。
実はこのときに、どの声を使ったのかメモしていなかったので探すのにちょっと時間がかかってしまいました(苦笑)そして、選択した声が違っていたのか、完成した動画はこの部分だけ違和感がありました。
まあ、でも許容範囲です。
調整が終わったら、テロップをつけていきます。これまた簡単。
すべてのオーディオを選択したら、


「自動文字起こし」でテロップを一気に生成!設定はデフォルトのままです。


生成にはクレジットを消費するけど、これは課金して損はないと思っています。今回の講座用解説動画作成でめちゃくちゃ使いました。
どんどん生成されていく~。3分くらいですかね。


できました~!水色の帯がテロップです。


あとはこれを見やすいように調整していきます。


音声をAIで生成しているので、発音がクリアなためか認識もほぼ完璧でした。えー、とか、あーとかもないし、言い間違いもない(当然だけど)のでめちゃくちゃ楽です!
で、完成した動画がこちら!
参考までに、Filmoraでナレーションをつけたバージョンもおいておきますね。
Filmoraバージョン
ナレーションの内容が違うっていうのもありますが、冒頭を聴き比べるだけでも、Google AI Studioの「Gemini Speech Generation」がいかに優秀かわかります!
というわけで、Google AI Studioで講座用の解説動画を爆速でつくる方法を解説しました。
今回は画面録画をした動画でナレーションを生成しましたが、どんな動画でも放り込んで分析してもらえば、勝手にナレーションをつけてくれます。
今度は自分の声で音声を生成してみたいなあ!
Xでは、在宅ワークやブログのこと、AI画像、AI動画、AI音楽についてもポストしています。同じょうな方がいましたら、つながってもらえるとうれしいです!