そんな疑問を解消するためにこの記事では、テキストを読み上げるソフトでどれがいいのか?を書いていきます。
- テキストの音声読み上げにはどのソフトを使えばいいのか?
- 読み上げソフト20個の紹介
テキストを読み上げて動画に組み込みたかったり、何かを読み上げさせたいときには参考にしてみてください。テキストを読み上げてくれるソフトはたくさんあるけど、クオリティにはばらつきがあります。良い感じのものを選んでみるといいでしょう。
結論:テキストの音声読み上げのおすすめソフトは?
この記事ではいくつかのソフトを試しているんだけど、結構な量になってしまったので使ってみて良かったものを先に書いておきます。
- CoeFont
- VOICEBOX
- VOICEROID(有料ソフト)
無料で使うならCoeFontかVOICEBOXが良いと思います。有料ソフトは有料なだけあってクオリティ高いですね。VOICEROIDいろんなキャラクターの声あって可愛らしいです。
一番良いのはやっぱり人間に読んでもらうこと
この記事ではいろんな読み上げソフトを試した結果を載せているけど、結局一番良いのは人間に読んでもらうことです。もし動画なんかでクオリティの高い読み上げが欲しいならココナラで人にやってもらうといいと思います。いろんな募集がありますからね。人間には勝てん。。
- フリー声優が声のお仕事承ります
- Youtube動画のナレーション録音します
- ナレーション、読み上げします
- ・・・
Mac・Windowsの音声読み上げ機能を使う
なかなかMacやWindowsで最初から使える音声読み上げ機能を使うことはないだろうけど、メモなんかにテキストを入力してそれを読み上げてもらうことができる。
Macの音声読み上げ
Macでメモ帳を開いたら何かテキストを書いて音声読み上げをしてみよう。[編集→スピーチ→読み上げを開始]するとそのテキストを読み上げてくれる。
これで読み上げた音声を聞いてみるとやっぱり機械的な音声ですね。まあ標準で備わっている読み上げだとこんなもんかというところ。Windowsでも試してみよう。
Windowsの音声読み上げ
Windowsでもメモ帳に書いたものを読み上げてみる。使ったことのある人は少ないだろうけど、Windowsにはナレーターっていうテキストを音声で読み上げてくれる機能がある。Windows ロゴ キー を押しながら、Ctrl キーと Enter キーを押すと起動/停止を行える。ちょっと使いづらいけど、それでこのテキストを読み上げてみるとこんな感じ。
まあやっぱり機械的な音声だ、予想通りといったところ。ちなみにナレーターは画面を操作するといろんな自分が行っていることを音声で説明してくれるよ。気になったらMicrosoftのナレーターでテキストを読み上げるを見てみるといいかもしれない。
Webでブラウザから使える音声読み上げサービス
ゆくも
ブラウザ上でテキストを入力して、声質を選択するだけ。再生ボタンを押すと、音声が流れてくる。試してみたけど、やっぱりダメですね。完全に機械です。
CMAN
CMANの画面はこんな感じで読み上げて欲しいテキストを入力して性別や音質を選択することができる。
テキストを入力して、音質や声質などを選んで見よう。選ぶ項目が多くて期待できそうだが、どうだろうか。うーん、ダメですね。UIの感じからなんとなくそんな感じはしていました。
Text-to-MP3
Text-to-MP3は日本語に限らず(というよりほかの言語がメインだろう)いろんな言語を入力して音声読み上げしてくれるサイト。
言語の種類がたくさんありますね。桃太郎をここでも入力して読み上げてみるとこんな感じ。
結構良くないですかね。音声のスピードなんかは変えることができないの?って思うけど、これはタグをテキストと一緒に書くことで変更することができる。
いろいろ英語で書かれていますね。最後の方にAmazon Pollyって書かれているからAmazon Pollyが使われているのかもしれない。Amazon Pollyは後で紹介するね。
ちょっとだけタグを追加してみて音声を作ってみるとこうなる。
むかしむかし、あるところに、おじいさんとおばあさんが住んでいました。おじいさんは山へしばかりに、おばあさんは川へせんたくに行きました。おばあさんが川でせんたくをしていると、ドンブラコ、ドンブラコと、大きな桃が流れてきました。
</prosody></prosody>
スピードとピッチをちょっといじってみたけど、悪くないですね。ちなみにInput limit: 3,000 charactersって書かれているから3000文字までのテキストなら読み上げてくれるようだね。
七声ニーナ
ちょっとテキスト入力とは違うけど、こういうのも紹介しておきます。七声ニーナはマイクに自分の声を発すると、それを七声ニーナの声に変換してくれるというもの。七声ニーナって誰だよって感じだけど、こんな感じのキャラクターだ。
音声を変換してもらうには、サイトを開いてRECボタンを押して喋ればいいだけです。そうすれば声を変換してくれる。
結構面白いからサイトから喋ってみてもいいかもしれないぞ。
CoeFontStudio(CoeFont)
CoeFontStudio(CoeFont)はテキストを入力すると良い感じに読み上げてくれるサービス。キャラクターは数人選ぶことができて、そのキャラクターの音声で喋らせることができる。
読みやアクセント・スピード・声の高さも調整することができるね。二人の対話形式の音声を作ることもできる。
Voiced by https://CoeFont.studio
声のクオリティ高くて良いですよね、無料でこれは凄い。作った声を使う場合には利用規約を見ておきましょう。
ソフトをダウンロードして使える音声読み上げ
次はソフトをダウンロードして使うことのできる音声を読み上げてくれるやつ。ちょっとダウンロードするのは面倒だけど、日常的に使うならこういうソフトを使うのもありでしょう。ただWindows対応のみのものばかり。Macユーザーは諦めるしかないのか・・・
棒読みちゃん
棒読みちゃんは404FightNotFoundからダウンロードすることのできる。動作環境は以下のよう。
- Microsoft Windows 2000以上(7の64bit版のみ確認)
- Microsoft .NET Framework 2.0以上(3.5のみ確認)
今回はWindowsパソコンでダウンロードして試してみる。ダウンロードしてアプリケーションを開いたらこんな感じ。テキストを入力して読み上げるんだけど、音量や速度なんかも調整できるね。
音声ファイルはボタンを押すことで保存することもできるのがいいね。
桃太郎を入力してやってみたけど、こんな感じの音声になった。
これは女性の音声でやったけど、声質も選ぶことができますね。女性・男性・中性・ロボット・機械っていうのがある。
ちなみに機械1で試してみるとこんな感じだね。
それと棒読みちゃんとコメントビューアーを組み合わせてコメントを読み上げる配信者の方なんかもいるでしょうか。外部サイトですが、ツイキャスやYoutubeLiveなどコメントを読ませる方法が書いてあったりするので、そういうのをしたい方は参考にしてみてもいいかもしれない。
テキストーク
テキストークはその名の通りテキストを読み上げてくれるソフト。動作OSが記事執筆時点でWindows 10/8/7/VistaということでWindowsユーザーなら大体使えるでしょう。テキストークからダウンロードすることができるよ。アプリケーションを開いてみるとこんな感じでシンプルでわかりやすい。
今回も桃太郎で試してみるとこんな感じですね。
声質はいくつかあって男性・女性を選ぶことができる。英語の人の声もあるようですね。
Microsoft Haruka Desktopで試しにやってみるとこんな感じ。
まずまずといったところですかね。使い方が簡単で使いやすいのがテキストーくの良いところですね。気になったら他の声質も試してみてください。
ソフトーク
ソフトークはフリーソフト100からダウンロードすることができる。ほかのソフトと同じように読み上げてほしいテキストを入力して再生することができる。赤いボタンで保存することができるんだけど、ボタンを押すとテキストを読み上げて保存してくれる。
テキストを入力して読み上げてもらうとこんな感じ。
ソフトークは声質の他にプリセットなんかも用意してくれていますね。声の種類もたくさんあるのがソフトークの良いところ。用意されている声は他のソフトと比べると多い方なんじゃないかな。
プリセットを初期設定からロボットとかに変更してみるとこんな感じに。
悪くないですね。プリセットも声の種類もたくさんあるから、いろいろ試してみるといいですね。
Balabolka
Balabolkaは何やらボタンがいっぱいあって機能が多そうな感じがしますね。結構ボタンがあるから、多機能なものが良いっていう人には良さそう。スピード・音量・声質なんかは他のソフトと同じように変更することができますね。ピッチを変えることで声の感じが変わったりするから変更できるのは良いね。
ただ初期で選べる声はちょっと少ないですね。
ちなみに桃太郎の音声を作ってみるとこんな感じになった。
ちょっとBalabolka機能が多そうなので、使ってみたい!っていう人はBalabolkaの評価・使い方 - フリーソフト100を見てみるといいと思います。どんな使い方をすることができるのかがざっと分かるんじゃないかな。このソフトはピッチを変えることができるのがいいですね。これを変えると読み上げる感じが変わっていくから声をちょっと変えたいなあ・・・なんて時にはいじってみるといいです。
Text To Wav
Text To Wavを開いてみるとこんな画面。どうやらこのソフトも結構機能があるようですね。[自動で音声を切りける][二つの音声エンジンを使って変換][SAP]とかいろいろあるけど、ぶっちゃけ分かりません。きっと音声に詳しい人ならわかるのでしょう。何となくいろいろできそうなのは分かる。
普通に入力した音声を読み上げて保存してみるとこんな感じの音声。
ちなみに保存のやり方最初ちょっとわかんなかったけど、左端にあるファイルっていうところから保存先なんかを変更することができる。
赤いボタンを押すと保存できるけど、保存したら保存先にファイルができるはず。選択できる音声はいくつかって、速度や音量の調整が可能。
音声1と音声2があるのは、対話形式で会話させたりっていうことができるのかな。うーん使い方難しそうですね。いろいろやりたい人にはいいのかもしれない。Text To Wav ☆の詳細情報 : Vector ソフトを探す!からダウンロードすることが可能。
VOICEVOX
VOICEBOXはアプリケーションをダウンロードして使うことのできる音声合成ソフト。何人かキャラクターがいてそのキャラクターの声で喋らせることができる。キャラクターの一人である四国めたんに喋らせてみるとこんな感じ。
音声を聞いてみればわかると思うけどかなりクオリティ高くないでしょうか。他のキャラクターでも試してみるとこんな感じです。
やはりクオリティ高いですね。テキスト入力して喋らせるだけでそれなりの音声になってくれるからなかなか良いですよ。
APIから使える音声読み上げサービス
ダウンロードしたソフトやWebから使えるテキスト読み上げのものもあるけど、APIとして使ったりっていうことも場合によってはありますよね。そんな時にはGoogleのGCPにあるText-to-SpeechやAmazonのAWSにあるAmazonPollyなんかを使ってみるのはどうだろう。(タイトルに無料とか書いたけど、GCPとかAWSは従量制だよね、まあ許してくれ・・・)
Text-To-Speech
まあテキストを読み上げてくれるものなんだけど、どんなものかを知りたい場合はGCPのText-to-Speechにデモがあるからそこで読み上げてほしいテキストを入力して試してみるといいかと思います。
ちなみにほかの記事で音声を軽く作ってみたりしたから、ちょっとした使い方が知りたかったら見てみると参考になるかもしれない。
↑で軽くやってみた音声はこんな感じ。まあまあといったところですかね。
それと料金に関してだけど、料金を詳しくは覗いてみるといいでしょう。そこまでかからない印象。
Text-to-Speech の料金は、音声への合成のためにサービスに送信された文字数に基づいて、月単位で請求されます。WaveNet 音声の最初の 100 万文字は、毎月無料です。標準(WaveNet 以外の)音声では、最初の 400 万文字が毎月無料です。Text-to-Speech は無料枠以降 100 万文字ごとに課金されます。
Amazon Polly
GCPときたら次はAmazonのAWSですよね。AWSのアカウントでログインすればテキストを入力して音声を読み上げさせることができる。
Amazon Pollyを使って音声を作成するっていうことはこっちの記事で書いたんだけど、その時作った音声がこんな感じ。
まあ悪くないかなといったところ。ちなみにText-To-SpeechとAmazon Pollyでテキストを作成するっていう動画もあったりするから、何となくその使い方と精度が分かるんじゃないだろうか。動画内ではアプリのコエステーションについてもあるよ。
アプリ
コエステーション
コエステーションっていう自分の声を学習させて、テキストを入力すると自分に似た声でそれを喋ってくれるアプリがある。
だけど商用利用はできないから、商用利用する場合は残念。
これ使ってみるとどんどん自分の声に似てきて結構すごいです。スマホアプリでこういうことができてしまうのはちょっと怖いけど面白い。
有料の音声合成ソフト
CEVIO
これはWindows専用みたい。動画があったので、ちょっと見てみることにする。
声はやはり機械感は拭えないけど、無料のものよりかなり良いですね。感情表現や声質設定等も細かくできるようなので、結構良さそう。Windowsだったら試してみるのあり。
CEVIOにサンプルの音声が載っているから気になったら聞いてみるといいですよ。
AITalk
AIと名のつく音声合成ソフト。ちょっと期待しても良いのだろうか。デモがあったので試してみます。
いろんなキャラクラーがいて、感情表現に対応している者もいますね。速度やピッチ等も変えることができるようです。
使ってみると・・・これはなかなかやりますね。無料のものと比べると格が違いますわ。特に感情表現対応のキャラクターでテキストを読み上げると、そのクオリティの高さに驚きます。機械感はまだあるけど、かなり人間に近い音声。
作成した音声を公開する際には利用方法を見ておくといいですよ。
VOICEROID
VOICEROIDはいろんなキャラクターがいて、それぞれのキャラクターがソフトになっています。種類はかなりあるから使う場合は自分の好きな声を選んで使うといいですね。
音声はVOICEROIDのページからキャラクターを選択すると試すことができるから試してみるといいです。クオリティはかなり高いです。
Synthesizer V AI
Synthesizer V AIは歌声を作ってくれるソフトなんだけど、このクオリティやばいです。
もう人間が歌っているのと変わらなくないか?と思ってしまうほどのクオリティです。この記事を見ている人は歌じゃなくて単一のテキストを音声として欲しいっていうことだと思うから、使う人は少ないだろうけど歌を歌わせるならこのソフトは最高かもと思ってしまいます。
歌声合成ソフトウェアを探している方はsynthesizer Vのサイトを見てみるといいと思いますよ。
まとめ:音声の読み上げにはどれを使ったらいいのか?
ここまでいろんなものを見てきたけど、ここで思うのが「で、結局どれがいいんだよ?」っていうことですよね。個人的にはブラウザから使えるCoeFontStudioのクオリティが高いなあと感じる。それとVOICEBOXも良い。Text-to-MP3もなかなか悪くなかったね。有料のソフトはやはり有料だけあって悪くない。
MacやWindowsで元から使える読み上げ機能はクオリティ低いし、ダウンロードして使う系のソフトも結構似たり寄ったりで何とも言えないところ。。
一番良いのはやっぱり人間に読んでもらうこと
色んなソフトを紹介したけど結局一番良いのは人間に読んでもらうことですよね。もし動画なんかでクオリティの高い読み上げが欲しいならココナラで人にやってもらうといいと思います。いろんな募集がありますからね。
- フリー声優が声のお仕事承ります
- Youtube動画のナレーション録音します
- ナレーション、読み上げします
- ・・・
音声編集ならAuditionがおすすめ
動画で綺麗な音声を使いたいとかって思うなら音声を編集して、その編集した音声を使うっていう方式を取ると思います。Auditionはその音声編集を良い感じにやってくれるからおすすめです。