【無料】音声読み上げ・合成ソフト/サイトを12種検討!おすすめはどれなのか?

今や技術も進歩して結構色んな音声合成のサービスも出てきていますよね。そこで今回は無料でどんな音声合成の力を使うことができるのかっていうのを見ていきたいと思う。簡単に使えるものからAPIとして使えるものまで見ていくから音声合成のソフトやサービス使って何かしたい!っていう場合には参考にしてほしい。

ちなみにこの記事ではスマホアプリの読み上げアプリっていうのは書くのはやめておこうと思う。アプリまで書くと量が膨大になってしまうから別の記事で。。。

まあやっていこう。ソフトを使っていろんな音声を作ってみるから、それを聞きながらどんな感じの音声を作ることができるのか参考にしてみてください。

Mac・Windowsの音声読み上げ機能を使う

なかなかMacやWindowsで最初から使える音声読み上げ機能を使うことはないだろうけど、メモなんかにテキストを入力してそれを読み上げてもらうことができる。

Macの音声読み上げ

Macでメモ帳を開いたら何かテキストを書いて音声読み上げをしてみよう。[編集→スピーチ→読み上げを開始]するとそのテキストを読み上げてくれる。

これで読み上げた音声を聞いてみるとやっぱり機械的な音声ですね。まあ標準で備わっている読み上げだとこんなもんかというところ。Windowsでも試してみよう。

Windowsの音声読み上げ

Windowsでもメモ帳に書いたものを読み上げてみる。使ったことのある人は少ないだろうけど、Windowsにはナレーターっていうテキストを音声で読み上げてくれる機能がある。Windows ロゴ キー を押しながら、Ctrl キーと Enter キーを押すと起動/停止を行える。ちょっと使いづらいけど、それでこのテキストを読み上げてみるとこんな感じ。

 

まあやっぱり機械的な音声だ、予想通りといったところ。ちなみにナレーターは画面を操作するといろんな自分が行っていることを音声で説明してくれるよ。気になったらMicrosoftのナレーターでテキストを読み上げるを見てみるといいかもしれない。

Webでブラウザから使える音声読み上げサービス

ブラウザでアクセスしてすぐに使うことのできるサービスっていうのもありますよね。わざわざソフトをダウンロードする必要がないから楽で良い。ここでは3つ紹介していくよ。

Text-to-MP3

Text-to-MP3は日本語に限らず(というよりほかの言語がメインだろう)いろんな言語を入力して音声読み上げしてくれるサイト。

言語の種類がたくさんありますね。桃太郎をここでも入力して読み上げてみるとこんな感じ。

結構良くないですかね。音声のスピードなんかは変えることができないの?って思うけど、これはタグをテキストと一緒に書くことで変更することができる。いろいろ英語で書かれていますね。最後の方にAmazon Pollyって書かれているからAmazon Pollyが使われているのかもしれない。Amazon Pollyは後で紹介するね。

ちょっとだけタグを追加してみて音声を作ってみるとこうなる。

<prosody rate="fast"><prosody pitch="high">
むかしむかし、あるところに、おじいさんとおばあさんが住んでいました。おじいさんは山へしばかりに、おばあさんは川へせんたくに行きました。おばあさんが川でせんたくをしていると、ドンブラコ、ドンブラコと、大きな桃が流れてきました。
</prosody></prosody> 

スピードとピッチをちょっといじってみたけど、悪くないですね。ちなみにInput limit: 3,000 charactersって書かれているから3000文字までのテキストなら読み上げてくれるようだね。

七声ニーナ

ちょっとテキスト入力とは違うけど、こういうのも紹介しておきます。七声ニーナはマイクに自分の声を発すると、それを七声ニーナの声に変換してくれるというもの。七声ニーナって誰だよって感じだけど、こんな感じのキャラクターだ。

音声を返還してもらうには、サイトを開いてRECボタンを押して喋ればいいだけです。そうすれば声を変換してくれる。

結構面白いからサイトから喋ってみてもいいかもしれないぞ。

CoeFontStudio

CoeFontStudioはリリースされてからちょっと流行った気もするから知っている人もいるかもしれない。クオリティが結構高くてデザインもわかりやすい。生成された音声を聞いてみてもその精度の高さを感じるのではないだろうか。

アクセントが気に入らなかったら、それを軽く修正することもできる。

CoeFontStudio結構おすすめです。

ソフトをダウンロードして使える音声読み上げ

次はソフトをダウンロードして使うことのできる音声を読み上げてくれるやつ。ちょっとダウンロードするのは面倒だけど、日常的に使うならこういうソフトを使うのもありでしょう。ただWindows対応のみのものばかり。Macユーザーは諦めるしかないのか・・・

棒読みちゃん

棒読みちゃんは404FightNotFoundからダウンロードすることのできる。動作環境は以下のよう。

  • Microsoft Windows 2000以上(7の64bit版のみ確認)
  • Microsoft .NET Framework 2.0以上(3.5のみ確認)

今回はWindowsパソコンでダウンロードして試してみる。ダウンロードしてアプリケーションを開いたらこんな感じ。テキストを入力して読み上げるんだけど、音量や速度なんかも調整できるね。

音声ファイルはボタンを押すことで保存することもできるのがいいね。

桃太郎を入力してやってみたけど、こんな感じの音声になった。

これは女性の音声でやったけど、声質も選ぶことができますね。女性・男性・中性・ロボット・機械っていうのがある。

ちなみに機械1で試してみるとこんな感じだね。

それと棒読みちゃんとコメントビューアーを組み合わせてコメントを読み上げる配信者の方なんかもいるでしょうか。外部サイトですが、ツイキャスやYoutubeLiveなどコメントを読ませる方法が書いてあったりするので、そういうのをしたい方は参考にしてみてもいいかもしれない。

棒読みちゃんの使い方・設定方法

テキストーク

テキストークはその名の通りテキストを読み上げてくれるソフト。動作OSが記事執筆時点でWindows 10/8/7/VistaということでWindowsユーザーなら大体使えるでしょう。テキストークからダウンロードすることができるよ。アプリケーションを開いてみるとこんな感じでシンプルでわかりやすい。

今回も桃太郎で試してみるとこんな感じですね。

声質はいくつかあって男性・女性を選ぶことができる。英語の人の声もあるようですね。

Microsoft Haruka Desktopで試しにやってみるとこんな感じ。

まずまずといったところですかね。使い方が簡単で使いやすいのがテキストーくの良いところですね。気になったら他の声質も試してみてください。

ソフトーク

ソフトークはフリーソフト100からダウンロードすることができる。ほかのソフトと同じように読み上げてほしいテキストを入力して再生することができる。赤いボタンで保存することができるんだけど、ボタンを押すとテキストを読み上げて保存してくれる。

テキストを入力して読み上げてもらうとこんな感じ。

ソフトークは声質の他にプリセットなんかも用意してくれていますね。声の種類もたくさんあるのがソフトークの良いところ。用意されている声は他のソフトと比べると多い方なんじゃないかな。

プリセットを初期設定からロボットとかに変更してみるとこんな感じに。

悪くないですね。プリセットも声の種類もたくさんあるから、いろいろ試してみるといいですね。

Balabolka

Balabolkaは何やらボタンがいっぱいあって機能が多そうな感じがしますね。結構ボタンがあるから、多機能なものが良いっていう人には良さそう。スピード・音量・声質なんかは他のソフトと同じように変更することができますね。ピッチを変えることで声の感じが変わったりするから変更できるのは良いね。

ただ初期で選べる声はちょっと少ないですね。

ちなみに桃太郎の音声を作ってみるとこんな感じになった。

ちょっとBalabolka機能が多そうなので、使ってみたい!っていう人はBalabolkaの評価・使い方 - フリーソフト100を見てみるといいと思います。どんな使い方をすることができるのかがざっと分かるんじゃないかな。このソフトはピッチを変えることができるのがいいですね。これを変えると読み上げる感じが変わっていくから声をちょっと変えたいなあ・・・なんて時にはいじってみるといいです。

Text To Wav

Text To Wavを開いてみるとこんな画面。どうやらこのソフトも結構機能があるようですね。[自動で音声を切りける][二つの音声エンジンを使って変換][SAP]とかいろいろあるけど、ぶっちゃけ分かりません。きっと音声に詳しい人ならわかるのでしょう。何となくいろいろできそうなのは分かる。

普通に入力した音声を読み上げて保存してみるとこんな感じの音声。

ちなみに保存のやり方最初ちょっとわかんなかったけど、左端にあるファイルっていうところから保存先なんかを変更することができる。

赤いボタンを押すと保存できるけど、保存したら保存先にファイルができるはず。選択できる音声はいくつかって、速度や音量の調整が可能。

音声1と音声2があるのは、対話形式で会話させたりっていうことができるのかな。うーん使い方難しそうですね。いろいろやりたい人にはいいのかもしれない。Text To Wav ☆の詳細情報 : Vector ソフトを探す!からダウンロードすることが可能。

APIから使える音声読み上げサービス

ダウンロードしたソフトやWebから使えるテキスト読み上げのものもあるけど、APIとして使ったりっていうことも場合によってはありますよね。そんな時にはGoogleのGCPにあるText-to-SpeechやAmazonのAWSにあるAmazonPollyなんかを使ってみるのはどうだろう。(タイトルに無料とか書いたけど、GCPとかAWSは従量制だよね、まあ許してくれ・・・)

Text-To-Speech

まあテキストを読み上げてくれるものなんだけど、どんなものかを知りたい場合はGCPのText-to-Speechにデモがあるからそこで読み上げてほしいテキストを入力して試してみるといいかと思います。

 

ちなみにほかの記事で音声を軽く作ってみたりしたから、ちょっとした使い方が知りたかったら見てみると参考になるかもしれない。

↑で軽くやってみた音声はこんな感じ。まあまあといったところですかね。

それと料金に関してだけど、料金を詳しくは覗いてみるといいでしょう。そこまでかからない印象。

Text-to-Speech の料金は、音声への合成のためにサービスに送信された文字数に基づいて、月単位で請求されます。WaveNet 音声の最初の 100 万文字は、毎月無料です。標準(WaveNet 以外の)音声では、最初の 400 万文字が毎月無料です。Text-to-Speech は無料枠以降 100 万文字ごとに課金されます。

Amazon Polly

GCPときたら次はAmazonのAWSですよね。AWSのアカウントでログインすればテキストを入力して音声を読み上げさせることができる。

Amazon Pollyを使って音声を作成するっていうことはこっちの記事で書いたんだけど、その時作った音声がこんな感じ。

まあ悪くないかなといったところ。ちなみにText-To-SpeechとAmazon Pollyでテキストを作成するっていう動画もあったりするから、何となくその使い方と精度が分かるんじゃないだろうか。動画内ではアプリのコエステーションについてもあるよ。

結局どれを使ったらいいのか

ここまでいろんなものを見てきたけど、ここで思うのが「で、結局どれがいいんだよ?」っていうことですよね。個人的にはブラウザから使えるCoeFontStudioのクオリティが高いなあと感じる。Text-to-MP3もなかなか悪くなかったね。MacやWindowsで元から使える読み上げ機能はクオリティ低いし、ダウンロードして使う系のソフトも結構似たり寄ったりで何とも言えない。。

AmazonPollyやText-To-Speechは使うのが大変だけど、ガチで使うならあり。ただアプリやサービスの開発者向けのものだよなあ。

 

 

おすすめの記事