AIがヒューマンビートボックスを生成してくれる時代

AIを語ったサービスなんて今や当たり前のようにあったりするけど、どうやらヒューマンビートボックスを生成してくれるAIなんていうものがあるらしい。なんかAIがうんたら。。。っていうサービスいろいろありすぎてもはやよく分からないよね。ちなみに自分が今まで見た中で凄いけど怖いなあ・・・って思ったのが「コエステーション」っていうアプリ。自分の声をアプリに学習させていくとどんどん自分の声で入力したテキストを喋ってくれるようになる。

学習させる時間はかかるけど、自分の声で他の人が何かできてしまいそうで恐怖を感じたよ。後動画編集のテロップを自動でやってくれるやつは便利だよね。

音声認識してテロップ入れてくれるのはありがたい。動画編集のテロップ入れかなり面倒ですからね。技術の精度はどんどん上がっていくから今後はどうなるんだろうね。まあ、今回見たいのはヒューマンビートボックスなんだよ。Neural Beatboxっていうサービスで日常的な音から良い感じのビートボックスを作ってくれるらしい。

Neural Beatboxとは

Neural Beatbox

Neural Beatboxっていうのがそのサイトなんだけど、サイトから適当に音を録音してやるとBeeaboxにしてくれる。動画を見るとどんな感じ使えばいいのかがきっとわかる。

音って何をやればいいんだよ?って感じだけど、これは手を叩いたりだけでOK。

作ったビートボックスは共有することができて、URLをシェアするとオンラインでそのビートボックスに音を追加することもできるという。

使ってみたけど、パソコンがあるだけで簡単に作ってくれるのは凄いですね。適当に手を叩いたりしただけでちょっとそれっぽくなるから面白い。

どう作られているのか?

どのように音が作られるのかはプロジェクトページにちょこっと紹介されていますね。

Neural Beatbox」は、ユーザーが収録した身近な音から、AIがリズムを生成することによって、人間とAIの共創がもたらす新しいインスピレーションの可能性を考察するプロジェクトです。 この作品では、ユーザーが収録した声やノイズ、拍手などの音をAIが各セグメントに分類し、キックやスネアといったドラムパートに割り当て、新しいリズムを継続的に生成していきます。リズム生成の過程で、AIが犯す適度な「まちがい」が、独特の音楽体験に繋がり、人間の創造的な表現を豊かにしていくインスピレーションを与えます。

ぶっちゃけ何いっているか分からないですね。どうサウンドを分類するかはこんな風に書かれています。

Webクライアント上でユーザーが録音・録画した声やノイズのデータを受信し、それらを意味のあるセグメントに分割。ドラムの音色で学習したニューラルネットワークの分類器を用い、キックやスネアといったドラムのパートに割り当てています。

録音した音をニューラルネットワークを通して色々やってくれているようですね。MIDIのリズムパターンのデータセットを学習って書かれているんだけど、なんだこれ。リズムパターンのデータなんていうものが世の中にはあるようですね、なるほど。技術的に知りたい人は色々みてみるといいかもしれない。

まとめ

使ってみると分かるけど、適当に音を録音するだけで勝手にビートボックスっぽくしてくれるのは凄いですね。何より簡単。こうやってどんどんAIでいろんなことが簡単にできるようになってしまうんだろうなあ・・・

コエステーションで声を作れるようになった、Vrewで動画編集のテロップを自動で作ることができるようになった。Neural Beatboxでビートボックスを作ることができるようになった。あー、次は何がAIでできるようになるんですかねえ。

Twitterでフォローしよう

おすすめの記事