

いいロボットボイスをきいていると、あとでまたすぐ何かいいのがきいてみたくなりますね。それに、ふしぎなくらい時間がはやくたっていって、日曜の午後など、おや、もう夕方になってしまったのかと思うことが、よくあるのではないでしょうか。

というのは嘘。（JJおじさんごめんなさい）ひとくちにロボットボイスといっても、種類はいろいろ。テクノポップでおなじみのヴォコーダー、西海岸系でおなじみのトーキングボックス（トーキング・モジュレーター）、近年のポップスで多用されまくっているオートチューンによるピッチ補正、Text To Speechに代表される音声合成による人工的な音声などなど...今回はYouTubeの映像を見ながら、こういった様々なロボットボイスの勉強をしてみましょう。

※なんつって適当な知識なので間違ってる部分も結構ありそう。やさしくツッコミいれていただけるとよろこびますワン！（犬）

■Vocoder

シンセサイザーで生成した音と、人間の声を合成するのがヴォコーダー（VOCODER）。テクノロジーについてつっこんだ話をすると難しくなりがちだけれど、ヴォコーダーについてはとても面白い原理でなので、簡単に説明します。

実際にしゃべる時、僕たちの身体の中で何がおこっているかというと、まず声帯をふるわせることによって、ある周波数の「音」が発生する。そして、その「音」を口の中で複雑に歪ませる事によって、人が理解することができる「言葉」に変換しているというわけ。声帯というのが周波数発生装置、口というのがフィルターの役目をしているといってもいいかもしれない。（実際は喉の管の物理的な特性やら様々な要素が絡み合っているのですが、簡単に端折るとこういうことになる...と思う）

ヴォコーダーというのは、いわば声帯をシンセサイザーに置き換えてしまうという技術で、シンセサイザーによって発生させた音階と、マイクで入力した人間の音声の倍音構成（スペクトル）を機械的に合成することによって、言葉に音階をつけています。

ヴォコーダーによって合成された音は、こんな感じ。



ディスコ神Giorgio Morder御大によるヴォコーダーの解説映像（貴重！）



Kraftwerk "We are the robots"。ヴォコーダーで歌ってます。ビデオも鼻血が出るくらいカッコイイ。ヴォコーダーがあると、ついコレをやってしまう人も多いのでは。



Yellow Magic Orchestra "Technopolis" ヴォコーダーといえば「トキオゥ」。ヴォコーダーがあると、ついコレをやってしま（以下略



■Talk Box / Talking Modulator

簡単に説明すると、口にくわえたチューブの先端から楽器の音を出し、口の形をかえることによって音をゆがめ、それをマイクで拾う、というもの。

さっき声帯というのが周波数発生装置、口というのがフィルターの役目をしていると書いたけれども、トークボックスでは複雑なフィルターをかけることができる人間の口をエフェクターとして利用しているわけです。音を機械的に合成しているヴォコーダーに比べて、かなり生っぽい粘り気のある質感になるのが特徴。ただこれ、頭蓋骨が共鳴するので、脳にものすごく負担がかかるらしいので注意。やりすぎると吐血するとか（！！）

これは映像をみたほうが早いと思う。



トークボックスの名手、故Roger Troutmanのアドリブ演奏。その昔、やっぱり故人だけど、2pacのCalifornia Loveというヒット曲があったけど、あのサビの部分をやっていた人がこの人。トークボックスのやり過ぎが原因ではなくて、実の兄に射殺されちゃったというのは皮肉な話。



で、そのRoger Troutmanに影響を与えたStevie Wonderのトークボックスによる"Close To You"。文句なしに格好いい。トークボックスやヴォコーダーが面白いのは、例えばこんな感じで普通の人がやっても、同じ音が出せるという事。ソースになる音源さえ同じならコツをつかめば同じ声で歌うことができる。これは声帯という個々人の特徴をシンセに置き換えるという技術ならではの面白さ。（ちなみにRoger Torautmanがよく使っていたのはYamahaのDX-100だとか）

ちなみにDaftPunkのOne more timeやHarder, Better, Faster, Strongerはヴォコーダーらしいけど、かなりトークボックスっぽいテイストになっている。その筋では有名なエフェクターDigiTech Talkerと後述のAutoTuneの合わせ技という噂。



■Auto-Tune

Auto-Tune、知る人ぞ知る、今巷に溢れている楽曲ほとんどで使われてるんじゃねえのってぐらい大流行のテクノロジー。一言でいうと「外した音を無理やり修正するソフト」。この技術の登場によって、ヘタな人でもそれなりに聞こえるし、歌唱力の限界をこえた曲もつくれるようになるという、可愛くても歌はピンとこないのーという悩みがアイドル産業からフッ飛んでしまうぐらいの破壊力をもったソフトウェア。これで写真をレタッチするように、声もレタッチできるようになったわけです。やったね！

元々はちょっとハズれたところを補正するための技術だったのだけど、補正する度合いを強くするといい感じのロボっぽさになるということで、ヴォコーダー的に使われる事が多いみたい。



Perfume "Computer City"



Perfume "Twinkle Snow Powdery Snow"



Genki Rockets "Heavenly Star"



■音声合成

上記でとりあげたヴォコーダー、トークボックス、Auto-Tuneのような人間の声に操作を加えて整える、というものとは異なり、最初からコンピュータにしゃべらせちゃいましょうというアイデア。Text To Speech(TTS)、スピーチシンセサイザーとも呼ばれる。音声の合成方法は、実際の人の声をバラバラにして、その断片をつなぎあわせて言葉にしていく連結的合成（シンセでいうとPCM音源みたいなもんですかね）とか、ゼロから声を生成するフォルマント合成とか、手法はいろいろあるのだけど、詳しくはWikipediaを参照。英語版にはOS別のTTSについて詳しく説明してあって面白い。（ちなみにWipeoutXLのアイテムととった時の声はAmigaOSのTTSを使ってるらしいよ）

WindowsやMacにもバリアフリーの一環として音声合成システムが実装されていて、それを使用して曲をつくる人たちがでてきた。TTSに音階をつける方法はいろいろあるけど、見渡したところVocalWriterというソフトが使いやすかった。他にもTTSを使用せずに独自で音階のついた音声を合成するソフトはあって、YamahaのVocaloid、CryptonのCANTOR、NTT-ATのワンダーホルンなど、合成音声で歌わせるソフトがいろいろでてきているみたい。



名曲。竹村延和 "sign"。TTSが歌う。



Cylob "Rewind" TTSで読み上げた文章をうまくチョップしてラップにしてる。

（ラップって基本的に抑揚が無いから、TTSとの組み合わせが向いてる気がする。連携的合成のロジックと１小節に何センテンス入るかっていうパターン表をつくって音声合成によるラップエンジンをつくりたいなと目論んでいるんだけど、開発してくれる人大募集！w。kizashiでひっぱってきたブログの断片をラップし続ける、MC JAYPEE レペゼン .JPっていうアホコンテンツをつくりたいんですよねー）

あとはHrvatskiの"Vatstep DSP"とか、テイトウワのChatr使ったやつとか探したけどなかった...



というわけでロボ声といってもいろいろ種類があるんですよーというだけのお話でしたw

このへんかじりつつ聴くといろいろ面白いかも...とか書いてたらbounce.comにドンピシャのレコメンリスト発見！！！！

bounce.com : ロボ音楽

ロボ音楽って！？何！？何それ？！えっ！？！わ〜い！！イェ〜イ！！とかとか、、、日常に潜む、ロボ！？音楽のいろいろ！？あれこれをセレクトしてみました。 幅広〜いロボット音楽を少しでも知っていただければと思い、そしてここから皆様の楽ちい楽ちいロボット音楽ライフ！？（どんなだ！？）がちろっとでも広がっていく事を心から願っております。無駄なきっかけ作りのお手伝いとなれば幸いでございます。さてさて、、、それでは、はりきってまいりましょう！！！ピコピコ！ガーガー！ギュイーン！ピー！ウィーン！ガシャン！ガシャン！！！

うわーい！ドモアリガットミスターロボット!!!!



---

余談だけど、早稲田の高西研究室というところが声帯と口の動きを物理的にシミュレートして声を生成するTalking Robotというのをつくっていてスゴイ。今回のヴォコーダーやトークボックスの話を見てから見るとオオッ！と思うかも！