あまりにも面白い内容だったので、その後、小岩井さんとオンライン会議やメッセージのやりとりを重ねつつ、対象アプリを増やしたり、実験内容を追加するなどしていった結果、かなり有意義なデータをとることができた。データ量も多くなったので、今回と次回の2回に分けて、その内容を紹介していきたい。

「今、リモート会議アプリの音質比較実験をしているのだけど、かなり違いがハッキリ見えて面白い!」とホワイトノイズをスペクトラム解析したグラフが送られてきたのである。そんなマニアックな実験をする声優なんて、世界中探しても小岩井さんくらいしかいないと思うが、まさにみんなが気になっていることを、客観的にデータ化していたのだ。

筆者も最近の打ち合わせや取材は、ほぼオンライン会議となっているが、使うシステムや環境によって、結構、音に違いがあるのが気になっていた。どれを、どのように使うのがいいのだろう……と考えていたところ、声優の小岩井ことりさんから思いがけない連絡が入ったのだ。

新型コロナウィルスによる影響で外出や、人と接することが制限されるなか、ZoomやTeams、Hangout……といったオンライン会議アプリを使って会議を行なうケースが増えている。

ぜひ小岩井さんの言葉で、この実験結果の考察を聴いてほしいのだが、どのように実験したのかなど、細かなところまでは番組内で紹介しきれないようなので、相乗りさせていただく形で、今回、記事にさせてもらった、というわけだ。

小岩井さんの場合、生放送ではなく、収録した上での放送だが、ゲストに入ってもらうとなると、やはりオンライン会議アプリを使うのが現実的。また「ことりの音」はニコニコ生放送を使ってはいるものの、基本的に音声を中心としたラジオ番組としていることもあり、より音質が重要。そのため、自ら実験を行なっていたのだ。

まさに、そんなことをしていた14日の夕方、小岩井ことりさんから、唐突にスペクトラム解析結果が送られてきたのだ。

アプリの性能差を検証すべく自宅LAN環境で実験

すでにオンライン会議を行なっている人であれば、ご存知の通り、さまざまな要因で音質や画質は大きく変わってくる。単純に、このアプリがいい、こちらのはダメ……というようなものではない。

当然のことながら通信環境に大きく左右されるので、回線状態が悪いと音が途切れ途切れになるなど、音質どころではなくなる。またノートパソコンの内蔵マイクなどで話をすると音質はよくないし、オーディオインターフェイス経由でコンデンサマイクに接続した音だと、非常にクリアな音になってくる。

しかし、そうしたさまざまな要素が混在すると、まともな比較ができないので、ここではすべて理想的な環境にあることを前提に、アプリによる性能の違いだけを浮き彫りにしようというのが小岩井さんのアプローチだ。

理想的な環境とはどういうことか。まず通信回線は公衆回線を使うのではなく、自宅LAN環境内での実験にするということ。送信側はWi-Fi接続されたWindowsのノートPCを使い、受信側は有線LAN接続されたデスクトップPCを使うというもの。

デスクトップPCもWindowsマシンであり、Cubaseがインストールされている小岩井さんの業務用のレコーディングマシンである。比較においては再現性が重要になるので、直接マイクで音を送信するのではなく、予め用意したオーディオデータを再生して送信する形をとっている。実は最初に連絡をくれた時点では、送信側PCと受信側PCが逆になっていて、やや解析しにくい状況にあったため、試行錯誤の結果、この形にしている。

ちなみに、簡単なようで意外と難しいのは、用意したオーディオデータをどのようにリモート会議アプリで送信するか、という点だ。

比較的扱いやすいのはオーディオインターフェイスのループバック機能を使う方法で、Windows Media Playerなどのプレイヤーソフトで再生した音をオーディオインターフェイスに送り、そのオーディオインターフェイス内でループバックして戻ってきた音をリモート会議アプリの入力に持ってくるという方法。

ただ、そのノートPCに接続するためのループバック機能を備えたオーディオインターフェイスが手元にないということで、バーチャルドライバを使っているというのだ。まただいぶマニアックな方法を使っていたのだが、聞いたところVB-Audio SoftwareというメーカーのVoiceMeeter Bananaなるドネーションウェアを利用しているのだとか。

【お詫びと訂正】記事初出時、VoiceMeeter Bananaをフリーウェアと記載しておりましたが誤りでした。正しくはドネーションウェアになります。お詫びして訂正します。(4月20日14時)

まったく知らないソフトだったが、こちらでも入手して試してみると、非常に柔軟性の高いバーチャルドライバだった。

現在接続されているオーディオインターフェイスとサウンド機能について、WDM、カーネルストリーミング、MME、ASIOのそれぞれのドライバ間でマトリックス接続して信号をパッチングできるというものなのだ。小岩井さんいわく、VoiceMeeter Banana自体もプレイヤー機能を持っているけれど、ちょっと使いにくかった、とのこと。

そこで再生用にCubaseからASIO出力を……と思ったら、オーディオインターフェイスのない環境でのCubaseとVoiceMeeter Bananaが相性が悪く、手っ取り早いWindows Media Playerを使ったのだという。

「そのため、カーネルミキサー(正式名称：オーディオエンジン)を通っちゃうので、ビットパーフェクトは実現できません、ごめんなさい(笑)」と話していたが、そもそもそんなに大きいレベルの音を突っ込まなければまったく問題のない話。実際、音圧は小さめであり、トルゥーピークがｰ1.3dBになるように用意したとのことなので、データとしても完璧なようだ。

実は最初に連絡をくれたときは単純にホワイトノイズだけを通した結果だったのだが、もう少し多角的に評価できるように、小岩井さんの声も含めたオリジナル音の素材を44.1kHz/16bitのステレオデータで用意してくれた。それがこちら。

ご覧いただくと分かる通り、小岩井さんのアナウンスの元、ホワイトノイズ、ピンクノイズ、ブラウニアンノイズの3つの音を流すサンプルとなっている。恥ずかしながら筆者はブラウニアンノイズなるものを初めて知ったのだが、ピンクノイズに近いけれど、ピンクノイズ以上に高域が減衰する柔らかいノイズで、エアコンなど環境ノイズに近いもののようだ。

またこの音をスペクトラム解析しているが、これに使っているのはCubaseにプラグインとして挿した解析ソフトで、Plugin-AllianceのADPTR MetricABというもの。以前、小岩井さんから「人の声を真似するのに、スペアナで自分の声をチェックしながら近づけていく」という話を聞いたことがあったが、まさに普段からスペアナを使っているからこそ、こういう実験をサクっとやってしまうのにも納得したところだ。

受信側のデスクトップPCについて、もう少し詳しく解説すると、これにはRMEのFireface UFXが接続されているが、各アプリのオーディオ出力をFireface UFXのAESのチャンネルに設定。その上で、RMEのTotalMix FXというユーティリティを使ってAESチャンネルで受けた信号をHardware Outputsにアサインしてループバック。これをCubaseの入力に使ったうえで、プラグインとして設定しておいたADPTR MetricABに表示させるのだ。図にすると下記の通りとなる。

なお、下図のLAN環境はインターネットにも接続されており、オンライン会議アプリによってはインターネットを経由する場合がある。

【追記】テスト環境について、インターネットに接続している事を追記しました。(5月11日21時)