米マサチューセッツ工科大学(MIT)は4日(米国時間)、無発声音声認識を実現するウェアラブルシステム「AlterEgo」を発表した。

システムは、耳から顎にかけて装着するウェアラブルデバイスと、コンピューティングシステムの組み合わせで構成されており、デバイス内の電極で顎や顔の神経筋信号を検出することで音声認識を行なっている。

人間が言葉を思い浮かべて、実際に発声せずに“脳内で”しゃべる「Subvocalization」を行なうさい、外部から観察しても変化は見て取れないが、筋肉に対して微弱な信号が送られており、デバイスはこの信号を検出しているという。

検出された信号は、特定の信号と単語との相関関係を学習させたニューラルネットワークを介して、単語に変換される。デバイスは電極のほか、骨伝導ヘッドフォンを内蔵しており、周囲の音を遮断することなくシステムと会話ができる。

映像を見ると、傍目からは何かを喋っているようには見えないが、システムは正確に言葉を認識して応答しているのがわかる。

プロトタイプのウェアラブルデバイスを使い、10人の被験者を対象に、個人に応じたカスタマイズを約15分間実施し、その後演算を90分間おこなった上で行なわれた実験では、約92%の平均認識精度を記録したという。

AlterEgoの開発を率いたMIT Media Lab大学院生のArnav Kapur氏は、認識精度はより多くの訓練データを収集できれば、さらに改善されるとの見解を示している。

ジョージア工科大学のThad Starner教授はリリースで、発声に関する障碍を持った人々のアシストのほか、空港や印刷業など騒音環境下での会話、戦闘機パイロットや消防隊員のような保護マスクを利用している場合などでも有用であるとしている。