2019年03月13日 23時00分 メモ

AIが人間の表情から感情を読み取る「感情検出技術」はなぜ危険視されているのか？

by Dazzle Jam



近年発達してきたAI技術を用いて「コンピューターが人間の表情を読み取って感情を検出する」というアルゴリズムが注目を集めており、治安維持や教育現場などでの利用が見込まれています。しかし、人間の感情について研究している研究者の中には、「AIが人間の表情から感情を読み取る技術の実用化には危険がある」として警鐘を鳴らしている人もいます。



Don’t look now: why you should be worried about machines reading your emotions | Technology | The Guardian

https://www.theguardian.com/technology/2019/mar/06/facial-recognition-software-emotional-science



感情を検出する技術には、画面に映し出された表情を正確に識別するコンピュータープログラムと、表情のパターンから感情を読み取る機械学習アルゴリズムが必要です。機械学習アルゴリズムの訓練には、一般的に教師あり学習が行われます。表情から感情を読み取るアルゴリズムの場合、人間の表情を映した画像に「幸せ」「悲しみ」「怒り」といった感情のラベル付けを行い、多くの表情と感情の組み合わせをアルゴリズムに教え込ませる手法が多いとのこと。



エジプト系アメリカ人の情報工学者であるRana el Kaliouby氏は、表情認識研究の第一人者として知られています。2000年代前半にKaliouby氏はコンピューターに感情を識別させる研究を行い、博士課程在籍時にアスペルガー症候群の子どもの表情から感情を検知するデバイスを作成しました。Kaliouby氏はこのデバイスを、「感情の補聴器」であると述べています。





2009年にAffectivaというスタートアップを設立したKaliouby氏は、自社の感情検出技術を市場調査用の製品として販売し、広告や製品に対するリアルタイムの反応を企業が得られると主張してきました。今やAmazon、Microsoft、IBMといった巨大IT企業も「感情分析」を顔認識技術の一部として宣伝しており、市場調査だけでなくドライバーの状態やビデオゲームのユーザーエクスペリエンス、医療機関における患者の状態分析などに表情から感情を検出する技術が使用されています。



Kaliouby氏は初期の研究段階からコンピューターによる感情検出技術の開発に携わっており、わずか20年ほどで感情検出技術が2000億ドル(約22兆円)規模の産業に発達した様子を目の当たりにしました。今後も感情検出技術の分野は成長を続け、やがてこの技術がどのコンピューターにも当たり前に採用されるようになり、人間のあらゆる感情が瞬間的に検出され、利用されるようになるとKaliouby氏は予測しています。



by Kaique Rocha



Affectivaは87カ国から収集した750万人もの感情データレポジトリを持っているそうで、その多くはテレビを見ていたり、車を運転していたりする人々の表情を写したムービーだとのこと。そのムービーにとらえられた表情を人間が分析し、対応する感情のラベル付けを行い、このデータセットを用いてAffectivaのアルゴリズムが訓練されています。



感情検出技術の分野で広く使われている表情に対する感情のラベル付けは、アメリカの心理学者であるポール・エクマン氏らが提唱したEmotion Facial Action Coding System (EMFACS)というシステムに由来します。エクマン氏らは文化や人種に関係なく、怒り・嫌悪・恐れ・幸福・悲しみ・驚きといった感情が普遍的に存在すると考え、世界中の多様な集団に対して異なる文化を持つ人の画像を見せ、画像の人物がどのような感情を持っているのかを答えてもらいました。その結果、それぞれの集団には大きな文化的違いがあるにも関わらず、別の文化に属する人の感情を読み取れることがわかったとのこと。



その後、エクマン氏は自らの発見にもとづいて表情と感情のマッピングを行い、表情から感情を読み取るシステムは精神医学や犯罪捜査の場で広く使われることとなりました。本当の感情が表情を通じて現れるという考えは広く世の中に浸透し、エクマン氏はアメリカのテレビドラマ「ライ・トゥ・ミー 嘘は真実を語る」に登場する精神行動分析学者カル・ライトマンのモデルにもなっています。





しかし、研究者の中にはエクマン氏の主張する感情検出方法に疑念を持っている人も少なくありません。ノースイースタン大学の心理学者であるリサ・フェルドマン・バレット氏は、エクマン氏が主張する「多くの文化で普遍的な感情がある」という説の根拠となった研究には問題があると指摘。あらかじめ複数の感情ラベルを被験者に渡し、表情から読み取れる感情を複数のラベルの中から選ばせるという実験方法が、結果に影響を与えていると考えました。実際にバレット氏があらかじめ感情ラベルを渡さず、表情の画像から読み取れる感情を自由に記述させたところ、多文化間における表情と感情の共通度は急激に低下したとのこと。



バレット氏は多くの文化の中で共通した反応を引き起こす普遍的感情はないと考えており、表情は個人によってさまざまな違いがある脳と、生まれ育った環境や文化などの要因が組み合わさって現れるものだと主張。表情にもとづいてさまざまな文化や環境の人々の感情を分析することは、意味がないと述べています。



ニューヨーク大学のAI研究者であるMeredith Whittaker氏も、AIによる感情検出技術の実用化には問題があると考えている研究者の一人です。Whittaker氏は古典的な感情マッピングにもとづいて機械学習アルゴリズムを構築することは、社会的な害をもたらすと考えています。「採用活動に顔認識技術と感情検出技術を用いる企業や、教育現場で生徒の集中度合いを測定するために感情検出技術を用いる現場では、正確でない感情分析によって就職活動や学業評価に悪影響が出る可能性があります」と、Whittaker氏は懸念しています。



by Rebecca Zaal



Kaliouby氏もAIによる感情検出技術を危険視するこれらの意見について、よく認識していると述べています。Affectivaでは静止画像ではなくムービーを用いた感情のラベル付けを行うことで、文脈にもとづいた感情の判断を行っているほか、数多くの国々からさまざまな人種の人々についてデータを収集するのも、データの偏りを防ぐために重要だと主張します。「私たちは白人・アジア人・黒い肌の人・ヒジャブを身につけている人など、多様なデータを必要としています」とKaliouby氏は語りました。



実際にAffectivaがさまざまな国や民族のデータセットを分析する中で、異なる国では感情表現も異なることを発見しているとのこと。たとえばブラジル人は笑顔によって幸福を現しますが、日本人は幸福を表すための笑顔だけでなく、「礼儀正しいこと」を現すために笑顔を浮かべるパターンもあるとKaliouby氏は指摘しています。このような文化的差異をアルゴリズムに組み込むため、Affectivaでは別のレイヤーで表情の民族的違いも訓練しているそうですが、民族の違いを識別することは人種的差別につながりかねません。



こういった懸念に対し、Kaliouby氏は今のところ感情検出アルゴリズムで人種分類を行っていないと述べており、現時点では「ブラジルで撮影されたデータ」「日本で撮影されたデータ」といった地理的違いをもとに、データセットを分類しているとのこと。しかし、もしもブラジルで撮影されたデータに日本人が写っていた場合、それはブラジル人のデータであると分類され、「礼儀正しい笑顔」を認識できない可能性があります。この点についてKaliouby氏は、「現時点では、私たちのテクノロジーは100％完璧だとはいえません」と答えました。



by rawpixel.com

