Google傘下のDeepMindは、性能に優劣のあるAI同士を2種類のゲームで競わせ、AI同士で協調するか、または競争するかを観測する実験を行なったと発表した。

DeepMindは、将来さらにAIを活用するようになったときに、「囚人のジレンマ」のように、一方が片方を陥れることで多大な利益を得ることができるが、双方が利益を求めることで、双方とも不利益を被る状況におけるAI同士の行動を観察すべく2種類のゲームを使った実験を行なった。

1つ目のゲームは「Gathering」と呼ばれるもので、プレーヤーは中央にあるリンゴを集めることで得点できる。また、相手にレーザーを撃つことで一時的に相手を画面外に除外することもできる。

このような状況下でAI同士を競わせた結果、最初のリンゴがある内は互いに争うことはなかったが、なくなってきたと同時に互いを撃ち合い始めた。また、回を重ねる毎に、性能の優れている方のAIはリンゴがあるにも関わらず、相手を撃つ回数が多くなった。

もう1つの「Wolfpack」と呼ばれるゲームは、AI同士でターゲットを追い込むゲームである。このゲームでは、Gatheringとは異なり、性能が優れている方のAIの方が協調性を見せる場面が多かった。

これらゲームの実験を何千回と繰り返し、深層強化学習によるAIの行動を観測した結果、ゲームの性質によりAIが競争をするか協調をするかが変わるという結論に至った。つまり、将来的に経済や交通など複雑なマルチエージェントシステムのようなAIを活用するにあたって、AIを操るルール作りが重要であると結論付けた。