有料会員の方のみご利用になれます。保存した記事はスマホやタブレットでもご覧いただけます。

ディープラーニング（深層学習）で画像や音声の認識性能が格段に向上し、コンピューターの「眼の誕生」につながった。従来のコンピューターが苦手としてきた「1歳児レベルの知覚と運動のスキル」を身に付けられるようになった。「子どものAI（人工知能）」はものづくりと相性が良く、日本に勝つチャンスがある。今後、医療などで顕著な進展が予想される。

AIは、様々な技術や製品で使われている。少し整理してみると、大きく4つのレベルに分けられると著者は考えている（図1）。

図1 松尾豊流「人工知能の分類」

現在、中心的な役割を果たしているのが、「レベル4」の深層学習だ。深層学習によって画像認識や音声認識の性能が格段に向上。画像認識では2015年、標準的なデータセットで人間の認識精度を上回るところまできた。2016年には、人間の認識精度を大きく超えた。

1980年代から知られる「モラベックのパラドックス（逆説）」という理論がある。大人ができることよりも子どもができることの方が、コンピューターで実現するのは難しいというもの。知能テストやゲームより1歳児レベルで身に付ける知覚と運動スキルの習得の方がはるかに難しい。多くの研究者がこう指摘してきた。

■運動の習熟もできるように

ところが、その状況が変わってきた。画像認識で人間を上回り、強化学習という学習技術と組み合わせて運動の習熟もできるようになってきた（図2）。米カリフォルニア大学バークレー校は、深層学習と強化学習を組み合わせて、ロボットの動作が熟練していくデモを公開。例えば、おもちゃの部品を組み立てるなどの動作が、試行錯誤によって徐々に上達する。

図2 松尾豊氏が予測する「ディープラーニングをベースとするAIの技術的発展」

こうした一連の技術は認識から運動の習熟へ、そして言語の意味理解へという技術的進展を遂げ、大きな産業的インパクトをもたらす。子どもができることがAIにもできるようになってきたという意味で「子どものAI」と呼ぶ。